【python因果推断库6】使用 pymc 模型的工具变量建模 (IV)1

目录

使用 pymc 模型的工具变量建模 (IV)


使用 pymc 模型的工具变量建模 (IV)

这份笔记展示了一个使用工具变量模型(Instrumental Variable, IV)的例子。我们将会遵循 Acemoglu, Johnson 和 Robinson (2001) 的一个案例研究,该研究尝试解开强大的政治机构对于以国内生产总值(GDP)衡量的经济生产力的影响。本示例借鉴了Hansen的《计量经济学》以及Acemoglu等人关于“殖民主义起源、繁荣及持久影响”的讨论。

import arviz as az
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from matplotlib.lines import Line2D
from sklearn.linear_model import LinearRegression as sk_lin_regimport causalpy as cp
from causalpy.pymc_experiments import InstrumentalVariable
from causalpy.pymc_models import InstrumentalVariableRegression
%load_ext autoreload
%autoreload 2
%config InlineBackend.figure_format = 'retina'
seed = 42
np.random.seed(seed)

这项工作的目的是考察各个被殖民国家在以对数GDP形式的不同结果,作为政治制度稳健性的一种度量函数,这里的稳健性度量为:风险。这个变量是对抗财产剥夺的法律保护程度的评分。评分越高,表示可用的法律保护越多。在实验情境中,你可能会期待处理变量是二元的,但在这里它是连续的,就像剂量一样。想法是法律和政治制度结构具有长期的好处,因为各个殖民地在不同的殖民力量下受到不同的对待(具有不同程度的制度发展),所以论点是我们有可能利用这类数据来估计政治制度对GDP的影响。

用一张图来表示:

在这里,协变量包含一个处理变量(risk),它通过未测量的历史(unmeasured history)这一中介值与结果(log-gdp)相关联,违反了OLS假设中的独立性。想法是通过引入我们的工具变量logmort0来恢复无偏的处理效应,该变量假设只通过其对(risk)的影响与(unmeasured history)相关。

这种相对简单的图在政策采纳的情境中相当常见,其中我们关心的是某个处理/政策()对人口的影响,其中()是一些影响采纳的度量。在医学情境中,第一阶段()被称为“意向治疗”回归。由于这种与政策实施的关系,工具变量回归在行业中往往非常有用。

我们现在将具体展示如何在 CausalPy 中估计这类回归,以便在这种由DAG特征化的情境中恢复准确的参数。

N = 100
e1 = np.random.normal(0, 3, N)
e2 = np.random.normal(0, 1, N)
Z = np.random.uniform(0, 1, N)
## Ensure the endogeneity of the the treatment variable
X = -1 + 4 * Z + e2 + 2 * e1
y = 2 + 3 * X + 3 * e1test_data = pd.DataFrame({"y": y, "X": X, "Z": Z})sample_kwargs = {"tune": 1000,"draws": 2000,"chains": 4,"cores": 4,"target_accept": 0.99,
}
instruments_formula = "X  ~ 1 + Z"
formula = "y ~  1 + X"
instruments_data = test_data[["X", "Z"]]
data = test_data[["y", "X"]]
iv = InstrumentalVariable(instruments_data=instruments_data,data=data,instruments_formula=instruments_formula,formula=formula,model=InstrumentalVariableRegression(sample_kwargs=sample_kwargs),
)
az.summary(iv.model.idata, var_names=["beta_t", "beta_z"])[["mean", "sd", "hdi_3%", "hdi_97%", "r_hat"]
]

我们可以看到,beta_z 参数针对 X 变量接近真实值 3。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1524083.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

大屏可视化:阿里 DataV 大屏怎么做自适应的?

你好,我是沐爸,欢迎点赞、收藏、评论和关注。 阿里 DataV 大屏是一款功能强大的数据可视化应用搭建工具,由阿里云提供,旨在帮助用户通过图形化的界面轻松搭建专业水准的可视化应用。 下面我们一起看下 DataV 大屏 是如何做自适应…

Leetcode 第 408 场周赛题解

Leetcode 第 408 场周赛题解 Leetcode 第 408 场周赛题解题目1:3232. 判断是否可以赢得数字游戏思路代码复杂度分析 题目2:3233. 统计不是特殊数字的数字数量思路代码复杂度分析 题目3:3234. 统计 1 显著的字符串的数量思路代码复杂度分析 题…

矮草坪渲染尝试

本来说写unity里的,由于three测试方便,先试试three 这个图片是目标效果 可以看见草很矮,很密集,如果用instance来绘制的话,遭不住的 忽然发现这个效果很像绒毛效果 于是找了博客康康 https://zhuanlan.zhihu.com/p/256…

Ubuntu | 安装 Truffle 框架(安装缓慢)

目录 预备工作具体步骤Step1:安装 nvma. 官方方式(可能失败)b. 压缩包安装方式 Step2:安装 node.js 和 npmStep3:安装 Truffle 参考博客 前言:昨天安装 Truffle 框架,结果缓冲条转了一晚上都没安…

企业全球组网有哪几种常用的组网方式?

为了实现全球范围内的高效通信和数据传输,企业需要选择适合自身需求的组网方式。企业全球组网的有哪几种主要方式?一般包括传统的MPLS网络、云网络、SD-WAN技术和全球VPN,以帮助企业在全球范围内建立稳定、高效的网络连接。 1、传统的MPLS网络…

探索AWS EC2:云计算的强大引擎

在数字化转型的浪潮中,企业对计算资源的需求不断增长。亚马逊弹性计算云(EC2)作为AWS(亚马逊网络服务)的核心产品之一,凭借其强大的功能和灵活性,成为了全球企业构建和扩展应用的首选平台。无论…

数据结构(邓俊辉)学习笔记】串 10——BM_BC算法:坏字符

文章目录 1.坏字符2. 特殊情况 1.坏字符 实际上,刚才的实例中我们所展示的那样一个计算过程,就是所谓 BM 算法所采用的策略之一,而这一策略,将我们刚才所说的教训称作坏字符。 在这里,不妨改为基于蛮力算法的第二个版…

设置电子签名

设置点赞签名代码 export class Signature {width: number 300height: number 300canvas!: HTMLCanvasElementctx!: CanvasRenderingContext2Dprivate drawing: boolean falsepreTask: string[] []nextTask: string[] []private allTask: { x: number; y: number; color: …

Leetcode - 周赛413

目录 一,3274. 检查棋盘方格颜色是否相同 二,3275. 第 K 近障碍物查询 三,3276. 选择矩阵中单元格的最大得分 四,3277. 查询子数组最大异或值 一,3274. 检查棋盘方格颜色是否相同 本题就是找规律,假设白…

EPLAN中如何将图纸导出为PDF文件并设置页边距?

EPLAN中如何将图纸导出为PDF文件并设置页边距? 如下图所示,在项目中选中需要导出的图纸页, 如下图所示,点击上方页-----导出------PDF, 如下图所示,在弹出的窗口中设置导出文件的名称、输出目录、输出颜色,这里建议勾选“使用打印边距”, 如下图所示,继续点击下方的设…

论文速读|重新审视奖励设计与评估:用于强健人型机器人站立与行走控制的方法

论文地址:https://arxiv.org/pdf/2404.19173 这篇论文为类人机器人站立和行走(SaW)控制器的持续可衡量改进奠定了基础。通过引入一套定量实际基准测试方法,作者展示了现有控制器的优缺点,并通过基准测试指导新控制器的…

论文速读|自然语言的最优控制合成:机遇与挑战

项目地址:Optimal Control Synthesis from Natural Language: Opportunities and Challenges 介绍了一种从自然语言自动生成最优控制器的框架,该框架主要包括以下几个步骤:首先,通过人类用户提供的初始文本和系统描述,…

源代码如何防泄露?做好这十条轻松应对

源代码防泄露是一个多方面的安全问题,涉及到技术、管理和物理等多个层面。以下是一些有效的策略和方法,结合深信达的SDC防泄密软件,来实现源代码的防泄露: 1. **访问控制**:实施基于角色的访问控制(RBAC&am…

JUC-无锁之CAS

问题提出 (应用之互斥) package cn.itcast; import java.util.ArrayList; import java.util.List; interface Account {// 获取余额Integer getBalance();// 取款void withdraw(Integer amount);/*** 方法内会启动 1000 个线程,每个线程做 -10 元 的操作* 如果初始…

深度学习系列73:使用rapidStructure进行版面分析

1. 概述 项目地址https://github.com/RapidAI/RapidStructure?tabreadme-ov-file 2. 文档方向分类示例 安装$ pip install rapid-orientation import cv2 from rapid_orientation import RapidOrientation orientation_engine RapidOrientation() img cv2.imread(test_im…

C++笔记---string类(简单地使用)

1. string类介绍 string类是C标准库中给出的一种类类型,其目的是为了代替C语言中的字符串。 C语言中,字符串是以\0结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str系列的库函数,但是这些库函数与字符串是…

【时时三省】(C语言基础)指针进阶 例题

山不在高,有仙则名。水不在深,有龙则灵。 ----CSDN 时时三省 字符数组例题: arr后面放了六个字符 所以这个数组的元素个数就是6 第一个arr 因为他计算的是一整个数组的大小 就是打印6 第二个arr0 arr没有单独放在它的内部 所以它计算的就是…

深智城基于超融合数据库MatrixOne的一站式交通大数据平台改造

在智慧交通应用中,数据处理需求极为复杂,涉及人、车辆、道路和环境等多个方面,产生了大量异构数据。交通管理人员需要对这些数据进行实时分析和决策,以应对各种交通事件。然而,在实际生产中会发现数据处理缺陷、管理复…

智慧平台赋能政务管理,声通科技助力政务管理智能化

在智能时代的大潮中,政务管理也在不断寻求创新与突破,在这方面,涌现出了很多优秀的公司。比如声通科技的子公司西安金讯数智信息技术有限公司,就在AI政务热线领域有很多创新成果,为政务管理的智能化升级提供了新思路。…

windows安装php7.4

windows安装php7.4 1.通过官网下载所需的php版本 首先从PHP官网(https://www.php.net/downloads.php)或者Windows下的PHP官网(http://windows.php.net/download/)下载Windows版本的PHP安装包。下载后解压到一个路径下。 2.配…