当前位置:首页 » 工具五金 » 如何选用工具变量
扩展阅读
高通骁龙哪个国家产品 2025-05-09 02:30:18

如何选用工具变量

发布时间: 2023-04-18 07:18:21

❶ 在工具变量的选取中,必须能够完全替代随机解释变量吗

可以。工具变量和被解释变量是同等的,可以替换。工具变量也称为“仪器变量”或“辅助变量”,是经济学、计量经济学、流行病学和相关学科中无法实现可控实验的时候,用于估计模型因果关系的方法。

❷ 请问stata工具变量法怎么使用啊

用命令ivregress 2sls y x1 x2, robust。y2是内生变量,z1、z2是工具变量。

不过建议使用ivregress2。先安装:ssc install ivregress2。

Stata操作:工具变量法的难点在于找到一个合适的工具变禅银量并说明其合理性,Stata操作其实相当简单,只需一行命令就可以搞定,我们通常使用的工具变量法的Stata命令主要就是ivregress命令和ivreg2命令。

stata如何进行最小二乘法回归方法步骤?

一般做2sls,使用语句ivreg y (x1=z) x2 x3……xn。假定工具变量为z,控制变量有n-1个,就使用这个就好了。如果你非要自己编程序的话,首先reg x1 z x2……xn。

然后把X1的拟合值predict出来(假定为x11),在做第二阶段的回归。 reg y x11 x2……xn; 这样得到的结果就是两阶段的回归结果,但是方差是有问题的。最好使用ivreg,如果还不会用的话,直接help ivreg。

ivregress命令

ivregress命令是Stata自带的命令,支持两阶段最小二乘(2SLS)、广义矩估计(GMM)和有限信息最大似然估计(LIML)三种工具变量估计方法,我们最常使用的是两阶段最小二乘法(2SLS),因为历坦2SLS最能体现工具变量的实质,并且在球形扰动项的情况下,2SLS是最有效率的工具变量法。

顾名思义,两阶段最小二乘法(2SLS)需要做两个回归:

(1)第一阶段回归:用内生解释变量对工具变量和控制变量回归,得到拟合值。

(2)第二阶段回归:用被解释变量对第一阶段回归的拟合值和控制变量进行回归。

如果要使用2SLS方法,我们只需在ivregress后面加上2sls即可,然后将内生解释变量lnjinshipop和工具变量bprvdist放在一个小括号中,用=号连接。选项first表示报告第一阶段回归贺烂宴结果,选项cluster()表示使用聚类稳健的标准误。



❸ 计量经济学:什么是工具变量法,被选为工具变量的变量必须具备什么条件

某一个变量与模型中随机解释变量高度相关,但却不与随机误差项相关,那么就可以用此变量与模型中相应回归系数得到一个一致估计量,这个变量就称为工具变量,这种估计方法就叫工具变量法。

在模型估计过程中被作为工具使用,以替代模型中与误差项相关的随机解释变量的变量,称为工具变量。

作为工具变量,必须满足下述四个条件:

(1)与所替的随机解释变量高度相关;

(2)与随机误差项不相关;

(3)与模型中其他解释变量不相关;

(4)同一模型中需要引入多个工具变量时,这些工具变量之间不相关。

(3)如何选用工具变量扩展阅读:

缺点

工具变量法的关键是选择一个有效的工具变量,由于工具变量选择中的困难,工具变量法本身存在两方面不足:

一是由于工具变量不是惟一的,因而工具变量估计量有一定的任意性;

二是由于误差项实际上是不可观测的,因而要寻找严格意义上与误差项无关而与所替代的随机解释变量高度相关的变量事实上是困难的。

❹ 工具变量怎么找

点击 eclipse 工具栏的 window==>show View ==>Other 找到DEBUG 点击开 有一个Variables 这个就是调试的时候的变量显示窗口。 eclipse调试追踪数据变化窗口如何打开: 1、先看下软件的正常状况。 2、但是可能因为不小心,我们将追踪数据变化的窗口关掉了,就像这样。 3、点击windows->show view->variables就可以了。 Eclipse是着名的跨平台的自由集成开发环境(IDE)。最初主要用来Java语言开发,但是目前亦有人通过外挂程式使其作为其他计算机语言比如C++和Python的开发工具。Eclipse本身只是一个框架平台,但是众多外挂程式的支持使得Eclipse拥有其他功能相对固定的IDE软体很难具有的灵活性。许多软体开发商以Eclipse为框架开发自己的IDE。Eclipse最初由IBM公司开发,2001年11月贡献给开源社区,现在它由非营利软体供应商联盟Eclipse基金会(EclipseFoundation)管理。

❺ 如何利用计量经济学的方法进行因果推断(一)

本文是在我在这学期听了北京大学国发院2019年春季学期沈艳老师开设的《高级计量经济学2》后对因果推断部分的总结,主要涉及DID、RD、倾向得分匹配、HCW及合成控制法等计量方法。

因为文章包含了很多我个人的理解,免不了有所疏漏或者有理解不到位之处,还请大家批评指正。大家如果有兴趣对因果推断的方法进一步探究,可以阅读我在文章最下方列出的课程参考文献以及我自己认为对理解因果推断很有帮助的一些文章。

首先,什么是因果推断?我认为因果推断是用已有的证据去证明两件事、两个变量之间的因果联系,比如证明教育年限对于工资水平的影响,或者是气候变化对于农作物产量的影响,这里的教育年限和气候变化就是因,而工资水平和农作物产量则是果。

用于验证因果关系最理想的办法,自然是做实验。继续上文教育年限和工资水平的例子,我们如果想证明教育年限对于工资水平有影响,在理想状态下应该找一群人,控制他们的性别、年龄、智商等等所以可能影响工资水平的因素不变化,段简誉而只让教育年限发生变化,来观察工资水平是否会发生变化以及发生多大的变化。但现实中,尤其是对于社会学科来说,通常的研究对象是人,很难像自然科学一样在咐晌可以对各变量进行严格控制的环境握段下进行实验,所以就又有了下面我们要讲的方法。

第一种是随机控制实验(random control trial),也就是近些年比较火的RCT方法。用药品测试作为例子,为了测试某种新药到底有没有效果,药品公司招募了一批符合条件的被试者,将这些被试者随机分入控制组或者实验组。控制组仅发放安慰剂,而实验组则会发放真正的药品,但是被试者并不知道发放到自己手中的药品究竟是安慰剂还是开发的新药。在实验结束以后,对比实验组与控制组的相应身体指标,二者之间的平均差异就是新药的效果。

第二种是自然实验(natural experiment)或者准实验(quasi-experiment)。这类实验主要是指由于某些外部突发事件,使得当事人仿佛随机地被分配到了实验组和控制组,因而可以进行比较,探究是否存在因果关系。通过个体分组是否完全取决于这一突发事件,我们又可以进一步将其分为两类实验:第一类个体分组完全取决于突发事件,比如1992年,美国新泽西州通过法律将最低工资从每小时4.25美元提高到5.05美元,但在相邻的宾夕法尼亚州最低工资依然保持不变,这两个州的雇主仿佛被随机地分配到实验组(新泽西州)与控制组(宾夕法尼亚州)。这类自然实验可以直接用OLS估计因果效应。第二类个体分组只是部分地由自然实验所决定,如Angrist(1990) 考察越战期间的参军者,当时美国对全国年轻男子以生日抽签的方式进行征兵,尽管抽签完全随机,但是否参军取决于体检,且有些人得到豁免,另一些人未抽中却自愿参军,此时应以自然实验所带来的随机变动作为工具变量。

那在介绍完以上的实验之后,我们正式进入因果推断的框架。我们这里主要用到的是RCM的模型,即Rubin Causal Model (RCM; Rubin 1978)。首先我们引入潜在因变量的概念。

什么叫做潜在因变量呢?例如一个人上了大学,我们想研究上大学这一事件对于他的收入带来了多大的提升,这一提升叫做上大学这一事件的处理效应。为了计算这一处理效应,我们就要对这个人上了大学的收入和没上大学的收入两者相减。但在实际情况中,我们只能观察到他上了大学的收入,而无法观察到他没上大学的话收入是多少,因为一个人无法像薛定谔的猫一样同时兼具两种状态,要么是生,要么是死,一旦一种状态被确定,另一种状态下发生的事情就无法观测到了。此时,这个无法观测到的因变量就叫做潜在因变量。那我们引入以下的一些notation。

接下来我们就要定义所谓的处理效应。因为总体可以分为实验组和控制组,相应在总体、实验组和控制组三个层面上就有三种处理效应。用我们上面提到的总体处理效应是指总体随机分配个体到实验组与控制组所得到的处理效应,即 。而实验组处理效应为 。控制组的处理效应为 。这三者之间的关系是 ,即总体处理效应是实验组处理效应与控制组处理效应的权重加总。

在现实中由于潜在因变量的问题,我们往往无法估计以上三种处理效应。我们往往通过比较实验组与处理组的平均差异来近似个体处理效应,即:

当 趋于无穷时,该值依概率收敛于 ,经过一番操作后可以化为

第一个花括号内即为实验组的处理效应,第二个花括号内是由实验组和控制组解释变量差异带来的混淆效应,即实验组和控制组个体本身的异质性,第三个花括号内是实验组和控制组个体不可观测因素带来的偏差。

为了使估计的总体处理效应在期望上等于实验组的处理效应,我们需要引入以下两个假定:

第一个假定表明在控制了解释变量之后,实验组与控制组个体的选择与潜在因变量独立。第二个假定叫做重合假定,表明实验组与控制组应当在一个范围内都有观测值。这两个假定合起来称为“the strongly ignorable treatment assignment”假定。

如果以上两个假定成立,那么我们就可以选用回归、倾向得分匹配的方法。反之,则根据需要选用工具变量、DID、RD、HCW、合成控制法等。

除了假定以外,实验组分配机制也是决定我们能否使用因果推断以及使用哪种因果推断方法的重要因素。一般而言,我们都需要考虑实验组分配机制是否存在内部有效性和外部有效性的问题。内部有效性问题主要包含:1)未能完全随机分组;2)未能完全遵从实验设计;3)中途退出实验;4)观察效应或霍桑效应,即观察者会给实验者的行为造成扰动;5)样本量过小。内部有效性问题主要存在于实验设计本身,而外部有效性问题影响实验结果是否能够推广,具有参考价值和普遍的代表性,主要包括:1)样本代表性不足;2)小型实验的条件与大规模推广时的现实条件不同;3)一般均衡效应,以市场供需为例,市场在达到均衡与未达到均衡时供需机制显然是不同的;4)自我选择效应,以就业培训项目为例,选择进入就业培训项目的人往往在近几年收入较低,因此研究就业培训项目对收入的影响就会存在内生性问题。

因为文章比较长,所以我们这部分就先介绍RCM基本框架,接下来依次为大家介绍这一框架下不同的因果推断方法。

相关网页:

Rubin Causal Model (RCM) 和随机化试验 (作者写的一系列关于因果推断的文章可读性很不错,大家有兴趣可以一览)

❻ 面板数据如何处理工具变量

解释变量内生性检验
首先检验解释变量内生性(解释变量内生性的Hausman 检验:使用工具变量法的前提是存在内生解释变量。Hausman 检验的原假设为:所有解释变量均为外生变量,如果拒绝,则认为存在内生解释变量,要用IV;反之,如果接受,则认为不存在内生解释变量,应该使用OLS。
reg ldi lofdi
estimates store ols
xtivreg ldi (lofdi=l.lofdi ldep lexr)
estimates store iv
hausman iv ols
(在面板数据中使用工具变量,Stata提供了如下命令来执行2SLS:xtivreg depvar [varlist1] (varlist_2=varlist_iv) (选择项可以为fe,re等,表示固定效应、随机效应等。详见help xtivreg)
如果存在内生解释变量,则应该选用工具变量,工具变量个数不少于方程中内生解释变量的个数。“恰好识别”时用2SLS。2SLS的实质是把内生解释变量分成两部分,即由工具变量所造成的外生的变动部分,以及与扰动项相关的其他部分;然后,把被解释变量对中的这个外生部分进行回归,从而满足OLS前定变量的要求而得到一致估计量。tptqtp
二、异方差与自相关检验
在球型扰动项的假定下,2SLS是最有效的。但如果扰动项存在异方差或自相关,
面板异方差检验:
xtgls enc invs exp imp esc mrl,igls panel(het)
estimates store hetero
xtgls enc invs exp imp esc mrl,igls
estimates store homo
local df = e(N_g) - 1
lrtest hetero homo, df(`df')
面板自相关:xtserial enc invs exp imp esc mrl
则存在一种更有效的方法,即GMM。从某种意义上,GMM之于2SLS正如GLS之于OLS。好识别的情况下,GMM还原为普通的工具变量法;过度识别时传统的矩估计法行不通,只有这时才有必要使用GMM,过度识别检验(Overidentification Test或J Test):estat overid
三、工具变量效果验证
工具变量:工具变量要求与内生解释变量相关,但又不能与被解释变量的扰动项相关。由于这两个要求常常是矛盾的,故在实践上寻找合适的工具裤巧陪变量常常很困难,需要相当的想象力与创作性。常用滞后变量。
需要做的检验:
检验工具变量的有效性:
(1) 检验工具变量与解释变量的相关性
如果工具变量z与内生解释变量完全不相关,则无法使用工具变量法;如果与仅仅微弱地相关,。这种工具变量被称为“弱工具变量”(weak instruments)后果就象样本容量过小。检验弱工具变量的一个经验规则是,如果在第一阶段回归中,F统计量大于10,则可不必担心弱工具变量问胡蠢题。Stata命令:estat first(显示第一个阶段回归中的统计量)
(2) 检验工具变量的外生性(接受原假设好)
在恰好识别的情况下,无法检验工具变量是否与扰动项相关。在过度识别(工具变量个数>内生变量个数)的情况下,则可进行过度识别检验(Overidentification Test),检验原假设所有工具变量都是外生的。如果拒绝该原假设,则认为至少某个变量不是外生的,即与扰动项相关。0H
Sargan统计量,Stata命令:estat overid
四、GMM过程
在Stata输入以下命令,就可以进行对面板数据的GMM估计。
. ssc install ivreg2 (安装程序ivreg2 )
. ssc install ranktest (安装另外一个在运行ivreg2 时需要宽嫌用到的辅助程序ranktest)
. use "traffic.dta"(打开面板数据)
. xtset panelvar timevar (设置面板变量及时间变量)
. ivreg2 y x1 (x2=z1 z2),gmm2s (进行面板GMM估计,其中2s指的是2-step GMM)

❼ 经济发展与碳排放 怎么选工具变量

解释变量内生性检验 首雹闹先检验解释变量内生性(解释变量内生性的Hausman 检验:使用工具变量法的前携肆前提是存在辩清内生解释变量。

❽ 使用两阶段最小二乘法时,怎样选择工具变量

普通的2sls回归中的关于唤世工具毕备变和数肢量的命令如下:reg y x1 x2 ( z x2),上述的回归模型假定x1是内生变量,其中 z x2分别是x1 x2 相对应的工具变量。 版主提出的带有交叉项的回归模型中,不知可否 采用 reg y x1 x2*x1 (z z*x2) 仅供参考 ,我也是初学...

❾ 孟德尔随机化如何获取工具变量

孟德尔随机化(Mendelian randomization)是一种利用基因变异来进行因果推断的方法,可以用于研究某个因变量和某个结果变量之间是否存在因果关系。在使用孟德尔随机化进行因果推断时,需要使用工具变量漏改旦来评估因变量对结果歼悉变量的影响。
通常,工具变量是一种与因变量相关,但与结果变量无关的变量。在孟返扰德尔随机化中,常使用基因变异作为工具变量。基因变异是一种天然的随机分配方式,可以用来评估因变量对结果变量的影响。例如,如果研究因变量为血液中胆固醇水平对心血管疾病的影响,可以使用基因变异作为工具变量,评估胆固醇水平对心血管疾病的影响。
要获取工具变量,需要进行基因分型和基因型与因变量之间的关联分析。通常使用单核苷酸多态性(SNP)作为基因分型标记,然后分析基因型与因变量之间的关联。如果SNP与因变量之间存在显着关联,就可以将该SNP作为工具变量来评估因变量对结果变量的影响。
在使用孟德尔随机化进行因果推断时,需要注意控制混淆因素,避免因混淆因素而得到错误结论。另外,需要使用多个SNP作为工具变量,以增加模型的可靠性和稳定性。

❿ 全球视角可以选择什么工具变量

1 将聚集数据作为工具变量
Card和 Krueger(1996)为了解决同效应( peer effect)的内生性问题,将州、郡等分析层面的集聚数据作为学校、班级以及邻里等层面解释变量的工具变量。Evans等(1992)在研究学校贫困生比例是否对学生怀孕或辍学具有显着影响的实证过程中,为学校贫困生比例选取的工具变量为失业率、贫困率以及家庭收入中位数,认为这三个因素必然与学校贫困生比例有关,但却不直接影响学生怀孕或辍学等行为;Bentolima等(2010)将联邦就业率作为“使用社会关系”的工具变量,以考察其对个人收入的影响效应,其理由是:联邦就业率与收入之间并未存在直接关系,但如果就业率较高,则在联邦内利用关系求职的必要性相对较低。虽然将集聚数据作为工具变量会克服内生性问题,但由于无法保证集聚数据具有完全外生性,所以可能会引入噪音,甚至导致遗漏偏误( Grogger,1996; Rivkin,2001),所以,使用该类工具变量的研究呈减少趋势。
2 将自然现象作为工具变量
通常认为在一定的区域范围内,河流、降雨、自然灾害等现象具有高度的随机性、外生性等特征,可被假设为与个人、群体的异质性无关,但与此同时又会影响某些社会过程。Hoxby(2000)将区域内的河流数量作为学校数量的工具变量,用于验证学区内学校之间的竞争能否提高教学质量。由于历史积累的某种特征可能会导致学校数量存在内生性,而将河流数量作为学校数量的工具变量具有很强的说服力,即河流数量发的交通问题会直接影响学校的设立数量,而河流是自然形成,其与教学质量并无直接关系; Culter和 Glaeser(1997)同样将河流数量作为