内生性产生的原因及解决方案.ppt

资源描述

《内生性产生的原因及解决方案.ppt》由会员分享，可在线阅读，更多相关《内生性产生的原因及解决方案.ppt（114页珍藏版）》请在三一办公上搜索。

1、第五讲内生性,OLS经典假设所有的解释变量Xi与随机误差项彼此之间不相关。,若解释变量Xi和ui相关，则OLS估计量是非一致的，也就是即使当样本容量很大时，OLS估计量也不会接近回归系数的真值。当解释变量和随机误差项相关时，模型存在着内生性问题。,在计量经济学中，把所有与扰动项相关的解释变量都称为“内生变量”。这与一般经济学理论中的定义有所不同。1。与误差项相关的变量称为内生变量(endogenous variable)。2。与误差项不相关的变量称为外生变量(exogenous variable)。,造成误差项与回归变量相关（内生性）的原因很多，但我们主要考虑如下几个方面：遗漏变量偏差变量

2、有测量误差双向因果关系。,遗漏变量偏差,变量有测量误差测量数据正确时：假设方程为：,当存在测量误差时：方程为：,所以我们有：,可知，误差项中包含,所以可以得到：如果,则回归结果有偏，非一致,我们假设,则有,结论：1。由于,2。回归的性质决定于w的标准差,双向因果关系之前我们假定因果关系是从回归变量到因变量的(X导致了Y)。但如果因果关系同时也是从因变量到一个或多个回归变量(Y导致了X)的呢？如果是这样的话，因果关系是向前的也是“向后”的，即存在双向因果关系，如果存在双向因果关系，则OLS回归中同时包含了这两个效应，因此OLS估计量是有偏的、非一致的。,可以推导出：,检验方法：豪斯曼检验检验,豪

3、斯曼检验（Hausman specification test）H0：所有解释变量均为外生变量。H1：至少有一个解释变量为内生变量。quietly reg lw80 s80 expr80 tenure80 iq est store ols quietly ivregress 2sls lw80 expr80 tenure80(s80 iq=med kww mrt age)est store iv hausman iv ols，若 Hausman 检验失效（检验统计量为负值），则使用dmexogxt，否则仍Hausman检验为主。,使用Davidson-MacKinnon检验,xtivreg 后

4、使用 dmexogxt*Davidson-MacKinnon(1993)检验*H0：OLS 和 xtivreg 都是一致的，即内生性问题对OLS的估计结果影响不大 xtivreg tl size ndts tang(npr=tobin L1.npr),fe dmexogxtDavidson-MacKinnon检验得到F统计量的P值小于0.05，代表有内生性,遗漏变量偏差可采用在多元回归中加入遗漏变量的方法加以解决，但前提是只有当你有遗漏变量数据时上述方法才可行。双向因果关系偏差是指如果有时因果关系是从X到Y又从Y到X时，此时仅用多元回归无法消除这一偏差。同样，变量有测量误差也无法用我们前面学

5、过的方法解决。因此我们就必须寻找一种新的方法。,二、内生性的解决方案,事实上，仅仅为了解决内生性问题，并不需要我们对内生性问题的缘起有很深入的理解。对于应用型的实证研究而言，我们只需要掌握解决内生性问题的具体方案即可。内生性问题的解决方案一共四种，理论上来讲，这四种方案应对内生性问题都很有效。但于我个人而言，我对四种方法的评价是有高低的，由高到低分别介绍如下。,1.自然实验法,所谓自然实验，就是发生了某些外部突发事件，使得研究对象仿佛被随机分成了实验组或控制组。这是我最喜欢的方法，只是自然实验需要寻找一个事件，并且这个事件只影响解释变量而不影响被解释变量。遇着这种事件是一种缘分，还要能识别出来

6、，这对学者的眼光也是一种挑战。有很多文章声称使用了自然实验，但严格来讲，并没有做到对研究对象进行了随机分组。虽然如此，我对此类文章仍然很是喜欢。,自然实验包括的要素有:一个政策措施(treatment),一个观察到的结果(outeome),一个对照组(contorlgoruP)。在评估“政策措施”对“结果”是否发挥作用时,对照组充当一个参照系。而一个“准自然实验”和自然实验的区别在于处理组和对照组的选取是否随机。这里的“结果”是以受政策影响的县和没有受政策影响的县之间在增长速度上的差异来衡量。简单连接改革措施和被直管县绩效的做法并不恰当。这样的做法无法排除其他政策或是整体经济的影响,因而是无法

7、衡量改革真实效果的。,17,2.双重差分法,Difference-in-Difference（DID）一般称为双重差分法，或倍差法。倘若出现了一次外部冲击，这次冲击影响了一部分样本，对另一部分样本则无影响，而我们想看一下这次外部冲击到底有何影响，双重差分法就是用来研究这次冲击的净效应的。其基本思想是，将受冲击的样本视作实验组，再按照一定标准在未受冲击的样本中寻求与实验组匹配的对照组，而后做差，做差剩下来的便是这次冲击的净效应。双重差分法实际上是固定效应的一个变种，差分的过程实际上是排除固定效应的过程。ZERA在计量论文写作和发表的黑客教程有一个非常简明风趣的举例，我转述于此，以飨读者。,19,

8、Difference in difference models,Maybe the most popular identification strategy in applied work todayAttempts to mimic random assignment with treatment and“comparison”sampleApplication of two-way fixed effects model,20,Problem set up,Cross-sectional and time series dataOne group is treated with inter

9、ventionHave pre-post data for group receiving interventionCan examine time-series changes but,unsure how much of the change is due to secular changes,21,Difference in difference models,Basic two-way fixed effects modelCross section and time fixed effectsUse time series of untreated group to establis

10、h what would have occurred in the absence of the interventionKey concept:can control for the fact that the intervention is more likely in some types of states,22,Three different presentations,TabularGraphicalRegression equation,23,Difference in Difference,24,time,Y,t1,t2,Yt1,Yt2,treatment,control,Yc

11、1,Yc2,Treatment effect=(Yt2-Yt1)(Yc2-Yc1),25,Key Assumption,Control group identifies the time path of outcomes that would have happened in the absence of the treatmentIn this example,Y falls by Yc2-Yc1 even without the interventionNote that underlying levels of outcomes are not important(return to t

12、his in the regression equation),26,Basic Econometric Model,Data varies by state(i)time(t)Outcome is YitOnly two periodsIntervention will occur in a group of observations(e.g.states,firms,etc.),27,Three key variablesTit=1 if obs i belongs in the state that will eventually be treatedAit=1 in the perio

13、ds when treatment occursTitAit-interaction term,treatment states after the interventionYit=0+1Tit+2Ait+3TitAit+it,28,Yit=0+1Tit+2Ait+3TitAit+it,29,More general model,Data varies by state(i)time(t)Outcome is YitMany periodsIntervention will occur in a group of states but at a variety of times,30,ui i

14、s a state effectvt is a complete set of year(time)effectsAnalysis of covariance modelYit=0+3 TitAit+ui+t+it,31,Group effects Capture differences across groups that are constant over timeYear effectsCapture differences over time that are common to all groups,32,其中，d 就是双重差分估计量，Y 为研究的结局变量，右侧脚标中 treatme

15、nt 和 control 分布代表干预组和对照组，t0 和 t1 分别代表干预前和干预后。构造了差分估计量之后，就要根据不同的数据类型和不同的结局变量 Y，分别选用相应的参数检验方法来进行建模。,(1)适用于独立混合横截面数据,33,独立混合横截面数据是在不同时点从同一个的大总体内部分别进行随机抽样，将所得的数据混合起来的一种数据集。该类数据的特点为每一条数据都是独立的观测值。通过将不同时点的多个观测值结合起来，从而可以加大样本量以获得更精密的估计量和更具功效的检验统计量;也可加入新的变量时间(即干预前后)，以便判断干预前后的差别。对于总体一致、范围较大、涉及不同时间点的

16、调查研究，多收集此类数据,34,35,36,(2)适用于综列数据面板数据的 DID 模型,37,面板数据要求在不同时点调查相同的研究对象。它与独立混合横截面数据最大的不同在于，不同时点的观测值并不是独立分布的。这类数据的特点在于:由于研究的个体相同，一些不随时间改变的不可观测的因素(如个人特质等)对不同时点的观测值会产生影响，可以通过控制这些影响从而得到较为真实的结果;,38,39,40,由于一般大规模的人群调查存在较大的变异性问题，仅在模型中纳入虚拟变量“分组(A)”、“时间(T)”是远远不够的。为了提高解释系数 R2，需要加入其他可能影响被解释变量的因素，即控制除分组、时间变量以外的其

17、他变量。,ssc install diffhelp diffdiff y,t(treated)p(t)robust如果有控制变量，可以利用cov（）添加,41,工具变量(instrumental variable,IV)回归是当回归变量X与误差项u相关时获得总体回归方程未知系数一致估计量的一般方法。我们经常称其为IV估计。其基本思想是：假设方程是：,我们假设ui与Xi相关，则OLS估计量一定是有偏的和非一致的。工具变量估计是利用另一个“工具”变量Z将Xi分离成与ui相关和不相关的两部分。,3.工具变量法,我们的工作就是要寻找相应的工具变量将解释变量分解成内生变量和外生变量，然后利用两阶段最小二

18、乘法(TSLS)进行估计。,工具变量的选取,一个有效的工具变量必须满足称为工具变量相关性和工具变量外生性两个条件:即,（1）工具变量相关性：工具变量与所替代的随机解释变量高度相关；（2）工具变量外生性：工具变量与随机误差项不相关；,一个合适的工具变量应该同时满足两个条件：第一要能很好地解释内生变量，也就是说工具变量和内生变量之间要足够相关；第二，工具变量要来自系统之外，即工具变量具备外生性。如果内生性表现为联立性问题，第二个标准尤其必要。虽然统计证据可以告诉我们工具变量和内生变量是否相关，但是其背后的因果链条和工具变量是否具备外生性的证明一样，必须依赖令人置信的逻辑推导。工具变量的外生性在回归

19、中表现为和方程的残差项正交，即工具变量不会对方程被解释变量产生影响，如果产生影响则只能通过内生变量起作用。,两阶段最小二乘估计量,若工具变量Z满足工具变量相关性和外生性的条件，则可用称为两阶段最小二乘(TSLS)的IV估计量估计系数1。两阶段最小二乘估计量分两阶段计算：第一阶段把X分解成两部分：即与回归误差项相关的一部分以及与误差项无关的一部分。第二阶段是利用与误差项无关的那部分进行估计。,一般IV回归模型,因变量 Yi。外生解释变量 W1i、W2i、Wri。内生解释变量 X1i、X2i、Xki。我们引入工具变量Z1i、Z2i、Zmi。,第一阶段回归：利用OLS建立每个内生变量（X1i、X2i

20、、Xki）关于工具变量（Z1i、Z2i、Zmi）和外生变量（W1i、W2i、Wri）的回归，并得到所有回归结果的拟合值Xi_hat。第二阶段回归：用Xi_hat取代原有的Xi，与原有的外生变量Wi一起进行第二次回归，得到TSLS统计量TSLS。注意：工具变量出现在第一阶段回归，但不出现在第二阶段回归。,引入工具变量的个数,假设我们有n个内生解释变量，引入了m个工具变量，n和m的关系是什么？n=m 恰好识别 nm 不可识别只有恰好识别和过度识别才能用IV方法估计。,两阶段最小二乘法的stata命令：ivregress 2sls depvar varlist1(varlist2=instlist

21、),r,first其中，“depvar”为被解释变量，varlist1为外生解释变量，varlist2为所有的内生解释变量集合，instlist为工具变量集合。选择项r表示使用异方差稳健的标准误，选择项“first”表示显示第一阶段的回归。,工具变量有效性的检验,工具变量相关性工具变量相关性越强，也就是工具变量能解释越多的X变动，则IV回归中能用的信息就越多，因此利用相关性更强的工具变量得到的估计量也更精确。弱工具变量：如果虽然但是弱工具变量几乎不能解释X的变动。,弱工具变量检验准则,1.偏R2（Sheas partial R2）含义：在第一阶段回归中，在控制外生变量影响的前提下，看其它变

22、量对某内生变量的解释力，或者说，在第一阶段回归中，剔除掉外生变量的影响。2.最小特征值统计量F：经验上F应该大于10。Stata 命令：estat firststage,all forcenonrobust,3.Cragg-Donald Wald F 统计量 4.Kleibergen-Paap Wald rk F 统计量”（当假定残差项不满足独立同分布时，就看这个来判断是否弱工具，原假设是弱工具，所以拒绝原假设就可以）F检验临界值表 CHIDIST F(12（自变量数据m）,600（自由度df=n（样本数）-m-1）)=87.06Stata命令：ivreg2,如果存在弱工具变量该怎么办？,1.

23、如果有很多工具变量，有部分强工具变量和部分弱工具变量，可以舍弃较弱的工具变量而选用相关性较强的工具变量子集。在stata中，可以使用ivreg2命令进行“冗余检验”，以决定选择舍弃哪个工具变量。（直观上，冗余工具变量是那些第一阶段回归中不显著的变量。）2.如果系数是恰好识别的，则你不能略去弱工具变量。在这种情况下，有两个选择：第一个选择是寻找其他较强的工具变量。(难度较大),第二个选择是利用弱工具变量继续进行实证分析，但采用的方法不再是TSLS。而是对弱工具变量不太敏感的有限信息极大似然法(LIML)。在大样本下，LIML 与2SLS是渐近等价的，但在存在弱工具变量的情况下，LIML 的小样本

24、性质可能优于2SLS。LIML 的 Stata 命令为ivregress liml depvar varlist1(varlist2=instlist),工具变量外生性的检验,刚才我们提到：只有恰好识别和过度识别才能用IV方法估计。一个很重要的命题是：只有过度识别情况下才能检验工具变量的外生性，而恰好识别情况下无法检验。,过度识别约束检验,基本思想：假设有一个内生回归变量，两个工具变量且没有包含的外生变量。则你可以计算两个不同的TSLS估计量：其中一个利用第一个工具变量，而另一个利用第二个工具变量。由于抽样变异性，这两个估计量不会相同，但如果两个工具变量都是外生的，则这两个估计量往往比较接近。

25、如果由这两个工具变量得到估计非常不同，则你可以得出其中一个或两个工具变量都有内生性问题的结论。,识别标准：Sargan 统计量：ivregress 2sls过程中，实际的工具变量（组）是x*与z*。Sagan检验即检验这些工具变量是否外生（是否与扰动项相关），原假设是这些变量都与扰动项不相关。利用残差对这些工具变量回归。sargen检验的P值应该越大越好，一般超过0.1既可以说明不能拒绝工具变量有效的零假设，不宜接近于1，一般大于0.4就是危险信号，工具变量过多，导致检验结果不可信。Sargan统计量服从自由度为L-k的卡方分布，查表。在excel中输入CHIDIST（x，iv-v），其中x是

26、sargan统计量的值，iv是工具变量的秩，v是估计参数个数。回车。,Hansen J统计量C统计量，说明采用工具变量的合理性过度识别检验的 Stata 命令：estat overid,xtabond2 also reports tests of over-identifying restrictions-of whether theinstruments,as a group,appear exogenous.For one-step,non-robust estimation,it reports the Sargan statistic,which is the minimized va

27、lue of the one-step GMM criterion function.The Sargan statistic is not robust to heteroskedasticity or autocorellation.So for one-step,robust estimation(稳健估计and for all two-step estimation),xtabond2 also reports the Hansen J statistic,which is the minimized value of the two-step GMM criterion functi

28、on,and is robust.xtabond2 still reports the Sargan statistic in these cases because the J test has its own problem:it can be greatly weakened by instrument proliferation.,究竟该用 OLS 还是工具变量法,豪斯曼检验原假设为：H0：所有解释变量均为外生变量reg y x1 x2est store ols ivregress 2sls y x1(x2=z1 z2)est store iv hausman iv ols,sigma

29、more,上述检验的缺点是，它假设在H0成立的情况下，OLS 最有效率。但如果存在异方差，OLS 并不最有效率(不是 BLUE)。故传统的豪斯曼检验不适用于异方差的情形。此时可以使用杜宾-吴-豪斯曼检验(DWH)，该检验在异方差的情况下也适用，更为稳健。stata命令：estat endogenous为负值不存在内生性,例一,Mincer(1958)最早研究了工资与受教育年限的正相关关系，但遗漏了“能力”这个变量，导致遗漏变量偏差。针对美国面板调查数据中的年轻男子组群(Young Mens Cohort of the National Longitudinal Survey，简记 NLS-Y)

30、，Griliches(1976)采用工具变量法对遗漏变量问题进行了校正。Blackburn and Neumark(1992)更新了 Griliches(1976)的数据，即这个例子中将要使用的数据集grilic.dta。,该数据集中包括以下变量：lw(工资对数)，s(受教育年限)，age(年龄)，expr(工龄)，tenure(在现单位的工作年数)，iq(智商)，med(母亲的受教育年限)，kww(在“knowledge of the World of Work”测试中的成绩)，mrt(婚姻虚拟变量，已婚=1)，rns(美国南方虚拟变量，住在南方=1)，smsa(大城市虚拟变量，住在大城市=

31、1)，year(有数据的最早年份，19661973年中的某一年)。,这是一个两期面板数据，初始期为当以上变量有数据的最早年份，结束期为1980 年。不带80字样的变量名为初始期，带80字样的变量名为1980年数据。比如，iq 指的是初始期的智商，而lw80指的是1980年的工资对数。,(1)先看一下数据的统计特征。use grilic.dta,clearsum(2)考察智商与受教育年限的相关关系。pwcorr iq s,sig(3)建立如下方程：,reg lw80 s80 expr80 tenure80,继续对方程进行分析：我们发现了如下问题：1。遗漏变量问题：认为方程遗漏了“能力”这个变量，

32、加入iq（智商）作为“能力”的代理变量。reg lw80 s80 iq expr80 tenure80,2。测量误差问题：iq（智商）对“能力”的测量存在误差。3。变量内生性问题：s80可能与扰动项中除“能力”以外的其他因素相关，因此是内生变量。解决方法：引入四个变量med，kww，mrt，age，作为内生解释变量iq与s80的工具变量。然后使用TSLS方法进行回归。ivregress 2sls lw80 expr80 tenure80(s80 iq=med kww mrt age),first,也可以使用GMM估计方法使用两步GMM。ivregress gmm lw80 expr80 ten

33、ure80(s80 iq=med kww mrt age)使用迭代GMM。ivregress gmm lw80 expr80 tenure80(s80 iq=med kww mrt age),igmm,几点注意事项：1。first选项的目的是显示TSLS第一阶段的结果，如果省略，则仅显示第二阶段的结果。2。命令的用法比较严格，将被解释变量和所有外生解释变量放到括号外面，内生解释变量放到括号里面，等号后面为所有工具变量。3。2SLS只能通过stata完成，利用定义手动计算的结果是错误的，因为残差序列是错误的。,4。不可能单独为每个内生变量指定一组特定的工具变量，而是给所有内生变量指定一系列工具变

34、量。5。所有外生变变量都作为自己的工具变量。6。为了检验工具变量的外生性，本题为过度识别。7。在大样本下，IV 估计是一致的，但在小样本下，IV 估计并非无偏估计量，有些情况下偏误可能很严重。,弱工具变量检验,检验方法：1。初步判断可以用偏R2(partial R2)(剔除掉模型中原有外生变量的影响)。2。Minimum eigenvalue statistic(最小特征值统计量)，经验上此数应该大于10。这个方法类似于与书上的“第一阶段F统计量”。,工具变量外生性检验,我们一般称为过度识别约束J检验。检验工具变量是否与干扰项相关，即工具变量是否为外生变量。TSLS根据Sargan统计量进行过

35、度识别检验。命令为：estat overid 检验工具变量的外生性。H0：所有工具变量都是外生的。H1：至少有一个工具变量不是外生的，与扰动项相关。,ivregress 2sls lw80 expr80 tenure80(s80 iq=med kww mrt age),first estat firststage,all forcenonrobust estat firststage estat overid,究竟该用OLS 还是IV,解释变量是否真的存在内生性？假设能够找到方程外的工具变量。1。如果所有解释变量都是外生变量，则OLS 比IV 更有效。在这种情况下使用IV，虽然估计量仍然是一致

36、的，会增大估计量的方差。2。如果存在内生解释变量，则OLS 是不一致的，而IV 是一致的。,4.动态面板回归法,基本思想是将解释变量和被解释变量的滞后项作为工具变量（IV）。其实，我是不认可这种处理方法，除非万不得已，我不推荐这种方法，我也不太相信这种方法能真正缓解内生性问题。,广义矩估计法：GMM,基本思想：求解如下一般化目标函数,使之最小化 J(b_GMM)=n*g(b_GMM)*W*g(b_GMM)其中，W 为权重矩阵在球型扰动项的假定下，2SLS 是最有效的。但如果扰动项存在异方差或自相关，则广义矩估计方法效果更好。GMM方法又分为两步GMM法和迭代GMM方法。,异方差性是相对于同方差

37、而言的。所谓同方差，是为了保证回归参数估计量具有良好的统计性质，经典线性回归模型的一个重要假定：总体回归函数中的随机误差项满足同方差性，即它们都有相同的方差。如果这一假定不满足，即：随机误差项具有不同的方差，则称线性回归模型存在异方差性。对于模型如果随机误差项的各期望值之间存在着相关关系，即这时，称随机误差项之间存在自相关性（autocorrelation）或序列相关,有关 GMM 的 Stata 命令为ivregress gmm y x1(x2=z1 z2)(两步 GMM)ivregress gmm y x1(x2=z1 z2),igmm(迭代 GMM)estat overid(过度识别检验

38、),例二,reg lw s expr tenure rns smsa,r 引入智商(iq)作为“能力”的代理变量，再进行 OLS 回归。reg lw s iq expr tenure rns smsa,r,(2)由于用 iq 来度量能力存在“测量误差”，故 iq 是内生变量，考虑使用变量(med,kww,mrt,age)作为 iq 的工具变量，进行 2SLS回归，并使用稳健标准误。ivregress 2sls lw s expr tenure rns smsa(iq=med kww mrt age),r first(3)进行过度识别检验，考察是否所有工具变量均外生，即与扰动项不相关。estat

39、 overid,(4)我们怀疑(mrt,age)不满足外生性，故使用 C 统计量检验这两个工具变量的外生性。findit ivreg2ivreg2 lw s expr tenure rns smsa(iq=med kww mrt age),r orthog(mrt age)(5)考虑仅使用变量(med,kww)作为 iq 的工具变量，再次进行2SLS 回归。ivregress 2sls lw s expr tenure rns smsa(iq=med kww),r first,再次进行过度识别检验：estat overid(6)弱工具变量检验estat firststage,all force

40、nonrobust(7)为了稳健起见，下面使用对弱工具变量更不敏感的有限信息最大似然法(LIML)：ivregress liml lw s expr tenure rns smsa(iq=med kww),r,(8)进一步考察弱工具变量问题，对工具变量 kww 进行冗余检验ivreg2 lw s expr tenure rns smsa(iq=med kww),r redundant(kww)(9)利用豪斯曼检验判断是否存在内生解释变量。qui reg lw iq s expr tenure rns smsaest store ols1qui ivregress 2sls lw s expr

41、tenure rns smsa(iq=med kww)estimates store iv1hausman iv1 ols1,sigmamore,(10)由于传统的豪斯曼检验在异方差的情形下不成立，下面进行异方差稳健的 DWH 检验：estat endogenous异方差下也可以利用ivreg2命令进行文件的内生性检验：ivreg2 lw s expr tenure rns smsa(iq=med kww),r endog(iq),(11)如果存在异方差，则 GMM 比 2SLS 更有效率。为此，进行如下最优 GMM 估计。ivregress gmm lw s expr tenure rns

42、smsa(iq=med kww)进行过度识别检验：estat overid考虑迭代GMM：ivregress gmm lw s expr tenure rns smsa(iq=med kww),igmm,(12)结果的完整展现：qui reg lw s expr tenure rns smsa,r est store ols_no_iq qui reg lw iq s expr tenure rns smsa,r est store ols_with_iq qui ivregress 2sls lw s expr tenure rns smsa(iq=med kww),r est store

43、tsls qui ivregress liml lw s expr tenure rns smsa(iq=med kww),r est store liml qui ivregress gmm lw s expr tenure rns smsa(iq=med kww)est store gmm qui ivregress gmm lw s expr tenure rns smsa(iq=med kww),igmmest store igmmoutreg2 ols_no_iq ols_with_iq tsls liml gmm igmm using output.doc,replace seeo

44、ut,遇到内生性问题如何处理,1.使用内生解释变量的滞后变量作为工具变量。2.寻找有创意的工具变量。,内生性的其它解决办法（1）代理变量：某变量无法直接观测，而用其它变量替代。（2）前定变量：用变量的前一期或前几期数据。（3）面板数据模型。到底如何对待内生性问题（1）需要重点考虑的问题之一；（2）最好的收集数据之前就加以考虑，尤其是准备获取一手数据的情况下。如果考虑？应用经济理论。,本实例使用数据集“grilic.dta”。考察智商与受教育年限的相关关系：上表显示，智商（在一定程度上可以视为能力的代理变量）与受教育年限具有强烈的正相关关系（相关系数为0.51）。作为一个参考系，先进行OLS回归

45、，并使用稳健标准差：,其中expr,tenure,rns,smsa均为控制变量，而我们主要感兴趣的是变量受教育年限（s）。回归的结果显示，教育投资的年回报率为10.26%，这个似乎太高了。可能的原因是，由于遗漏变量“能力”与受教育正相关，故“能力”对工资的贡献也被纳入教育的贡献，因此高估了教育的回报率。引入智商iq作为能力的代理变量，再进行OLS回归：,虽然教育的投资回报率有所下降，但是依然很高。由于用iq作为能力的代理变量有测量误差，故iq是内生变量，考虑使用变量（med（母亲的受教育年限）、kww（在“knowledge of the World of Work”中的成绩）、mrt（婚姻虚

46、拟变量，已婚=1）age（年龄）作为iq的工具变量，进行2SLS回归，并使用稳健的标准差：,在此2SLS回归中，教育回报率反而上升到13.73%，而iq对工资的贡献居然为负值。使用工具变量的前提是工具变量的有效性。为此，进行过度识别检验，考察是否所有的工具变量均外生，即与扰动项不相关：结果强烈拒绝所有工具变量均外生的原假设。考虑仅使用变量（med,kww）作为iq的工具变量，再次进行2SLS回归，同时显示第一阶段的回归结果：,上表显示，教育的回报率为6.08%，较为合理，再次进行过度识别检验：接受原假设，认为（med，kww）外生，与扰动项不相关。进一步考察有效工具变量的第二个条件，即工具变量

47、与内生变量的相关性。从第一阶段的回归结果可以看出，工具变量对内生变量具有较好的解释力。更正式的检验如下,从以上结果可看出，虽然Sheas partial R2不到0.04，但是F统计量为13.4010。我们知道，虽然2SLS是一致的，但却是有偏的，故使用2SLS会带来“显著性水平扭曲”（size distortion），而且这种扭曲随着弱工具变量而增大。上表的最后部分显示，如果在结构方程中对内生解释变量的显著性进行“名义显著性水平”（nominal size）为5%的沃尔德检验，加入可以接受的“真实显著性水平”（true size）不超过15%，则可以拒绝“弱工具变量”的原假设，因为最小特征值

48、统计量为14.91，大于临界值11.59。总之我们有理由认为不存在弱工具变量。但为了稳健起见，下面使用对弱工具变量更不敏感的有限信息最大似然法（LIML）:,结果发现，LIML的系数估计值与2SLS非常接近，这也从侧面印证了“不存在弱工具变量”。使用工具变量法的前提是存在内生解释变量，为此须进行豪斯曼检验，其原假设是“所有的解释变量均为外生”：,上表显示，可以在5%的显著性水平下拒绝“所有解释变量均外生的原假设”，即认为存在内生解释变量iq。由于传统的豪斯曼检验建立在同方差的前提下，故在上述回归中均没有使用稳健标准差。由于传统的豪斯曼检验在异方差的情形下不成立，下面使用异方差稳健的DWH检验：

49、,据此可认为iq为内生解释变量。,如果存在异方差，则GMM比2SLS更有效。为此进行如下的最优GMM估计：,进行过度识别检验：由于p值为0.70，故认为所有的工具变量均为外生。考虑迭代GMM：,稳健性检验,把解释变量和被解释变量找几个其他的变量替换一些，看看你原来的回归结果是不是符号和显著性发生了变化，如果没有变化，那就是稳健的，变化了就有问题了！做计量的最终目的，是我们要看的是自变量（你关注的那个）与因变量之间的因果关系（最终的目的。那么做稳健性检验，其实就是你想看看你现在选择的这个变量是不是能证实或证伪你的假设，如果通过多个方法，你在一定程度上能证明你关注的因素对因变量有显著因果关系（或其

50、他关系）。那就实现了你的想法。rreg,qreg.国外70%的文献都有robustness检验，尤其是发表在质量比较高的期刊上的文献，例如 journal of finance 等。而且是可以对Y或者X做替换来进行robustness test,1.从数据出发，根据不同的标准调整分类，检验结果是否依然显著；2.从变量出发，从其他的变量替换，如：公司size可以用total assets衡量，也可以用total sales衡量；3.从计量方法出发，可以用OLS,FIX EFFECT,GMM等来回归，看结果是否依然robust；,1、关于限制样本数据的有人问：如果是将全国的数据划分为东中西部的进行

展开阅读全文