《第7章 随机解释变量.doc》由会员分享,可在线阅读,更多相关《第7章 随机解释变量.doc(17页珍藏版)》请在三一办公上搜索。
1、第7章 随机解释变量单方程线性计量经济学模型假定解释变量是确定性变量,并且与随机误差项不相关,违背这一基本假设的问题被称为随机解释变量问题。本章介绍了随机解释变量问题的概念、产生的原因和后果、检验方法以及解决方法。7.1随机解释变量问题的概念对于计量经济模型 (7.1.1)其中一个基本假设是解释变量是确定性变量,即解释变量与随机扰动项不相关。但是在现实经济生活中,这个假定不一定成立,这一方面是因为用于建模的经济变量的观测值一般会存在观测误差,另一方面是经济变量之间联系的普遍性使得解释变量可能在一定程度上依赖于应变量,即解释变量X影响应变量Y,而应变量Y也会反过来影响解释变量X。模型中如果存在一
2、个或多个随机变量作为解释变量,就称为模型出现了随机解释变量问题。其中可能与随机误差项u不相关,就是说,解释变量都是外生的,但有可能在方程(4.4.1)中是内生的,则称原模型存在随机解释变量问题。内生性可能源自于省略误差、测量误差,联立性等具体详见Econometric analysis of cross section and panal data(Jeffrey Wooldrige,2007 )。为讨论方便,我们假设(4.4.1)中为随机解释变量。在模型(7.1)中,根据解释变量与随机误差项的关系,可以分为三种类型:1)随机解释变量与随机干扰项独立 (7.1.2)2)随机解释变量与随机干扰项
3、同期无关但异期相关 (7.1.3) (7.1.4)3)随机解释变量与随机干扰项同期相关 (7.1.5)7.2实际经济问题中的随机解释变量在许多经济现象中,自变量的非随机性假定有时是不符合实际的。因为, 许多经济变量是不能用控制的方法进行观测的,所以作为模型中的解释变量其取值就不可能是确定的,而是随机的。 由于随机误差项中包含了模型中略去的解释变量,而略去的解释变量同模型中保留的解释变量往往存在一定的相关关系。 在自回归模型中,因变量作为解释变量也必定是随机变量。因此,我们必须对模型中的解释变量为随机变量且与随机项相关的情形进行讨论。在单方程计量经济学模型中,凡是外生变量都被认为是确定性的,于是
4、随机解释变量问题主要变现于用滞后被解释变量作为模型的解释变量的情况。同时,由于经济活动具有连续性,使得这类模型在以时间序列数据作样本的模型中占据较大份额。例如,消费不仅受收入的影响,还受前期消费水平的影响。投资不仅受收入的影响,还受前期投资水平的影响。但是,并不是所有包含滞后被解释变量的模型都会带来随机解释变量问题,下面通过几个例子来说明。耐用品的存量由前一个时期的存量和当期收入共同决定,于是著名的“耐用品存量调整模型”表示为 (7.2.1)这是一个滞后被解释变量作为解释变量的自回归模型。但是如果模型中不存在随机误差项的序列相关性,那么随机解释变量不相关,属于上述的第一种情况。再如,在著名的“
5、合理预期的消费函数模型”中,首先认为消费是由对收入的预期所决定的,或者说消费是有计划的,而这个计划是根据对收入的预期制定的。于是有: (7.2.2)其中,表示t期收入预期值,而预期收入与实际收入之间存在差距,用函数形式表现出来为: (7.2.3)该式是由合理预期理论给出来的,因此可以进一步推导出 (7.2.4)在该模型中,作为解释变量的是一个随机解释变量,同时由于高度相关,所以它与模型(7.2.4)中的随机误差项也高度相关。属于上述第三种类型。7.3随机解释变量的后果当模型存在随机解释变量时,如果仍采用普通最小二乘法估计模型参数,不同性质的随机解释变量会产生不同的后果。对一元线性回归模型在前面
6、得到如下最小二乘估计量: (7.3.1)随机解释变量X与随机干扰项的关系不同,参数OLS估计量的统计性质也会不同。7.3.1估计量的渐近特征如果一个变量是随机变量,它的精确抽样分布是很难找到的,只能是渐进结果。例如,当线性回归模型满足最小二乘法的假定条件时,其参数的最小二乘估计量具有无偏性和有效性。优势最小二乘估计量并不具有这种统计特征,但随着样本容量的增加却具有了这种特征。1)渐近无偏性设是参数的估计量,其中n为样本容量,设依次抽样的样本容量n分别为,则是一个随机变量,其数学期望值为E(),方差为Var()=E-E()2。随着样本容量n取值的不同,得到下面随机解释变量序列| E()| Var
7、()| (7.3.2)所谓渐近分布是指。当样本容量n趋于无穷大时,上面各随机变量序列分别收敛到一定分布。对于均值、方差存在以下关系。 (7.3.3) 其中,分别是的渐近期望值和渐进方差。如果则称是的渐近无偏估计。即当样本容量n充分大时,的均值趋向于总体参数。以上的讨论是在样本容量充分大的情况下进行的。如果小样本估计量是有偏的,但其估计量具有渐近无偏性,我们就可以增加样本来优化估计结果。2)一致性一致性估计是指对于任意给定的两个任意小的正数,总存在一个充分大的样本容量,使得当n时,满足 (7.3.4)称估计序列的一致估计序列,即当样本容量n充分大时,值趋向于总体真实值的概率接近于1,记为 (7.
8、3.5)也可以简记为 综上所述,由数理统计的理论可知,要想建立一个一致性估计量,必须满足两个条件和即估计量具有渐近无偏性,并且当样本容量充分大时,的方差趋近于0。3)随机解释变量模型最小二乘估计量的统计特征随机解释变量X的OLS估计量可能出现下面三种情况(1)如果X与随机误差项u相互独立,即,得到的参数估计量仍然是无偏一致估计量。由于 因此则有 (7.3.6)这说明是的无偏估计量。同理可以证明是的无偏估计量。(2)如果X与同期不相关,而异期相关,得到的参数估计量有偏,但却是一致的。由(7.3.1)易知 (7.3.7)尽管与同期无关,但对任一的分母中一定包含不同期的X;由异期相关性知与相关,导致
9、即参数估计量是有偏的。但是(7.3.8)即在假定的情况下,分子项等于0,于是上式成立。这说明最小二乘估计量虽然是有偏的,但它是的一致估计量。(3)如果随机解释变量X与随机误差项u同期相关,得到的参数估计量有偏且非一致。由于 Cov所以则有 (7.3.9)即 (7.3.10)这说明最小二乘估计量是有偏的,也不是的一致估计量。同理也可以证明是有偏的,也不是的一致估计量。但是需要注意的是,如果模型中带有滞后被解释变量作为解释变量,则当该滞后被解释变量与随机干扰项同期相关时,普通最小二乘估计量是有偏的且非一致的。即使同期无关,其普通最小二乘估计量也是有偏的,因为此时肯定会出现异期相关。总之,在存在随机
10、解释变量问题时,采用OLS法估计模型参数,得到的参数估计量在小样本情况下是有偏的,在大样本情况下也不具有渐进无偏性,就有可能产生严重的误导结果。7.4随机解释变量的检验(内生性)随机解释变量的内生性检验在国内,暂时还很少提及,这里简单介绍下国外学者的主要检验方法之一豪斯曼检验(Hausman,1978)。举例说明,假定我们有单一的被怀疑的内生变量 (7.4.1)其中,假定x是内生性变量,是外生的。如果x与u不相关,我们应该用OLS法估计(4.4.20)模型。豪斯曼检验是直接比较OLS和2SLS的估计结果,判断其差异是否在统计上显著。如果所有变量是外生的,OLS和2SLS都是一致性的;如果差异显
11、著,就可以断定x是内生的(保持外生性)。我们可以通过计算OLS和2OLS下的参数估计值来判断二者是否存在差异,但是这种方法相对而言比较复杂,使用回归检验会更加容易,它是以估计x的诱导型为基础的。此时诱导型是 (7.4.2)其中是其他的外生变量,未出现在模型(4.4.20)中。此时,因为各个与u不相关,所以x与v不相关且u与v不相关,这也是我们将要检验的。假设,其中e与v不相关且均值为零,那么u与v不相关当且仅当=0。检验是否为零方法就是将v作为回归元添加到模型(7.4.1)中做t检验。因为v是模型中的随机误差项,不能被直接观测,因此应该用OLS估计诱导型方程(7.4.2),从而获取诱导型残差序
12、列v。因此OLS估计为 (7.4.3) 其中为诱导型(4.4.21) 用OLS估计所获得的残差。然后用t统计量检验零假设:=0,如果以一个小的显著水平拒绝零假设,我们就可以因u与v相关推断出x是内生的。7.4.1单一解释变量的内生性检验1)在模型(4.4.20)中,用内生变量x对所有外生变量(包括那些在结构方程中和其它方程中的工具变量)做回归,估计它的诱导型(4.4.21),并获得残差序列v。2)将v添加到结构方程(4.4.20)中,用y做内生变量x和残差v的回归,并用t统计量检验v的显著性。3)如果v的OLS估计量的t统计量显著,则拒绝原假设(解释变量是非随机的),认为解释变量x是随机变量;
13、如果v的OLS估计量的t统计量不显著,则没有充分理由拒绝原假设,即说明解释变量x为非随机的。具体操作过程如下例7.1 已知1978年-1998年我国国内生产总值Y,最终消费C1,资本形成总额K的样本观测值见表7.1所示 案例来源:李子奈,计量经济学,高等教育出版社,2005年第二版表7.1 1978-1998年我国国内生产总值、最终消费和资本形成总额年份YC1K19783605.52239.11377.919794073.92619.41474.219804551.32976.11590.019814901.43309.11581.019825489.23637.91760.219836076
14、.34020.52005.019847164.34694.52468.619858792.15773.03386.0198610132.86542.03846.0198711784.07451.24322.0198814704.09360.15495.0198916466.010556.56095.0199018319.511365.26444.0199121280.413145.97515.0199225863.615952.19636.0199334500.620182.112998.0199447110.927216.219260.6199558510.533635.023877.019
15、9668330.440003.926867.2199774894.343579.428457.6199879853.346405.930396.0建立国民经济系统的最终消费模型 由于最终消费C1是国内生产总值Y的一部分,因此C1和Y均受到随机误差项u的影响,即可以认为Y为随机解释变量且与u高度相关。我们首先用豪斯曼检验来判断Y是否为随机解释变量。首先用内生变量Y作K的回归,在估计模型窗口输入 Y C K,点击OK,估计出回归方程,如图7.1所示图7.1在上图中点击ProcMake Residual Series,建立起残差序列Resid01,再用C1为被解释变量,做内生变量Y和残差Resid0
16、1的回归,结果如图7.2所示图7.2可见,该回归方程的拟合程度很好,残差Resid01的t统计量显著,因此可以确定变量Y为随机解释变量。7.4.2多个解释变量的内生性检验多个解释变量的内生性检验原理和上述相似,在模型(7.4.4)中 (7.4.4)其中,假设X1,X2是两个内生变量。首先分别用X1和X2对所有外生变量做回归,估计它们的诱导型,并得到两个残差序列v1和v2,再将残差代入方程(7.4.4)中,用y做内生性变量和残差v1和v2的回归,然后用F检验在结构方程中检验这些残差的联合显著性。检验结果显著则表明X1,X2中至少有一个内生解释变量,被解释的排斥性约束的数目就是被怀疑的内生解释变量
17、的数目。7.5随机解释变量的解决模型中出现随机解释变量且与随机误差项相关时,OLS估计量是有偏的。如果随机解释变量与随机误差项异期相关,则可以通过增大样本容量的办法来得到一致的估计量;但如果是同期相关,即使增大样本容量也无济于事。这时,就需要寻求新的估计方法。目前主要的方法有正交回归估计法、正反向回归估计法、虽小特征值估计法、工具变量法等,其中工具变量法得到了最广泛的运用。 1)工具变量的概念出现了随机解释变量问题时,最常用的估计方法是工具变量(instrument variables,IV)法。它是指在模型估计过程中被作为工具使用,以代替模型中与随机误差项相关的随机解释变量。被选择为工具变量
18、的变量必须满足以下条件:(1)与所替代的随机解释变量高度相关;(2)与随机干扰项不相关;(3)与模型中其他解释变量不相关,以避免出现多重共线性。2)工具变量法工具变量法是克服解释变量与随机误差项相关影响的一种参数估计方法。它的基本思路是,当随机解释变量X与误差项u高度相关时,设法找到另外一个变量Z,它与X高度相关,而与u无关,从而用Z替换X。变量Z就被称为工具变量。(1)一元线性回归模型中的工具变量法记一元线性回归模型如下: (7.5.1)用OLS法估计模型(7.5.1)式,相当于分别用1与去乘模型两边,再对i求和,推导出正规方程组 (7.5.2)根据最小二乘法的假设,对于随机误差项u,有这意
19、味着意味着在大样本下 (7.5.3.)所以方程组(7.5.2)可以化成 (7.5.4)求解可以得到 (7.5.5)但是,如果与相关,即使在大样本下,也不存在 即OLS估计量不具有一致性,不能用上述方法求出。如果按照工具变量的选择条件选择Z为X的工具变量,那么在上述估计过程中不用X而改为Z乘以模型的两边,并对i求和。利用工具变量与随机干扰项不相关的性质,在大样本下可略去与,得到 (7.5.6)(2)多元线性回归模型中的工具变量法对于多元线性回归模型 (7.5.7)假设为随机解释变量且与误差项u高度相关。同时,随机误差项u还满足最小二乘法的其他假定条件:,;解释变量之间不存在多重共线性。同理,我们
20、寻找工具变量,它们需要满足以下条件:必须是有实际经济意义的变量;与它们所对应的随机解释变量高度相关;与随机误差项u不相关;与多元线性回归模型中其他解释变量不相关;工具变量之间不相关。除了外,其他外生变量及常数项均由其自身作工具变量,可得工具变量矩阵 (7.5.8)用替换多元线性回归模型参数估计量表达式中的,得多元线性回归模型工具变量法参数估计量表达式 (7.5.9)3)工具变量法估计量的统计性质以一元线性回归模型为例,用工具变量法所求的参数估计量与总体参数真值之间的关系为(7.5.10)两边取概率极限得如果工具变量Z选取得当,即有 (7.5.11)因此,由此可以说明工具变量法的参数估计值是一致
21、估计量。对于工具变量法,有以下几点说明需要注意:(1)在小样本下,工具变量法估计量仍是有偏的,这是因为 (7.5.12)因此,在建立计量经济模型时,要保证足够大的样本容量,从而避免参数估计量偏误。(2)如果模型中有两个以上的随机解释变量与随机误差项相关,就必须找到两个以上的工具变量。但是,一旦工具变量选定,它们在估计过程被使用的次序不影响估计结果。(3)在分析实际经济问题时,经常会产生一种误解,以为采用工具变量法是将原模型中的随机解释变量换成了工具变量,即改变了原来的模型。实际上,从上面的一元线性回归模型的例子可以看出,工具变量法并没有改变原模型,只是在原模型的参数估计过程中用了工具变量来代替
22、随机解释变量。(4)如果一个随机解释变量可以找到多个相互独立的工具变量,人们希望充分利用这些工具变量的信息,就形成了广义距方法(Generalizal Method of Moments, GMM)。GMM是近年来计量经济学理论方法发展的重要方向之一,工具变量法是GMM的一个特例,同样OLS法也可以称为是工具变量法的特例。4)工具变量的选择方法在实际应用中,要找到与随机干扰项不相关而又与随机解释变量相关的工具变量并不是一件很容易的事,这里介绍三种统计中常用的分组法来选取工具变量。对于一元线性回归模型 (7.5.13)若选取Z为X的工具变量,并用Z乘以上式两边求和,则有 (7.5.14)由于z和
23、u不相关,即,因此有,则上式可以变为 (7.5.15) 我们可以通过求出b值,来进一步确定工具变量。(1)Wald法即将解释变量X从小到大进行排列,并以中位数为界分成两组,设分别为两组样本点的重心,则离差形式的斜率的估计量为 (7.5.16)当然,b也可以通过引入工具变量Z求得令 则有 (7.5.17)(2)Bartler法建议首先将解释变量X分成三组,然后舍去中间组的n/3个样本,此时估计量为 (7.5.18)同样,b的计算值也可以通过引入工具变量求得 其中b的计算公式同(7.5.17)(3)Durbin法建议将解释变量的序号作为工具变量,此时则有 (7.5.19)上述三种方法存在的问题是:
24、前两种方法与排序有关,因此,估计量可能是不一致的,后一种方法当随机误差项过大时,以序号为工具变量肯呢个会与随机误差项相关,从而导致计量产生误差。在一般情况下,如果考虑到随机解释变量与随机误差项相关的主要来源是由于同期测量误差引起的,就可以用滞后一期的随机解释变量作为原解释变量的工具变量。7.6 案例操作用例7.1的数据来比较最小二乘法和工具变量法的估计结果对于国民经济系统的最终消费模型 首先采用最小二乘法来估计模型,结果如图7.3所示图7.3估计的模型方程为 (6.57) (213.168)R2=0.99958上例中证明了国内生产总值Y为随机解释变量,因此OLS法估计量是有偏的且是非一致性。由
25、于测量误差等原因,可知国内生产总值Y与随机误差项u往往呈正相关,随着国内生产总值的增加,u倾向增大,这样OLS法可能会低估截距项而高估斜率项。由于资本形成总值K是Y的一部分,且与Y高度相关,假设K与随机误差项u不相关,则可以用K做Y的工具变量。用Eviews的估计过程如下打开估计模型窗口,在估计方法中选择TSLS估计法,弹出如图7.4所示的对话框图7.4在方程设定区输入c1 y c,在工具变量列写区输入c k,点击确定,估计结果如图7.5所示图7.5估计的方程为 (6.64) (212.75)R2=0.99958正如所预期的那样,工具变量法估计量对OLS估计量对截距项的低估和斜率项的高估做出了
26、修正,而且各项检验指标也都有进一步的改进。7.8本章小结单方程线性计量经济学模型中假定解释变量是确定性变量,并且与随机误差项不相关,违背这一基本假设的问题被称为随机解释变量问题。它产生的原因有:经济变量不能用控制的方法进行观测;随机误差项中包含了模型中略去的解释变量,而它又与模型中的其它解释变量存在相关关系等。随机解释变量的检验方法主要是豪斯曼检验,通过建立内生性变量的诱导方程,估计其残差序列,从而判断该残差序列在原方程模型中的显著性。由于随机解释变量方程估计的结果具有渐进无偏性和一致性,因此不能直接用最小二乘法进行估计,主要采用工具变量法进行方程估计。对于工具变量的选择常常采用Wald法、Bartler法和Durbin法。