违背古典假定的计量经济模型(新).ppt

上传人:牧羊曲112 文档编号:6351147 上传时间:2023-10-19 格式:PPT 页数:156 大小:814.50KB
返回 下载 相关 举报
违背古典假定的计量经济模型(新).ppt_第1页
第1页 / 共156页
违背古典假定的计量经济模型(新).ppt_第2页
第2页 / 共156页
违背古典假定的计量经济模型(新).ppt_第3页
第3页 / 共156页
违背古典假定的计量经济模型(新).ppt_第4页
第4页 / 共156页
违背古典假定的计量经济模型(新).ppt_第5页
第5页 / 共156页
点击查看更多>>
资源描述

《违背古典假定的计量经济模型(新).ppt》由会员分享,可在线阅读,更多相关《违背古典假定的计量经济模型(新).ppt(156页珍藏版)》请在三一办公上搜索。

1、第四章 违背古典假定的计量经济模型,*概述*异方差*自相关*随机解释变量*多重共线性,第一节 概述,一、古典假定 假定1、随机项i具有零均值 E(i)=0 i=1,2,n 假定2、随机项i具有同方差 Var(i)=2 i=1,2,n 假定3、随机项i无序列相关性 Cov(i,j)=0 ij i,j=1,2,n 假定4、随机项与解释变量X之间不相关:Cov(Xj,i)=0 i=1,2,n,假定5、服从正态分布 iN(0,2)i=1,2,n 假定6、多元回归模型中解释变量之间不存在多重共线性 rank(X)=k+1 k+1n 根据Gauss-Markov定理可知,古典回归模型的最小二乘估计量(OL

2、SE)是线性无偏有效的估计量,而且由于正态性假定,它们服从正态分布的。因此,就有可能得出区间估计式,而且也可以检验真实总体回归系数。,二、古典假定的违背及造成的后果,在实际经济问题中,上述的古典假定不一定都能得到满足。如果这些假定不完全满足,则OLSE的BLUE特性将不复存在。当然,每一个假定不满足所造成的后果是不同的。在本章中,我们将严格考察上述假定,找出如果有一个或多个假定得不到满足时,估计量的性质将会发生什么变化,并研究当出现这些情况时,应该如何处理,即古典模型假定违背的经济计量问题。,关于假定1,一般地我们认为假定E(i)=0 是合理的。因为随机项 是多种因素的综合,而每种因素的影响都

3、“均匀”地微小,它对因变量的影响不是系统的,且正负影响相互抵消,故所有可能取值平均起来为零。即使有轻度的违反,从实践的观点来看可能不会产生严重的后果,因为它可能只影响回归方程的截距项。关于随机项正态性分布的假定,如果我们的目的仅仅是估计,这种假定并不是绝对必要的。事实上,无论是否是正态分布,OLSE估计式都是BLUE。剩下的四个假定将在下面的四节中分别加以讨论。,三、广义最小二乘法(GLS),给定线性回归模型 Y=X+U 若古典假定完全满足,根据Gauss-Markov定理,其系数的最小二乘估计量 B(XT X)1 XT Y 具有 BLUE性质。若古典假定得不到完全满足,特别是假定2(同方差性

4、)和假定3(无序列相关性)得不到满足时,对OLSE的影响更大。,广义最小二乘法(General Least SquaresGLS)就是为了解决上述问题提出的。其基本思路是:若 假定2(同方差性)和假定3(无序列相关性)得不到满足时,我们可以采取适当的变换,使原模型变为以下的形式:使得其中 的重新满足假定2(同方差性)和假定3(无序列相关性)。这样就可以对上式使用OLS估计参数,从而使得上式的OLSE仍然为BLUE。若因假定2和假定3不满足时,有 其中I,是一个nn的正定对称方阵。,此时可可以觅得一个nn的非奇异矩阵P,使得:P PT=I 然后用觅得的P乘以原模型的两边,有:PY=PX+PU 记

5、 原模型就转换为:可证明转换后的模型其随机项满足同方差性和无序列相关性,即可以采用OLS估计参数了。,第二节 异方差性,一、异方差的涵义二、异方差性的后果三、异方差的检验四、异方差的消除方法五、案例,对于模型,如果出现,即对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则认为出现了异方差性(Heteroscedasticity)。,一、异方差的概念,异方差举例例:截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+uiYi:第i个家庭的储蓄额 Xi:第i个家庭的可支配收入 高收入家庭:储蓄的差异较大 低收入家庭:储蓄则更有规律性,差异较小ui的方差呈现单调递增型变化,例 以某一行业的

6、企业为样本建立企业生产函数模型 Yi=A LiKiei,被解释变量:产出量Y 解释变量:资本K、劳动力L 那么:每个企业所处的外部环境对产出量的影响被包含在随机误差项中。每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。,异方差产生的原因:一模型中省略的解释变量;二测量的误差;三截面数据中总体各单位的差异,二、异方差产生的后果,计量经济学模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:,1、参数估计量非有效,OLS估计量仍然具有无偏性,但不具有有效性,因为在有效性证

7、明中利用了 E(uuT)=2I,而且,在大样本情况下,尽管参数估计量具有一致性,但仍然不具有渐近有效性。,2、变量的显著性检验和置信区间失去意义,变量的显著性检验中,构造了t统计量 t=b1/s(b1)它是建立在2不变而正确估计了参数方差s(b1)的基础之上的。如果出现了异方差,估计的s(b1)出现偏误(偏大或偏小),t检验失去意义。,其他检验也是如此。,3、参数方差的估计量是有偏的,虽然最小二乘法参数的估计量是无偏的,但这些参数方差的估计量、是有偏的。正的偏差会高估参数估计值的真实方差,负的偏差会低估参数估计值的真实方差。,4、模型的预测失效,一方面,由于上述后果,使得模型不具有良好的统计性

8、质;,所以,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。,三、异方差性的检验,检验思路:,由于异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。,(一)图示法,既可利用因变量Y与解释变量X的散点图,也可利用残差e2-X的散点图,对随机项u的异方差作近似的直观判断。(1)用X-Y的散点图进行判断 看是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中),看是否形成一斜率为零的直线,(二)戈德菲尔德-匡特(Go

9、ldfeld-Quandt)检验,G-Q检验以F检验为基础,适用于大样本、异方差递增或递减的情况。,G-Q检验的思想:先排序,将样本去掉中间的c个,然后一分为二,对子样和子样分别作回归,然后利用两个子样的残差平方和之比构造统计量进行异方差检验。,H:随x递增(或递减),G-Q检验的步骤:,将n对样本观察值(Xi,Yi)按观察值Xi的大小排队将序列中间的c=n/4个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为(n-c)/2对每个子样分别进行OLS回归,并计算各自的残差平方和 分别用RSS1与RSS2表示解释变量较小与较大的残差平方和(自由度均为(n-c)/

10、2-k);,给定显著性水平,确定临界值F(v1,v2),若F F(v1,v2),则拒绝同方差性假设,表明存在异方差。,在同方差性假定下,选择如下满足F分布的统计量如果检验递增方差 F=F(k,k),如果检验递减方差 F=F(k,k),(三)戈里瑟(Gleiser)检验,基本思想:尝试建立|ei|关于解释变量X的各种幂次方程:如:|ei|=0+1Xi+vi|ei|=0+1Xi-1+vi 等等,选择关于变量X的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。,(四)Spearman等级(秩)相关检验,这是一种非参数检验。方法为:1

11、.利用最小二乘法对模型进行回归,计算残差 ei及其绝对值|ei|;2.给出X的每个Xi的位次和|ei|的位次;3.计算每个样本点的Xi的位次和|ei|的位次的差 di 4.计算Spearman等级(秩)相关系数:,5.对Spearman等级(秩)相关系数进行显著性检验。检验统计量为,上述统计量服从自由度为(n2)的t分布。对应 给定显著性水平的临界值,若t,则认为不存在异方差,若t,则认为存在异方差。,(五).怀特(White)检验,怀特检验不需要排序,且适合任何形式的异方差。怀特检验的基本思想与步骤(以二元为例):,然后做如下辅助回归,可以证明,在同方差假设下:,(*),R2为(*)的可决系

12、数,h为(*)式解释变量的个数,,表示渐近服从某分布。,做如下辅助回归,注意:辅助回归仍是检验 与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。如果存在异方差性,则表明确与解释变量的某种组合有显著的相关性,这时往往显示出有较高的可决系数以及某一参数的t检验值较大。当然,在多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有时可去掉交叉项。,四、异方差的消除方法,异方差消除的基本思路是将原模型加以“变换”,使得“变换”后的模型具有同方差性。但是变换的形式与每个随机项方差的真实值是已知还是未知有关。,(一)随机项方差i2已知,当i2已知或者可以估计出

13、来的情况,可利用广义的最小二乘法。下面介绍广义最小二乘法的另一种情形:加权最小二乘法(Weighted Least Squares,WLS),令,把它称为变换后的随机项.,而,由此可得,所以,参数的OLS估计式按下式要求给出。,即,其中,由此可得模型()的参数估计式为:,注意,(2).也可选用其他的权数。,加权最小二乘法的基本思想:加权最小二乘法是对原模型加权,实质是用方差i2的平方根i对原模型进行变换。使之变成一个新的不存在异方差性的模型,然后采用OLS估计其参数。,在采用WLS方法时:对较小的残差平方ei2赋予较大的权数 对较大的残差平方ei2赋予较小的权数,其中,加权最小二乘法的基本思想

14、:加权最小二乘法是对原模型加权,实质是用方差i2的平方根i对原模型进行变换。使之变成一个新的不存在异方差性的模型,然后采用OLS估计其参数。,注意:,加权最小二乘法的思路很简单,但在具体实践中有关随机项方差的信息极少,我们很难找出真实的随机项方差i2。因此加权最小二乘法仅是理论上的存在,实际上往往很难使用它。所以,当i2未知或者利用已知观测数据无法估计的情况下,必须寻求其它的方法。,(二)随机项方差未知,从异方差的意义看,异方差就是随机项在解释变量取不同数值时方差不同。这就意味着异方差i2是解释变量x的函数,这种函数形式我们可假设出来。,例如,如果只与一个解释变量有关,可假设,可以用去除该模型

15、,得,新模型中,存在,即满足同方差性,可用OLS法估计。,若与m(1mk)个解释变量有关,则异方差形式可写作,以遍除原模型,得:,记,可以对转换后的模型OLS应用进行参数估计。,这说明转换后的模型具有了同方差性。,如果给定的模型为:假定1:,此时用X去乘以原模型,可得,(其中,),则有:,这样转换后的模型具有同方差性。,对转换后的模型应用OLS,即可求得 对的回归方程:,将上式两边同乘,可得原模型的回归方程为:,假定2此时用 去除原模型,可得,其中,则有:,对转换后的模型即可应用普通最小二乘法进行参数估计可得:,所以原模型的回归方程为:,注意:,(1).实际应用WLS时,经常用自变量的幂函数的

16、倒数 形式 作为权数对原模型进行加权,但m究竟取何值合适,需要通过估计。,(2).如果异方差是由省略的解释变量造成的,最好的解 决方 法是在模型中加入省略的解释变量。,(3).对于多元线性回归模型,异方差问题同样存在。用 哪一个自变量构造权数呢?通行的做法是:首先 用 OLS估计 样本回归方程,计算出各样本点的绝对 残差;然后分别计算每一个自变量与绝对残差序列的 等级相关系数;选取 Spearman等级相关系数大的自变 量构造权数。权数的构造 方法同一元线性回归模型。,五、案例储蓄与收入模型,例 表(见Eviews)是储蓄与收入的样本观测值,试进行异方差性分析,并建立储蓄y关于收入x的线性回归

17、模型。,(1)根据表中数据,做出X与Y的散点图。方法为:打开Eviews工作文件。点击quick,选Graph,点击ok;在对话框中从Graph Type中选scatterDiagram,点击“ok”。散点图如下:,(一)异方差检验,(2)根据表中数据,做出残差图运行Eviews,进行OLS估计;点击Resids,可得拟合与残差图,选View中的Actual,Fitted,Residual Actual,Fitted,Residual Table功能就得到可用来进行残差分析表;利用该结果画出X与残差平方的散点图输出结果整理如下:,x与残差平方的散点图,从上面两图可以看出,在较高的收入水平上储蓄

18、的离散程度增大,表明随机项可能存在递增型的异方差。,进一步的统计检验,G-Q检验,将原始数据按排成升序,去掉中间的个观测点数据,得两个容量为1的子样本。对两个子样本分别作OLS回归,求各自的残差平方和RSS1和RSS2:,计算F统计量:F=RSS2/RSS1=769889.2/144771.5=5.3,查表 给定=5%,查得临界值 F0.05(9,9)=3.18判断 F F0.05(9,9)否定两组子样方差相同的假设,从而该总体随机项存在递增异方差性。,(二)异方差的处理,1.最优权数的确定以上检验证实了y的异方差性的存在。所以需要用加权最小二乘法估计参数。使用WLS首先需要估计权数。我们采用

19、自变量幂函数的倒数权数的形式:,利用SPSS,可以求得幂的最佳取值。打开SPSS,依次点击AnalyzeRegressionWeight Estimate,本例通过运行SPSS得到的取值为2,即权数为:,相当于对原总体回归模型变换为:,从而消除异方差性的影响。,其拟合优度检验、F检验、t检验均高度显著。加权回归的结果比不加权的回归结果有很大的改进,(0.004484)(74.165566)(19.815)(9.985)R2=0.93122 F=392.64453,2.加权回归从输出结果看,还原后的加权最小二乘法的估计结果为:,一、自相关的涵义二、自相关产生的后果三、自相关检验四、自相关模型的经

20、济计量方法五、案例,第三节 自相关,一、自相关的涵义,如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了序列相关性或称存在自相关。,对于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n,随机项互不相关的基本假设表现为 Cov(i,j)=0 ij,i,j=1,2,n,或,称为一阶序列相关,或一阶自回归.,其中:被称为自协方差系数(coefficient of autocovariance)或一阶自回归系数(first-order coefficient of autocorrelation)i是满足以下标准的OLS假定的随机干扰项:,如果仅存在

21、E(i i+1)0 i=1,2,n,一阶自回归往往可写成如下形式:i=i-1+i-11,由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标t代表i。,自相关产生的原因,(一)被解释变量的自相关,(二)模型省略了自相关的解释变量,(三)随机项本身存在自相关,(四)回归模型的数学形式不正确,(五)经济变量的惯性作用.,计量经济学模型一旦出现序列相关性,如果仍采用OLS法估计模型参数,会产生下列不良后果:,二、自相关产生的后果,1、参数估计量非有效,因为,在有效性证明中利用了 E(UUT)=2I 即同方差性和不相关性的假定条件。而且,在大样本情况下,参数估计量虽然具有一致性,但仍然

22、不具有渐近有效性。,2、变量的显著性检验失去意义,在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。,其他检验也是如此。,3、模型的预测失效,区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。所以,当模型出现序列相关性时,它的预测功能失效。,然后,通过分析这些“近似估计量”之间的相关性,以判断随机误差项是否具有序列相关性。,序列相关性检验方法有多种,但基本思路相同:,基本思路:,三、自相关的检验,(一)图示法,(二)杜宾-瓦森(Durbin-Watson)检验法,D-W检验是杜宾(J.Du

23、rbin)和瓦森(G.S.Watson)于1951年提出的一种检验序列自相关的方法,该方法的假定条件是:,(1)解释变量X非随机;(2)随机误差项i为一阶自回归形式:i=i-1+i(3)回归模型中不应含有滞后因 变量作为解释变量,即不应出现下列形式:Yi=0+1X1i+kXki+Yi-1+i(4)大样本,回归含有截距项,该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精确的分布很难得到。但是,他们成功地导出了临界值的下限dL和上限dU,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。,杜宾和瓦森针对原假设:H0:=0,即不存在一阶自回归,构如下造统计量:

24、,D.W.统计量:,d=,当D.W.值在2左右时,模型不存在一阶自相关。,证明:展开D.W.统计量:,(*),如果存在完全一阶正相关,即=1,则 D.W.0 完全一阶负相关,即=-1,则 D.W.4 完全不相关,即=0,则 D.W.2,这里,,为一阶自回归模型 i=i-1+i 的参数估计。,D.W检验步骤:,(1)计算DW值(2)给定,由n和k的大小查DW分布表,得临界值dL和dU(3)比较、判断,若 0D.W.dL 存在正自相关 dLD.W.dU 不能确定 dU D.W.4dU 无自相关 4dU D.W.4 dL 不能确定 4dL D.W.4 存在负自相关,0 dL dU 2 4-dU 4-

25、dL 4,正相关,不能确定,无自相关,不能确定,负相关,如果模型被检验证明存在序列相关性,则需要分析原因,若是由省略某些解释变量造成的,则应找出省略的变量,将它包含在模型中;如果是由于错误地确定模型的数学形式引起,则应该修正其数学形式.排除以上原因后仍然存在的自相关可以发展新的方法估计模型。,最常用的方法是广义最小二乘法(GLS:Generalized least squares)和广义差分法(Generalized Difference)。,四、自相关的经济计量方法,1、广义最小二乘法,对于模型 Y=X+如果存在序列相关,同时存在异方差,即有,是一对称正定矩阵,存在一可逆矩阵D,使得=DDT

26、,变换原模型:D-1Y=D-1X+D-1即 Y*=X*+*(*),(*)式的OLS估计:,这就是原模型的广义最小二乘估计量(GLS estimators),是无偏的、有效的估计量。,该模型具有同方差性和随机误差项互相独立性:,如何得到矩阵?,对的形式进行特殊设定后,才可得到其估计值。,如设定随机扰动项为一阶序列相关形式 i=i-1+i 则,1、广义差分法,广义差分法是将原模型变换为满足OLS法的差分模型,再进行OLS估计。,如果原模型为,可以将原模型变换为:,令,原模型可变为:,其中,这种变换叫广义差分变换。变换后的模型称为广义差分模型。,其中,将原回归模型进行广义差分变换得广义差分模型,对广

27、义差分模型应用普通最小二乘法,这种方法称为广义差分法。,可取,补全数据,时,上式变为:,即,其中,该种变换叫做一阶差分变换,变换后的模型叫做一阶差分模型。这种模型的一个重要特征是没有常数项。易得:,随机误差项相关系数的估计,应用广义差分法,必须已知随机误差项的相关系数。实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。常用的估计方法有:,科克伦-奥科特(Cochrane-Orcutt)迭代法。杜宾(durbin)两步法,2、杜宾(durbin)两步法,该方法仍是先估计,再对差分模型进行估计,第一步,变换差分模型为下列形式,进行OLS估计,得Yj(j=t-1)前的系数估计值,令,则

28、,(2).用估计值对原模型进行差分变换,对差分模型,应用OLS方法,可得、的估计值、,从而,还可以用其它的方法 求的估计值,如:,、科克伦-奥科特迭代法。,以一元线性模型为例:首先,采用OLS法估计原模型 Yi=0+1Xi+i得到的的“近似估计值”,并以之作为观测值使用OLS法估计下式,求得的估计值,记作:,其中,对模型应用普通最小二乘法进行估计,得到 参数的估计值并对模型中的随机项 是否存在自相关进行检验。如果检验得出随机项无自相关,迭代就此结束。,否则,就重复前面的步骤,将模型的估计值还原为原模型的参数估计值,由此计算 的第二次估计值,然后根据,计算 的第二次估计值,记作,关于迭代的次数,

29、可根据具体的问题来定。一般是事先给出一个精度,当相邻两次1,2,L的估计值之差小于这一精度时,迭代终止。实践中,有时只要迭代两次,就可得到较满意的结果。两次迭代过程也被称为科克伦-奥科特两步法。,利用 对原模型再进行差分变换,这就是第二次迭代同样可以进行第三次、第四次迭代,直至差分模型中的随机项消除自相关性,就停止迭代过程。,五、案例,某国进口贸易额IM与国民生产总值GDP的数据见表。试建立进口贸易额IM与国民生产总值GDP的线性回归模型。,资料见下页,进口贸易额与国民生产总值的数据,单位:百万英镑,应用最小二乘法得到如下回归方程:,s(b)=(248.65)(0.087),R2=0.983,

30、d=0.9337,给定=0.05,查显著性水平为0.05,观测值个数为20及解释变量个数为1的D-W分布表,得到临界值,dL=1.20 dU=1.41,因为 ddL,所以随机项u存在一阶正自相关,自相关的处理 杜宾二步法,估计一阶自相关系数,作et关于et-1的线性回归,得到,可得=0.53,令=0.53,做以下变换,对 关于 的线性模型做最小二乘估计,得,R2=0.949 d=1.87,因为d接近2,已消除自相关,故得0、1的估计值分别为:,b1=0.296 b0=1369.36/(1 0.53)=2966.7,由此可得要估计的原回归方程为,第四节 随机解释变量问题,一、估计量的渐近性质二、

31、随机解释变量模型估计特性 三、随机解释变量模型的经济计量方法四、案例,基本假设:解释变量X1,X2,Xk是确定性变量。如果存在一个或多个随机变量作为解释变量,则称原模型出现随机解释变量问题。,对于模型,1.随机解释变量与随机误差项独立(Independence),2.随机解释变量与随机误差项同期无关(contemporaneously uncorrelated),但异期相关。,3.随机解释变量与随机误差项同期相关(contemporaneously correlated)。,在许多经济现象中,自变量的非随机性假定有时是不符合实际的。因为,许多经济变量是不能用控制的方法进行观测的,所以作为模型中

32、的解释变量其取值就不可能是确定的,而是随机的。又由于随机项包含了模型中略去的解释变量,而略去的解释变量同模型中保留的解释变量往往是相关的。自回归模型中,因变量作为解释变量也必定是随机变量了。因此,我们必须对模型中的解释变量为随机变量且与随机项相关的情形进行讨论。,一、估计量的渐近性质,线性、无偏性和有效性是评价一个估计量优劣的标准。在有的情况下,小样本的估计量不具有某种统计特性,但随着样本容量的增大,估计量逐渐有了这种统计性质,此时称之为估计量的渐近统计性质。,1.渐近无偏性,2.渐近一致性,1.渐近无偏性,如果满足,则称 为 的渐近无偏估计量。,随着样本容量的逐步增大,估计量与真实值的系统偏

33、差越来越小,逐渐趋于0。即:通过增加样本容量,可以改善参数估计的精度。,2.渐近一致性,如果满足,简记为,则称 为 的一致估计量。,表示概率极限,可以证明 为 的 一致估计量,当且仅当,一致估计量具有渐近无偏性的概率为1,且在真实值附近离散的程度随样本容量的增大逐渐趋于0的概率为1。,在大样本的条件下,一致估计量具有很高的精度,二、随机解释变量模型估计特性,以一元线性回归模型为例 说明。设给定的模型为,采用离差形式即为,式中,,不管自变量是否是随机变量,对上式应用OLS,参数的估计量都是,我们分下列三种情况进行讨论,1.x 是非随机变量,x与u自然不相关,最小二乘估计量是无偏的。,2.x是随机

34、变量,但x与u不相关,最小二乘估计量仍然是无偏的。,3.x是随机变量,且u与x线性相关,最小二乘估计量是有偏的。这时,又分两种情况:,(1)在大样本下,如果x与u渐近不相关,,对1估计式两边取概率极限,有,说明最小二乘估计量具有一致性。也就是说,如果 x是随机变量,且x与u不独立,虽然小样本的无偏性得不到满足,但在样本容量增加时,OLSE会逐渐逼近真实的总体参数,即在样本足够大时,OLSE仍然是有意义的。,(2)x与u不存在渐近不相关关系,即使在大样本条件下,仍然存在,由此可以看出,b1是1的非一致估计量。这时OLS失效,必须引进其他方法估计参数和进行统计推论推论。,模型中出现随机解释变量且与

35、随机误差项相关时,OLS估计量是有偏的。如果随机解释变量与随机误差项异期相关,则可以通过增大样本容量的办法来得到一致的估计量;但如果是同期相关,即使增大样本容量也无济于事。这时,最常用的估计方法是工具变量法(Instrument variables)。,三、随机解释变量模型的经济计量方法,1、工具变量的选取,工具变量:在模型估计过程中被作为工具使用,以替代模型中与随机误差项相关的随机解释变量。选择为工具变量的变量必须满足以下条件:,(1)与所替代的随机解释变量高度相关;(2)与随机误差项不相关;(3)与模型中其它解释变量不相关,以避免出现多重共线性。,2、工具变量的应用,以一元回归模型的离差形

36、式为例说明如下:,用OLS估计模型,相当于用x*i去乘模型两边、对i求和、再略去x*iui项后得到正规方程:,(*),解得,如果选择Z为X的工具变量,那么在上述估计过程可改为:,利用E(ziui)=0,即,这种求模型参数估计量的方法称为工具变量法(instrumental variable method),相应的估计量称为工具变量法估计量(instrumental variable(IV)estimator)。,可得,1、在小样本下,工具变量法估计量仍是有偏的。,注意:,2、工具变量并没有替代模型中的解释变量,只是在估计过程中作为“工具”被使用。,上述工具变量法估计过程可等价地分解成下面的两步

37、OLS回归:第一步,用OLS法进行X关于工具变量Z的回归:,1、在小样本下,工具变量法估计量仍是有偏的。,注意:,2、工具变量并没有替代模型中的解释变量,只是在估计过程中作为“工具”被使用。,上述工具变量法估计过程可等价地分解成下面的两步OLS回归:第一步,用OLS法进行X关于工具变量Z的回归:,容易验证仍有:,因此,工具变量法仍是Y对X的回归,而不是对Z的回归。,3、如果模型中有两个以上的随机解释变量与随机误差项相关,就必须找到两个以上的工具变量。但是,一旦工具变量选定,它们在估计过程被使用的次序不影响估计结果,4、OLS可以看作工具变量法的一种特殊情况。,、要找到与随机扰动项不相关而又与随

38、机解释变量相关的工具变量并不是一件很容易的事 可以用Xt-1作为原解释变量Xt的工具变量。,4、OLS可以看作工具变量法的一种特殊情况。,5、如果1个随机解释变量可以找到多个互相独立的工具变量,人们希望充分利用这些工具变量的信息,就形成了广义矩方法(Generalized Method of Moments,GMM)。在GMM中,矩条件大于待估参数的数量,于是如何求解成为它的核心问题。工具变量法是GMM的一个特例。,6、要找到与随机扰动项不相关而又与随机解释变量相关的工具变量并不是一件很容易的事 可以用Xt-1作为原解释变量Xt的工具变量。,四、案例,下页表中x代表国内生产总值,y代表消费,z

39、代表投资。用表中所提供的某地的三项指标的资料说明工具变量的使用方法。,国内生产总值、消费、投资数据,单位:亿元,设消费y与国内生产总值x之间具有线性关系,可建立如下模型:,由于国内生产总值x与随机项u相关,而投资z与随机项u无关,与国内生产总值x高度相关,故可用z作为国内生产总值x的工具变量。参数估计如下:,=0.568051,876.010088,则样本回归模型为:,一、多重共线性的涵义二、多重共线性引起的后果三、多重共线性的检验四、消除多重共线性的方法五、案例,第五节 多重共线性,一、多重共线性的涵义,对于模型 Yi=0+1X1i+2X2i+kXki+ui i=1,2,n其基本假设之一是解

40、释变量是互相独立的。,如果某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multicollinearity)。,如果存在 c1X1i+c2X2i+ck Xki=0 i=1,2,n 其中:ci不全为0,则称为解释变量间存在完全共线性(perfect multicollinearity)。,如果存在 c1X1i+c2X2i+ckXki+vi=0 i=1,2,n 其中ci不全为0,vi为随机误差项,则称为 近似共线性(approximate multicollinearity)或存在不完全线性相关、接近线性关系。,在矩阵表示的线性回归模型 Y=X+u中,完全共线性指:rank(X)k+1,

41、即,中,至少有一列向量可由其他列向量(不包括第一列)线性表示。,如:X2=X1,则X2对Y的作用可由X1代替。,注意:完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。,综上所述,多重共线性就是指解释变量之间存在完全的线性关系或接近的线性关系.,多重共线性产生的原因,一般地,产生多重共线性的主要原因有以下三个方面:(1)经济变量相关的共同趋势 时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。,多重共线性是实际经济现象中一

42、种普遍存在的现象存在的原因主要是经济活动中变量之间复杂的相互联系,(2)滞后变量的引入,在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。,(3)样本资料的限制,一般经验:时间序列数据样本:简单线性模型,往往存在多重共线性。截面数据样本:问题不那么严重,但多重共线性仍然是存在的。,由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性,二、多重共线性的后果,1、完全共线性下参数估计量(OLSE)不确定,如果存在完全共线性,则(XTX)-1不存在,无法得到参数的估计量。,的OLS估计

43、量为:,例:对二元回归模型,如果两个解释变量完全相关,如x2=x1,则,这时,只能确定综合参数1+2的估计值.,2、近似共线性下OLS估计值不精确,也不稳定,由于|XTX|0,引起(XTX)-1主对角线元素较大,使参数估计值的方差增大,OLS参数估计量非有效。,近似共线性下,可以得到OLS参数估计量,但参数估计量方差的表达式为,、变量的显著性检验与预测失去意义,存在多重共线性时,参数估计值的方差与标准差变大,容易使通过样本计算的t值小于临界值,误导作出参数为0的推断,可能将重要的解释变量排除在模型之外,注意:,除非是完全共线性,多重共线性并不意味着任何基本假设的违背;因此,即使出现较高程度的多

44、重共线性,OLS估计量仍具有线性性等良好的统计性质。问题在于,即使OLS法仍是最好的估计方法,它却不是“完美的”,尤其是在统计推断上无法给出真正有用的信息。,变大的方差容易使区间预测的“区间”变大,使预测失去意义。,4.难以区分每个解释变量的单独影响,多重共线性检验的任务是:(1)检验多重共线性是否存在;(2)估计多重共线性的范围,即判断哪些变量之间存在共线性。,多重共线性表现为解释变量之间具有相关关系,所以用于多重共线性的检验方法主要是统计方法。,三、多重共线性的检验,(一)直观判断法,1.散点图法。对含有两个解释变量的模型,利用解释变量样本观测值的散点图来考察二者是否存在显著的线性关系。2

45、.相关系数法。计算解释变量之间的简单相关系数,若两个解释变量之间的相关系数接近于1,则可以认为模型存在多重共线性。3.“经典”判断法。多重共线性的“经典”特征是R2较高,但参数t检验值显著的不多,如果一个回归分析结果中存在这一特征,则应考虑其是否存在多重共线性的问题。,注意:前两种方法只适用于两个自变量的情况,(二)自变量之间的复决定系数和方差扩大因子,设解释变量为k个,即x1,x2,,xk。我们分别以其中的一个对其它所有的解释变量进行回归,得 k个回归方程,对每个回归方程求其决定系数分别为,在这些决定系数中寻其最大而且接近于1者,比如说 Rj2最大,则可以判定解释变量xj 与其它解释变量中的

46、一个或多个相关程度高,因此就使得回归模型出现高度多重共线性。,计量经济学中在检验多重共线性时,往往称(1-Rj2)为自变量xj的容忍度(Tolerance),其倒数为方差扩大因子(Variance Inflation Factor,简记为VIF),即,经验表明,当VIFj10时,自变量xj与其它自变量之间的多重共线性就非常大了,以至于足以影响到OLSE。,例二元回归模型,OLSE的方差 为:,x1与x2的样本相关系数:,所以,同理,可见,一个自变量与其它自变量的复决定系数越大,即多重共线性越严重,会造成回归系数的OLSE的方差越大.,所以称,为“方差扩大因子”,它可以用来反映多重共线性的严重程

47、度。,具体可进一步对上述回归方程作F检验:,式中:Rj2为第j个解释变量对其他解释变量的回归方程的决定系数,构造如下F统计量,在模型中排除某一个解释变量Xj,估计模型;如果拟合优度与包含Xj时十分接近,则说明Xj与其它解释变量之间存在共线性。,另一等价的检验是:,若存在较强的共线性,则Rj2较大且接近于1,这时(1-Rj2)较小,从而Fj的值较大。因此,给定显著性水平,计算F值,并与相应的临界值比较,来判定是否存在相关性。,(三)利用不包括某一解释变量所构成的回归方 程之决定系数,设多元线性回归模型为以下函数形式:,设其样本决定系数为R2。假定依次缺一个解释变量进行回归,则可得到k个回归方程。

48、对应的样本决定系数分别为:,其中Rj2为缺少解释变量xj 的回归方程之决定系数,在这些决定系数中选取一个最大者比如说Rj2,则Rj2与R2的差为最小,如果解释变量xj从模型中去掉,对样本决定系数的影响不大,由此说明了解释变量xj对因变量的解释能力已由其它解释变量代替了,从而表明xj可能是其它解释变量的线性组合,因此可以判定解释变量中包含xj引起了多重共线性。,(四)法勒格劳伯(FarrarGlauber)检验,FarrarGlauber提出的检验是三种检验的结合。第一种检验是 检验,它检验多元回归模型中所有解释变量之间存在共线性及共线性的程度。第二种检验是F检验,用来确定哪些解释变量是多重共线

49、的。第三种检验是t检验,用来找出造成解释变量多重共线性原因的是哪些变量。,四、消除多重共线性的方法,模型中存在多重共线性,是不是一定不好呢?这要视模型的具体用途而定。如果模型只是用来进行预测,只要多重样本决定系数(R2,)足够大即可,无需消除多重共线性。但如果模型是用来进行结构分析和政策评价,由于多重共线性影响到每个自变量系数估计的正确性和有效性,所以应设法消除多重共线性的影响,确保模型的可用性。,(一)增加样本观测值,如果多重共线性是由样本引起的(例如测量误差或偶然的样本),但解释变量的总体不存在多重共线性,则可以通过收集更多的观测值增加样本容量,避免或减弱多重共线性。对于时间序列资料就是增

50、大观测次数,对于截面数据资料就是增加观测对象,或者把时间序列资料与截面数据资料结合起来使用。当解释变量总体存在多重共线性时,增加样本容量也无助于减轻多重共线的程度。,以二元线性模型为例可以看出.,(二)删去不重要的解释变量,对待严重的多重共线性问题,一个最简单的解决办法就是删去那些产生多重共线性、对因变量影响不大且人们认为不重要的解释变量,使模型中剩下那些对因变量起重要作用的解释变量,然后对仅包含重要解释变量的模型应用普通最小二乘法。但应注意:由于把删去的解释变量对因变量的影响归入随机项中,有可能使随机项不满足零均值的假设,这时所得的参数估计值可能是有偏的,即产生确定性偏倚。,(三)利用“先验

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号