异方差修正WLSGLS序列相关原因.ppt

上传人:小飞机 文档编号:5724985 上传时间:2023-08-14 格式:PPT 页数:67 大小:1.02MB
返回 下载 相关 举报
异方差修正WLSGLS序列相关原因.ppt_第1页
第1页 / 共67页
异方差修正WLSGLS序列相关原因.ppt_第2页
第2页 / 共67页
异方差修正WLSGLS序列相关原因.ppt_第3页
第3页 / 共67页
异方差修正WLSGLS序列相关原因.ppt_第4页
第4页 / 共67页
异方差修正WLSGLS序列相关原因.ppt_第5页
第5页 / 共67页
点击查看更多>>
资源描述

《异方差修正WLSGLS序列相关原因.ppt》由会员分享,可在线阅读,更多相关《异方差修正WLSGLS序列相关原因.ppt(67页珍藏版)》请在三一办公上搜索。

1、1,4.怀特(White)检验,1980年提出。怀特检验不需要排序,且适合任何形式的异方差。怀特检验的基本思想与步骤(以二元为例),(2)然后做如下辅助回归:,(1)先对该模型作OLS回归,得到:,2,(对一元模型,其辅助回归模型:)(3)可以证明,在同方差假设下:,(*),R2为(*)的可决系数,h为(*)式解释变量的个数,,表示渐近服从某分布。,(4)在原假设H0:,(i=0,1,2,3,4,5)若,则拒绝H0,表明回归参数至少有一个显著不为零,扰动项 存在异方差性。,3,Eviews中的White检验步骤:(1)建立回归模型:LS Y C X(2)检验异方差:1)命令:View Resi

2、dual Test White Heteroskedasticity 2)在选项中选择在辅助模型中是否包含交叉乘积项(Cross terms)3)输出结果中Obs*R-squared即White检验统计量,由其双侧概率可判断是否拒绝无异方差性的原假设。,4,例如:欲判断某二元回归模型是否存在异方差。辅助回归模型有4个解释变量,不存在交叉项。则执行命令后,显示EViews的辅助回归模型估计结果(见下表):,5,当显著性水平为0.05时,由于所以存在异方差。实际上,统计量的P值为0.0135,小于0.05的水平,所以存在异方差。实际应用中,一般是直接观察P值的大小,若P值校小,则拒绝不存在异方差的

3、假设,认为模型存在异方差。,6,注意:辅助回归仍是检验与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。如果存在异方差性,则表明确与解释变量的某种组合有显著的相关性,这时往往显示出有较高的可决系数以及某一参数的t检验值较大。当然,在多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有时可去掉交叉项。,7,六、异方差的修正,常见以下四种修正方法:1.模型对数变换法2.原模型变换法3.加权最小二乘法4.广义最小二乘法,8,1.模型对数变换法 在模型 Yi=0+1Xi+i 中,变量Yi和Xi分别用lnYi和 lnXi 取代,则对全对数模型:lnYi=0+

4、1lnXi+i 进行回归后,通常可降低异方差性的影响。原因:对数变换能使测定变量值的尺度缩小。经对数变换的模型,其残差表示为相对误差,而相对误差往往具有较小的差异。全对数模型中,1 可看作反映Y对X的弹性,即Y相对于X的百分比变化,这在实际分析中有较强的应用意义。,9,2.原模型变换法 对存在异方差的模型作适当的变量变换,使变换后的模型满足同方差假定,则可用OLS重新估计模型,得最佳线性无偏估计。模型的前提是要合理确定异方差性的具体形式,这可以通过对问题的经验分析,或用帕克检验,戈里瑟检验等方法所提供异方差的具体形式来确定。,10,设模型为:Yi=0+1Xi+I()扰动项i具有异方差性,由前面

5、Glejser检验知,异方差性与Xi的变化有关,且,2为常数,(Xi)为解释变量Xi的函数,当(Xi)=1时,为同方差;当(Xi)1时,为异方差。用 去乘原模型的两端得,11,记,则vi具有同方差性。事实上,函数(Xi)可以有不同的形式,Glejser检验提供了相应的信息。(Xi)一般取如下形式:,12,(1)(Xi)=Xi,则Var(i)=2 Xi。对原模型两端同除 得令,则 Var(vi)为同方差,因为,13,(2)(Xi)=Xi2,则Var(i)=2 Xi2。对原模型两端同除 得令,则 Var(vi)为同方差,因为,14,(3)(Xi)=(a0+a1Xi)2,则Var(i)=2(a0+a

6、1Xi)2。对原模型两端同除(a0+a1Xi)得令,则 Var(vi)为同方差,因为,15,注意:对原模型变换的方法与加权最小二乘法实际上是等价的,他们最多相差一个常数因子;对原模型变换后的拟合优度有可能变小,这是对样本观测值加权的结果。,16,3.加权最小二乘法(WLS)模型检验出存在异方差性,可用加权最小二乘法(Weighted Least Squares,WLS)进行估计。加权最小二乘法的基本思想:加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用OLS估计其参数。即对加了权重的残差平方和实施OLS法:,其中:Wi为权数,17,设Var(i)随X的递增而递增,则

7、:对较小的残差平方ei2赋予较大的权数;对较大的残差平方ei2赋予较小的权数。以更好地使ei2反映Var(i)对残差平方和的影响程度,从而改善参数估计的统计性质。设取权数Wi为1/i2(i=1,2,n),且i2越小Wi越大,i2越大Wi越小。因此,称为加权的残差平方和,运用最小二乘法得参数估计式:,18,其中,,这一求解参数估计的方法为加权最小二乘法。容易看出,当w1=w2=wn时,即对于每一个样本有相同的权数,则加权最小二乘估计式就是普通最小二乘估计式。,19,EViews中可直接进行加权最小二乘估计,但需要事先确定权数变量,这可以通过Park检验、Glejser检验等判断异方差的具体形式,

8、也可以选取某个与异方差变动趋势反向变动的变量序列,如1/|et|,1/et2等等。,20,EViews具体执行过程:(1)生成权数变量;(2)使用加权最小二乘法估计模型,命令和菜单两种方式。命令方式:LS(W=权数变量或表达式)Y C X菜单方式:在方程窗口中点击“Estimate”按钮;在弹出的方程说明对话框中点击“Option”进入参数设置对话框;在参数设置对话框中选定“Weighted LS”方法,并在权数变量栏中输入权数变量,然后点击“OK”返回方程说明对话框;点击“OK”,系统将采用WLS方法估计模型。(3)对估计后的模型,再使用White检验判断是否消除了异方差性。,21,对于模型

9、 Y=X+存在:,即存在异方差性。,显然W是一对称正定矩阵,故存在一可逆矩阵D使得:W=DD,4.广义最小二乘法(GLS),22,用D-1乘以方程:Y=X+的两边,得到一个新的模型:,该模型具有同方差性。因为,23,这就是原模型Y=X+的加权最小二乘估计量,是无偏、有效的估计量。,这里权矩阵为D-1,它来自于原模型残差项的方差-协方差矩阵2W。,24,如何得到2W?,从前面的推导过程看,它来自于原模型残差项的方差协方差矩阵。因此仍对原模型进行OLS估计,得到随机误差项的近似估计量,以此构成权矩阵的估计量,即,这时可直接以,作为权矩阵。,25,注意:,在实际操作中人们通常采用如下的经验方法:不对

10、原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。如果确实存在异方差,则被有效地消除了;如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法。,26,七、案例分析,案例1 我国城镇居民收入对通信交通支出的影响,27,七、案例分析,例 中国农村居民人均消费支出主要由人均纯收入来决定。农村人均纯收入包括:(1)从事农业经营的收入;(2)包括从事其他产业的经营性收入(3)工资性收入;(4)财产收入;(4)转移支付收入。考察从事农业经营的收入(X1)和其他收入(X2)对中国农村居民消费支出(Y)增长的影响,可用以下双对数模型:,案例2 中国农村居民人均消费函数,28,

11、29,普通最小二乘法的估计结果:,可看出:其他收入(不是农业经营收入)的增长,对农村人均消费支出的增长更有刺激作用。,30,异方差检验,从结果分析中可认为,不同地区农村人均消费支出的差别主要来源于非农经营收入和其他收入的差别。因此,如果存在异方差性,则可能是X2引起的。,31,图示检验法,表明存在单调递增型异方差,32,进一步的统计检验,(1)G-Q检验,将原始数据按X2排成升序,去掉中间的7个数据,得两个容量为12的子样本。对两个子样本分别作OLS回归,求各自的残差平方和RSS1和RSS2:,33,34,35,子样本1:,(3.18)(4.13)(0.94)R2=0.7068,RSS1=0.

12、0648,子样本2:,(0.43)(0.73)(6.53)R2=0.8339,RSS2=0.2729,36,计算F统计量:F=RSS2/RSS1=0.2792/0.0648=4.31,查表 给定=5%,查得临界值 F0.05(9,9)=3.18判断 F F0.05(9,9)否定两组子样方差相同的假设,从而该总体随机项存在递增异方差性。,37,(2)怀特检验,作辅助回归:,(-0.04(0.10)(0.21)(-0.12)(1.47),(-1.11)R2=0.4638,似乎没有哪个参数的t检验是显著的。但 n R2=31*0.4638=14.38=5%下,临界值,n R2 所以,拒绝同方差性的原

13、假设。,38,去掉交叉项后的辅助回归结果,(1.36)(-0.64)(064)(-2.76)(2.90)R2=0.4374,查表得临界值:所以,X2项与X2的平方项的参数的t检验是显著的,且 n R2=31 0.4374=13.56,=5%下,临界值 20.05(4)=9.49,因此,拒绝同方差的原假设。,39,原模型的加权最小二乘回归,对原模型进行OLS估计,得到随机误差项的近似估计量 i,以此构成权矩阵2W的估计量;再以1/|i|为权重进行WLS估计,得,可看出:各项统计检验指标全面改善,40,一、序列相关性概念二、实际经济问题中的序列相关性 三、序列相关性的产生原因及后果四、序列相关性的

14、检验五、案例,4.2 序列相关性,41,一、序列相关性概念,如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了序列相关性(Serial Correlation)。,对于模型 Yi=0+1X1i+2X2i+k X ki+i i=1,2,n,随机项互不相关的基本假设表现为 Cov(i,j)=0 i j,i,j=1,2,n,42,或,43,称为一阶序列相关,或一阶自相关(autocorrelation),或一阶自回归。,其中:被称为一阶自相关系数(first-order coefficient of autocorrelation),随机扰动项的序列相关可有多种形式

15、一阶序列相关形式即随机扰动项只与它的前一期值相关。如果仅存在 cov(t,t-1)E(t t-1)0 或 t=1,2,n,一阶自相关往往可写成如下形式:t=t-1+t-1 1,44,由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标t代表i。,p阶序列相关形式(模型存在p阶序列相关)t=1t-1+2t-2+p t-p+t 此为序列相关(自相关)的一般形式t是满足以下OLS基本假定的随机扰动项:,45,二、实际经济问题中的序列相关性,大多数经济时间数据都有一个明显的特点:惯性,表现在时间序列在不同时间的前后关联上。,由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(

16、往往是正相关)。,例如,绝对收入假设下居民总消费函数模型:Ct=0+1Yt+t t=1,2,n,1.经济变量固有的惯性,46,2.模型设定的偏误,所谓模型设定偏误(Specification error)是指所设定的模型“不正确”。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。,例如,本来应该估计的模型为 Yt=0+1X1t+2X2t+3X3t+t,但在模型设定中做了下述回归:Yt=0+1X1t+1X2t+vt,又如:现期消费水平(Ct)往往受到其上一期的影响,若放入U中即存在自相关。Ct=B0+B1Ct-1+B2Yt,47,因此,vt=3X3t+t,如果X3确实影响Y,则出现序列

17、相关。又如:如果真实的边际成本回归模型应为:Yt=0+1X1t+2X1t2+t其中:Y=边际成本,X=产出。但建模时设立了如下模型:Yt=0+1X1t+vt因此,由于vt=2X1t2+t,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。,48,3.数据的“编造”,例如:季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动性,从而使随机干扰项出现序列相关。,在实际经济问题中,有些数据是通过已知数据生成的。因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。,49,(一)产生原因 1.许多经济变量往往存在序列相关是因为其时间序列有一种惯性,呈现出时间趋势变化

18、,且其前后期总相关(如上例)。对这种经济变量(作为因变量)的模型作回归分析时,若其滞后量不作为解释变量,其影响必反映在随机扰动项u中,导致u 前后期的自相关。同时u中非重要解释变量之间的自相关,也可引起u的自相关。以上自相关也称“伪自相关”。,三、序列相关性的产生原因和后果,从一般经验讲,对于采用时间序列数据作样本的计量经济学问题,由于在不同样本点上解释变量以外的其他因素在时间上的连续性,带来它们对被解释变量的影响的连续性,所以往往存在序列相关性。,50,2。构造模型错误 如构造 Y=A+BX为线性,但实际应为曲线形式。错误的模型形式所产生对Y的系统影响带入u中,使u呈序列相关趋势。3。许多情

19、况下,u本身存在自相关性(“真正自相 关”)如生产过程中出现的偶然事故,天灾等,不仅影响生产,且影响以后的时期,从而导致自相关。,51,4.数据的处理方法 实际问题中,有时为需要,原始数据往往都经过拟合“编造”处理,即有些数据是通过已知数据生成的。故新原数据间的内在联系,表现出序列相关性。例如,季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动而引进了数据中的匀滑性,此匀滑性本身就能使随机扰动项中出现系统性的因素,从而出现序列相关性。当然原因还有很多,不一一列举。,52,1.参数估计量非有效,因为,在有效性证明中利用了 E(uu)=2I即同方差性和互相独立性条件。而且,在大样本

20、情况下,参数估计量虽然具有一致性,但仍然不具有渐近有效性。,(二)后果 计量经济学模型一旦出现序列相关性,如果仍采用OLS法估计模型参数,会产生下列不良后果:,53,2.变量的显著性检验失去意义,在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。如果存在序列相关,估计的参数方差 出现偏误(偏大或偏小),t检验就失去意义。,其他检验也是如此。,54,3.模型的预测失效,区间预测与参数估计量的方差有关,在方差(标准差)有偏误的情况下,使得预测估计不准确,预测精度降低。所以,当模型出现序列相关性时,它的预测功能失效。,55,然后,通

21、过分析这些“近似估计量”之间的相关性,以判断随机误差项是否具有序列相关性。,序列相关性各检验方法的基本思路都相同:,基本思路:,四、序列相关性的检验,检验方法多:如回归检验法、DW检验、冯诺曼比检验等,56,1.图示法,几种常用检验方法:,57,2.回归检验法,t=2,n,t=3,n,对方程估参并作显著性检验。,58,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。,回归检验法的优点是:(1)能够确定序列相关的形式。(2)适用于任何类型序列相关性问题的检验。但工作量大,计算复杂繁琐。,59,3.杜宾瓦森(Durbin-Watson,D-W)检验法,D-W检验是杜宾(J.D

22、urbin)和瓦森(G.S.Watson)于1951年提出的一种检验序列自相关的方法。该方法的假定条件是:,(1)解释变量X非随机;(2)随机误差项i为一阶自回归形式:i=i-1+i,60,(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式:Yi=0+1X1i+kXki+Yi-1+i(4)回归含有截距项,针对原假设:H0:=0,即不具有一阶自相关形式 对立假设:H1:0 即具有一阶自相关形式 为的自相关系数,且1构造如下统计量:,D.W.统计量:,61,该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精确的分布很难得到。但是,他们成功地导出了临界值的下限dL和上限dU

23、,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。注意:n15,62,D.W检验步骤:,(1)计算DW值(2)给定显著性水平,由n和k的大小查DW分 布表,得临界值的下限dL和上限dU(3)比较、判断:,若 0D.W.dL 存在正自相关(否定H0)dLD.W.dU 不能确定 dU D.W.4dU 无自相关(接受H0)4dU D.W.4 dL 不能确定 4dL D.W.4 存在负自相关(否定H0),63,当D.W.值在2左右时,模型不存在一阶自相关。,64,证明:展开D.W.统计量:,(*),当n较大时,大致相等,则(*)可简化为:,65,如果存在完全一阶正相关,即

24、=1,则 D.W.0 完全一阶负相关,即=-1,则 D.W.4 完全不相关,即=0,则 D.W.2 只有当无自相关时,DW检验通过,模型才可用于预测;否则,若DW未检验通过,应分析原因重建模型,直至DW检验通过。例:,这里,,为样本自相关系数 的估计值。,66,方法缺陷:(1)存在不确定域(无结论域)不确定域大小与样本容量n和解释变量个数k有关,当n一定时,随着k的增大,则不确定域越大;当k一定时,随着n的增大,则不确定域越小;若DW值落在不确定域,则不能作回归模型是否存在自相关的结论。解决:1)增加样本容量n,重新做DW检验。2)调换新的样本,重新做DW检验。3)其他自相关检验(2)只能检验一阶自相关,对存在滞后被解释变量的模型无法检验。,67,注意:DW检验不适用于模型中含有滞后的被解释变量。如:此时即使模型存在自相关,DW也常接近于2,但包含随机解释变量的序列相关不能用DW检验。针对此类模型,Durbin又提出了Durbin-h检验统计量:其中 是Yt-1系数的估计方差。Durbin已经证明:h统计量近似服从标准正态分布,故利用正态分布可对一阶自相关直接作检验。h检验步骤:估计模型:LS Y C X Y(-1)由输出结果计算 h统计量由显著性水平a,查正态分布临界值表,如果|h|za/2,拒绝=0的假设,即认为存在一阶自相关。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号