《异方差性的后果课件.ppt》由会员分享,可在线阅读,更多相关《异方差性的后果课件.ppt(75页珍藏版)》请在三一办公上搜索。
1、,异方差性及序列相关性,2016年月,一、异方差的定义二、异方差的类型三、实际经济问题中的异方差性四、异方差性的后果五、异方差性的检验六、异方差的修正七、案例,目录,第一部分:异方差性,一、异方差的定义,异方差性主要发生在横截面数据的情况,时间序列问题中一般不会发生,除非时间跨度过大。,一、异方差的定义,产生异方差的原因、模型中遗漏了某些解释变量、模型函数形式的设定误差、样本数据的测量误差、随机因素的影响,二、异方差的类型,同方差性假定:i2=常数 f(Xi)异方差时:i2=f(Xi),异方差一般可归结为三种类型:(1)单调递增型:i2随X的增大而增大(2)单调递减型:i2随X的增大而减小(3
2、)复 杂 型:i2与X的变化呈复杂形式,二、异方差的类型,三、实际经济问题中的异方差性,例1.1:截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+iYi:第i个家庭的储蓄额 Xi:第i个家庭的可支配收入,高收入家庭:储蓄的差异较大 低收入家庭:储蓄则更有规律性,差异较小i的方差呈现单调递增型变化,例1.2,以绝对收入假设为理论假设、以截面数据为样本建立居民消费函数:Ci=0+1Yi+i,将居民按照收入等距离分成n组,取组平均数为样本观测值。一般情况下,居民收入服从正态分布:中等收入组人数多,两端收入组人数少。而人数多的组平均数的误差小,人数少的组平均数的误差大。所以样本观测值的观测误差随着
3、解释变量观测值的不同而不同,往往引起异方差性。,三、实际经济问题中的异方差性,例1.3,以某一行业的企业为样本建立企业生产函数模型 Yi=Ai1 Ki2 Li3ei,被解释变量:产出量Y 解释变量:资本K、劳动L、技术A,那么:每个企业所处的外部环境对产出量的影响被包含在随机误差项中。每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。,三、实际经济问题中的异方差性,四、异方差性的后果,计量经济学模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:,1、参数估计量非有效,
4、OLS估计量仍然具有无偏性,但不具有有效性,因为在有效性证明中利用了 E()=2I,而且,在大样本情况下,尽管参数估计量具有一致性,但仍然不具有渐近有效性。,2、变量的显著性检验失去意义,变量的显著性检验中,构造了t统计量,其他检验也是如此。,3、模型的预测失效,一方面,由于上述后果,使得模型不具有良好的统计性质;,所以,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。,五、异方差性的检验,检验思路:,由于异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:检验异方差性,也就是检验随机误差项的方差与解释变量观测值
5、之间的相关性及其相关的“形式”。,问题在于用什么来表示随机误差项的方差,一般的处理方法:,几种异方差的检验方法:,1、图示法,(1)用X-Y的散点图进行判断 看是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中),看是否形成一条斜率为零的直线,2、帕克(Park)检验与戈里瑟(Gleiser)检验,基本思想:偿试建立方程:,或,选择关于变量X的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。如:帕克检验常用的函数形式:,或,若在统计上是显著的,表明存在异方差性。,3、戈德菲尔德-匡特(Goldfeld-Quan
6、dt)检验,G-Q检验以F检验为基础,适用于样本容量较大、异方差递增或递减的情况。,G-Q检验的思想:先将样本一分为二,对子样和子样分别作回归,然后利用两个子样的残差平方和之比构造统计量进行异方差检验。由于该统计量服从F分布,因此假如存在递增的异方差,则F远大于1;反之就会等于1(同方差)、或小于1(递减方差)。,G-Q检验的步骤:,将n对样本观察值(Xi,Yi)按观察值Xi的大小排队将序列中间的c=n/4个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为(n-c)/2对每个子样分别进行OLS回归,并计算各自的残差平方和,在同方差性假定下,构造如下满足F分布
7、的统计量,给定显著性水平,确定临界值F(v1,v2),若F F(v1,v2),则拒绝同方差性假设,表明存在异方差。当然,还可根据两个残差平方和对应的子样的顺序判断是递增型异方差还是递减异型方差。,3、怀特(White)检验,怀特检验不需要排序,且适合任何形式的异方差 怀特检验的基本思想与步骤(以二元为例):,然后做如下辅助回归,可以证明,在同方差假设下:,(*),R2为(*)的可决系数,h为(*)式解释变量的个数,,表示渐近服从某分布。,注意:,辅助回归仍是检验与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。如果存在异方差性,则表明确与解释变量的某种组合有显著的相
8、关性,这时往往显示出有较高的可决系数以及某一参数的t检验值较大。当然,在多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有时可去掉交叉项。,六、异方差的修正,模型检验出存在异方差性,可用加权最小二乘法(Weighted Least Squares,WLS)进行估计。,加权最小二乘法的基本思想:加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用OLS估计其参数。,在采用OLS方法时:对较小的残差平方ei2赋予较大的权数,对较大的残差平方ei2赋予较小的权数。,例如,如果对一多元模型,经检验知:,新模型中,存在,即满足同方差性,可用OLS法估计。,一般
9、情况下:,对于模型 Y=X+,存在,即存在异方差性。,W是一对称正定矩阵,存在一可逆矩阵D使得 W=DD,用D-1左乘 Y=X+两边,得到一个新的模型:,该模型具有同方差性。因为,这就是原模型 Y=X+的加权最小二乘估计量,是无偏、有效的估计量。,这里权矩阵为D-1,它来自于原模型残差项的方差-协方差矩阵2W。,如何得到2W?,从前面的推导过程看,它来自于原模型残差项的方差-协方差矩阵。因此 仍对原模型进行OLS估计,得到随机误差项的近似估计量i,以此构成权矩阵的估计量,即,这时可直接以,作为权矩阵。,注意:,在实际操作中人们通常采用如下的经验方法:不对原模型进行异方差性检验,而是直接选择加权
10、最小二乘法,尤其是采用截面数据作样本时。如果确实存在异方差,则被有效地消除了;如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法,七、案例-中国农村居民人均消费函数,例1.4 中国农村居民人均消费支出主要由人均纯收入来决定。农村人均纯收入包括(1)从事农业经营的收入,(2)包括从事其他产业的经营性收入(3)工资性收入、(4)财产收入(5)转移支付收入。考察从事农业经营的收入(X1)和其他收入(X2)对中国农村居民消费支出(Y)增长的影响:,普通最小二乘法的估计结果:,异方差检验,递增型的异方差,进一步的统计检验,(1)G-Q检验,将原始数据按X2排成升序,去掉中间的7个数据,得两个容量为
11、12的子样本。对两个子样本分别作OLS回归,求各自的残差平方和RSS1和RSS2:,子样本1:,(3.18)(4.13)(0.94)R2=0.7068,RSS1=0.0648,子样本2:,(0.43)(0.73)(6.53)R2=0.8339,RSS2=0.2729,计算F统计量:F=RSS2/RSS1=0.2792/0.0648=4.31,查表 给定=5%,查得临界值 F0.05(9,9)=2.97判断 F F0.05(9,9)否定两组子样方差相同的假设,从而该总体随机项存在递增异方差性。,(2)怀特检验,作辅助回归:,(-0.04)(0.10)(0.21)(-0.12)(1.47),(-1
12、.11)R2=0.4638,似乎没有哪个参数的t检验是显著的。但 n R2=31*0.4638=14.38=5%下,临界值 20.05(5)=11.07,拒绝同方差性,原模型的加权最小二乘回归,对原模型进行OLS估计,得到随机误差项的近似估计量i,以此构成权矩阵2W的估计量;再以1/|i|为权重进行WLS估计,得,各项统计检验指标全面改善,去掉交叉项后的辅助回归结果,(1.36)(-0.64)(064)(-2.76)(2.90)R2=0.4374,X2项与X2的平方项的参数的t检验是显著的,且 n R2=31 0.4374=13.56,=5%下,临界值 20.05(4)=9.49 拒绝同方差的
13、原假设,一、序列相关性概念二、实际经济问题中的序列相关性 三、序列相关性的后果四、序列相关性的检验五、具有序列相关性模型的估计,第二部分:序列相关性,一、序列相关性概念,如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性Cov(i,j)0 则认为出现了序列相关性,即 是相关的,对于模型 Yi=0+1X1i+2X2i+k Xki+i i=1,2,n,随机项互不相关的经典假设为:Cov(i,j)=0 ij,i,j=1,2,n,其中:被称为一阶自相关系数(first-order coefficient of autocorrelation),自相关往往可写成如下形式:i=i-1+
14、i-11,序列相关性经常出现在以时间序列为样本的模型中,例1 1985-2003年中国农村居民人均收入和消费,n阶自相关,1985-2003年中国农村居民人均收入和消费的残差图,中国上证指数2008年11月3日,二、序列相关性产生的原因,大多数经济时间数据都有一个明显的特点:惯性,表现在时间序列不同时间的前后关联上。,由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关)。空间自相关,例如,绝对收入假设下居民总消费函数模型:Ct=0+1Yt+t t=1,2,n,1、经济变量固有的惯性,2、模型设定的偏误,所谓模型设定偏误(Specification error)是指所设定
15、的模型“不正确”。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。,例如,本来应该估计的模型为 Yt=0+1X1t+2X2t+3X3t+t,但在模型设定中做了下述回归:Yt=0+1X1t+2X2t+vt,因此,vt=3X3t+t,由于X3t在时间上是相关的,则ut出现序列相关。,但建模时设立了如下模型:Yt=0+1Xt+vt 由于vt=2Xt2+t,,包含了产量的平方对随机项的系统性影响,因此Xt2的相关性就会转移到随机误差项,造成随机项也呈现序列相关性。,又如:如果真实的边际成本回归模型应为:Yt=0+1Xt+2Xt2+t其中:Y=边际成本,X=产量,,X,Y,3、经济变量的滞后效
16、应,例如:消费函数:CtYt+Ct-1+ut 货币政策:Yt=M+Mt-1+ut u*=Ct-1+ut v*=Mt-1+ut,在实际经济问题中,有些变量对其他变量的影响不仅局限在当期,而是延续若干期。因此,变量的影响反映在误差项中,表现出序列相关性,计量经济学模型一旦出现序列相关性,如果仍采用OLS法估计模型参数,会产生下列不良后果:,三、序列相关性的后果,1、参数估计量非有效,在一元线性模型中,参数估计量虽然具有无偏性,但仍然不具有渐近有效性,通常会低估参数的方差(0),2、变量的显著性检验失去意义,在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差
17、性和互相独立性时才能成立。如果存在序列相关,模型参数的估计方差会被低估,从而高估t检验值,t检验就失去意义,F检验也是如此,3、模型的预测失效,区间预测与参数估计量的方差有关,在方差有偏误的情况下(低估),使得预测估计不准确,预测精度降低。所以,当模型出现序列相关性时,它的预测功能失效,存在自相关,随机误差的方差估计:,经典模型随机误差项的方差估计:,然后,通过分析这些“近似估计量”之间的相关性,以判断随机误差项是否具有序列相关性。,序列相关性检验方法有多种,但基本思路相同:,基本思路:,四、序列相关性的检验,1、图示法例2美国个人实际可支配收入和个人实际消费收入,2、回归检验法例题3 北京市
18、城镇居民家庭人均收入与支出,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。,回归检验法的优点是:(1)能够确定序列相关的形式;(2)适用于任何类型序列相关性问题的检验,3、杜宾-瓦森(Durbin-Watson)检验法,D-W检验是杜宾(J.Durbin)和瓦森(G.S.Watson)于1951年提出的一种检验序列自相关的方法,该方法的假定条件是:,(1)解释变量X非随机;(2)随机误差项i为一阶自回归形式:i=i-1+i(3)回归模型中不应含有滞后因变量作为解释变量,即不应出现下列形式:Yi=0+1X1i+kXki+Yi-1+i(4)回归含有截距项,D-W检验最大优点
19、是简单易行,它以OLS残差为基础,而许多软件包都可以对残差进行计算。通常,统计结果在给出t值、F值、R2值的同时,也给出了d 值。Eviews软件用Durbin-Watson stat表示,杜宾和瓦森针对原假设:H0:=0,即不存在一阶自回归,构如下造统计量:,D.W.统计量:,如果存在完全一阶正相关,即=1,则 D.W.0 完全一阶负相关,即=-1,则 D.W.4 完全不相关,即=0,则 D.W.2,其中,,为一阶自回归模型 i=i-1+i 的参数估计。,例题4 日本工薪家庭实际消费支出与实际可支配收入,假设有,(1)计算DW值(2)给定,由n和k的大小查DW分布表,得临界值dL和dU(3)
20、比较、判断,若 0D.W.dL 存在正自相关 dLD.W.dU 不能确定 dU D.W.4dU 无自相关 4dU D.W.4 dL 不能确定 4dL D.W.4 存在负自相关,0 dL dU 2 4-dU 4-dL,正相关,不能确定,无自相关,不能确定,负相关,D.W检验步骤:,d值从0到2,从2到4,自相关性是在变化的,由完全一阶正相关到无一阶自相关,再由无一阶自相关逐步过度到存在完全一阶负相关。这里一定存在一些临界值点作为转折。Durbin和 Watson建立了d统计量检验的上限临界值du和下限临界值dL,他们与样本容量及解释变量的个数有关。有了这两个临界值之后,可以确定判断一阶自回归的区
21、域:,如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型。,最常用的方法是:广义差分法(Generalized Difference)科克伦-奥科特(Cochrane-Orcutt)迭代法 杜宾(durbin)两步法,五、序列相关的补救,1、广义差分法,广义差分法是将原模型变换为满足OLS法的差分模型,再进行OLS估计。,如果原模型,存在,可以将原模型变换为:,(1),(2),(1)式-(2)式,符合经典假定,新的随机误差项,令,估计新模型,2、随机误差项相关系数的估计,应用广义最小二乘法或广义差分法,必须已知随机误差项的相关系数1,2,L。实际上,人们并不知道它们的具体数值,所以必
22、须首先对它们进行估计。常用的估计方法有:,DW法 科克伦-奥科特(Cochrane-Orcutt)迭代法。杜宾(durbin)两步法,(1)D.W.方法,把代入广义差分方程,进行最小二乘估计OLS,(2)科克伦-奥科特迭代法例题5 1978-2001年中国国内生产总值和进口额,首先,采用OLS法估计原模型 Yi=0+1Xi+i得到的的“近似估计值”,并以之作为观测值使用OLS法估计下式 i=1i-1+2i-2+Li-L+i,求出i新的“近拟估计值”i(2),并以之作为样本观测值,再次估计,i(2)=1i-1+2i-2+Li-L+i,类似地,可进行第三次、第四次迭代,一般是事先给出一个精度,当相
23、邻两次1,2,L的估计值之差小于这一精度时,迭代终止。比如i(n)-i(n-1)0.001 实践中,有时只要迭代两次,就可得到较满意的结果。两次迭代过程也被称为科克伦-奥科特两步法。,Eviews软件中的广义差分法,在Eview/TSP软件包下,广义差分采用了科克伦-奥科特(Cochrane-Orcutt)迭代法估计。在解释变量中引入AR(1)、AR(2)、,即可得到参数和1、2、的估计值。其中AR(m)表示随机误差项的m阶自回归。在估计过程中自动完成了1、2、的迭代。,(3)杜宾(durbin)两步法,该方法仍是先估计1,2,l,再对差分模型进行估计,第一步,变换差分模型为下列形式,将上式当
24、作多元线性模型,进行最小二乘估计,得到Yj(j=i-1,i-2,i-l)前的系数1,2,l的估计值,案例5:1978-2001年中国国内生产总值和进口额,经济理论指出,商品进口主要由进口国的经济发展水平,以及商品进口价格指数与国内价格指数对比因素决定的。由于无法取得中国商品进口价格指数,我们主要研究中国商品进口与国内生产总值的关系。(下表),1.通过OLS法建立如下中国商品进口方程:,(2.32)(20.12),2.进行序列相关性检验,3、运用Durbin两步法进行自相关的处理,采用杜宾两步法估计 第一步,估计模型,(1.76)(6.64)(-1.76)(5.88)(-5.19)(5.30),第二步,作差分变换:,则M*关于GDP*的OLS估计结果为:,(2.76)(16.46),取=5%,DWdu=1.43(样本容量24-2=22)表明:已不存在自相关,于是原模型为:,与OLS估计结果的差别只在截距项:,谢 谢!,