异方差性的概念、类型、后果、检验及其修正方法(含案例).ppt

资源描述

《异方差性的概念、类型、后果、检验及其修正方法(含案例).ppt》由会员分享，可在线阅读，更多相关《异方差性的概念、类型、后果、检验及其修正方法(含案例).ppt（72页珍藏版）》请在三一办公上搜索。

1、在教材P29-32和P64-65，分别对一元和多元线性回归模型提出了若干基本假设，只有在满足这些基本假设的情况下，应用普通最小二乘法才能得到无偏的、有效的参数估计量。但是，在实际的计量经济学问题中，完全满足这些基本假设的情况并不多见。如果违背了某一项基本假设，那么应用普通最小二乘法估计模型所得参数估计量就可能不具有某些优良特性，这就需要发展新的方法估计模型。本章正是要讨论违背了某一项基本假设的问题及其估计方法。,引言,异方差性Heteroscedasticity,一、异方差性的概念及类型二、异方差性的后果三、异方差性的检验四、异方差的修正五、案例,1.什么是异方差？,对于模型,（i=1,2,

2、n）,同方差性假设为,（i=1,2,n）,如果出现,（i=1,2,n）,即对于不同的样本点i，随机误差项的方差不再是常数，则认为出现了异方差性。,注意：对于每一个样本点i，随机误差项i都是随机变量，服从均值为0的正态分布；而方差i2衡量的是随机误差项围绕其均值0的分散程度。所以，所谓异方差性，是指这些服从正态分布的随机变量围绕其均值0的分散程度不同。,一、异方差性的概念及类型,异方差性示意图,或者，也可以说，对于每一个样本点i，随机误差项的方差i2衡量的是被解释变量的观测值Yi围绕回归线E(Yi)=0+1Xi1+kXik的分散程度。而所谓异方差性，是指被解释变量观测值的分散程度随样本点的不同而

3、不同。【庞皓P130】,2.异方差的类型,同方差性假定是指，每个i围绕其0均值的方差并不随解释变量Xi的变化而变化，不论解释变量的观测值是大还是小，每个i的方差保持相同，即 i2=常数（i=1,2,n）,在异方差的情况下，i2已不是常数，它随Xi的变化而变化，即 i2=f(Xi)（i=1,2,n）,异方差一般可以归结为三种类型：,（1）单调递增型：i2=f(Xi)随Xi的增大而增大；（2）单调递减型：i2=f(Xi)随Xi的增大而减小；（3）复杂型：i2=f(Xi)随Xi的变化呈复杂形式。,3.实际经济问题中的异方差性,在该模型中，i的同方差假定往往不符合实际情况。对高收入家庭来说，储蓄的差异

4、较大；低收入家庭的储蓄则更有规律性（如为某一特定目的而储蓄），差异较小。因此，i的方差往往随Xi的增加而增加，呈单调递增型变化。,例4.1.1：在截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+i Yi和Xi分别为第i个家庭的储蓄额和可支配收入。,一般情况下：居民收入服从正态分布，处于中等收入组中的人数最多，处于两端收入组中的人数最少。而人数多的组平均数的误差小，人数少的组平均数的误差大。所以样本观测值的观测误差随着解释变量观测值的增大而先减后增。,例4.1.2：以绝对收入假设为理论假设、以分组数据（将居民按照收入等距离分成n组，取组平均数为样本观测值）作样本建立居民消费函数：Ci=0+1

5、Yi+i,如果样本观测值的观测误差构成随机误差项的主要部分，那么对于不同的样本点，随机误差项的方差随着解释变量观测值的增大而先减后增（U形），出现了异方差性。,例4.1.3：以某一行业的企业为样本建立企业生产函数模型 Yi=Ai1 Ki2 Li3ei产出量为被解释变量，选择资本、劳动、技术等投入要素为解释变量，那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。,由于每个企业所处的外部环境对产出量的影响程度不同，造成了随机误差项的异方差性。,这时，随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化，为复杂型的一种。,规律,一般经验告诉人们：对于采用截面数据作样本的计量经

6、济学问题，由于在不同样本点（即不同空间）上解释变量以外的其他因素的差异较大，所以往往存在异方差性。,1.参数估计量非有效,当计量经济学模型出现异方差性时，其普通最小二乘法参数估计量仍然具有无偏性，但不具有有效性。而且，在大样本情况下，参数估计量仍然不具有渐近有效性。,即同方差和无序列相关条件。,因为在有效性证明（见教材P70-71）中利用了,二、异方差性的后果,2.变量的显著性检验失去意义,在变量的显著性检验中，t统计量,（j=0,1,2,k）,如果出现了异方差性，而仍按同方差时的公式计算t统计量，将使t统计量失真【偏大或偏小，见第三版P110补充说明】，从而使t检验失效【使某些原本显著的解释

7、变量可能无法通过显著性检验，或者使某些原本不显著的解释变量可能通过显著性检验】。,3.模型的预测失效,一方面，由于上述后果，使得模型不具有良好的统计性质；,所以，当模型出现异方差性时，Y预测区间的建立将发生困难，它的预测功能失效。,其中,【书上这句话有点问题】,1.检验方法的共同思路,既然异方差性就是相对于不同的解释变量观测值，随机误差项具有不同的方差，那么：检验异方差性，也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。各种检验方法正是在这个共同思路下发展起来的。,三、异方差性的检验（教材P111）,问题在于：用什么来表示随机误差项的方差？,一般的处理方法：,2.图示

8、检验法,（1）用X-Y的散点图进行判断（李子奈P108）,看是否存在明显的散点扩大、缩小或复杂型趋势（即不在一个固定的带型域中）。,随机误差项的方差描述的是取值的离散程度。而由于被解释变量Y与随机误差项有相同的方差，所以利用Y与X之间的相关图形也可以粗略地看出的离散程度与X之间是否有相关关系。,看是否形成一条斜率为零的直线。,（教材P111）,3.戈里瑟（Gleiser）检验与帕克（Park）检验,戈里瑟检验与帕克检验的思想：,如果存在某一种函数形式，使得方程显著成立，则说明原模型存在异方差性。,由于f(Xj)的具体形式未知，因此需要选择各种形式进行试验。,4.戈德菲尔德-匡特（Goldfel

9、d-Quandt）检验,G-Q检验以F检验为基础，仅适用于样本容量较大、异方差为单调递增或单调递减的情况。,G-Q检验的思想：先按某一被认为有可能引起异方差的解释变量对样本排序，再将排序后的样本一分为二，对子样本和子样本分别进行OLS回归，然后利用两个子样本的残差平方和之比构造F统计量进行异方差检验。,G-Q检验的步骤：,将n对样本观察值(Xi1,Xi2,Xik,Yi)按某一被认为有可能引起异方差的解释变量观察值Xij的大小排队。将序列中间的c=n/4个观察值除去，并将剩下的观察值划分为较小与较大的容量相同的两个子样本，每个子样本的样本容量均为(n-c)/2。,检验。给定显著性水平，确定F分布

10、表中相应的临界值F（1，2）。若FF（1，2），则拒绝H0，认为存在异方差；反之，则不存在异方差。,H0成立，意味着同方差；H1成立，意味着异方差。,5.怀特(White)检验,G-Q检验需按某一被认为有可能引起异方差的解释变量对样本排序，而且只能检验单调递增或单调递减型异方差；怀特(White)检验则不需要排序，且对任何形式的异方差都适用。,怀特(White)检验的基本思想与步骤,下面，以二元回归为例，说明怀特检验的基本思想与步骤：,设回归模型为：,首先，对该模型做普通最小二乘回归，记残差为：,然后，以上述残差的平方为被解释变量，以原模型中各解释变量的水平项、平方项（还可以有更高次项）、交叉

11、项等各种组合为解释变量，做如下的辅助回归：,则在同方差性假设下【也即H0：1=5=0】，该辅助回归方程的可决系数R2与样本容量n的乘积渐近地服从自由度=辅助回归方程中解释变量个数【该例=5】的2分布：,怀特(White)检验的EViews软件操作要点,在OLS的方程对象Equation中，选择View/Residual tests/White Heteroskedasticity。在选项中，EViews提供了包含交叉项的怀特检验“White Heteroskedasticity（cross terms）”和没有交叉项的怀特检验“White Heteroskedasticity（no cross

12、 terms）”这样两个选择。软件输出结果：最上方显示两个检验统计量：F统计量和White统计量nR2；下方则显示以OLS的残差平方为被解释变量的辅助回归方程的回归结果。以教材P118的例子为例，包含交叉项的怀特检验“White Heteroskedasticity（cross terms）”的输出结果为：,怀特检验的软件输出界面：,可见，怀特统计量nR2=20.55085【=31 0.662931】，大于自由度【也即辅助回归方程中解释变量的个数】为5的2分布临界值11.07，因此，在5%的显著性水平下拒绝同方差的原假设。,四、异方差的修正,加权最小二乘法（weighted least squ

13、ares）异方差稳健标准误法（heteroscedasticity robust standard error）,1.加权最小二乘法的基本思想,加权最小二乘法（Weighted Least Squares）：是对原模型加权，使之变成一个新的不存在异方差性的模型，然后采用普通最小二乘法估计其参数。例如：在递增的异方差下，与较小的Xi对应的Yi离回归线较近，残差ei较小；而与较大的Xi对应的Yi离回归线较远，残差ei较大。为了更可靠地估计总体回归函数，我们应该给那些紧密围绕其（总体）均值的观测值较大的权数，而给那些远离其均值的观测值较小的权数。古扎拉蒂P355,（一）加权最小二乘法,于是，我们可以

14、对较小的残差平方ei2赋予较大的权数，对较大的残差平方ei2赋予较小的权数。加权最小二乘法就是对加了权重的残差平方和实施OLS法：,最小,例如：如果在检验过程中已经知道：,2.一个例子（重要！）,i=1,2,n,在该模型中，存在,即满足同方差性。,这就是加权最小二乘法。,在这里，权数为。,注意：将这里的权数平方之后，才是对残差平方加权的权数。,【第三版P114补充】可见，实施加权最小二乘法的关键是寻找适当的“权”，或者说寻找模型中随机干扰项的方差与解释变量间的适当的函数形式。如果发现,那么，加权最小二乘法的“权”即为,（注意：其中的2完全可以是1）,注意：这里的“权”仍然是指用来乘原模型两边

15、的“权”，相当于对原模型的残差ei加权。将这里的权数平方之后，才是对原模型的残差平方ei2加权的权数。,那么，可以用作为权数，去乘原模型的两边，得到下面的模型：,补充,特别地，如果像教材P111(4.1.4)式那样，近似地有,该模型满足同方差性，可以用普通最小二乘法估计：,i=1,2,n,Eviews软件中的加权最小二乘法（WLS）正是这样设计的：（）,所以，Eviews软件中WLS法的“权”，是指对原模型两边加权的“权”，而不是对原模型的残差平方ei2加权的权数。,3.一般情况（只需了解其思想。第三版已删掉，跳过）,对于模型,Y=XB+N,如果存在,其中,即存在异方差性：Var(i)=2w

16、i（i=1,2,n）,补充：设A为一个实系数对称矩阵，如果对任何一个非零实向量X，都使二次型XAX正定（也即大于0），那么A称为正定矩阵。,那么，由于W是一正定矩阵，存在一个可逆矩阵D，使得,显然,记作,该模型具有同方差性：,因为,用D-1左乘原模型Y=XB+N两边，可以得到一个新的模型：,这就是原模型的加权最小二乘估计量，它是无偏、有效的。,于是，可以用普通最小二乘法估计新模型，得到参数估计量，为：,这里权矩阵为D-1，它来自于矩阵W。,4.如何得到权矩阵D-1？,从上述推导过程可以看出，D-1来自于原模型的随机误差项N的方差-协方差矩阵Var-Cov(N)=2W，因此仍然可以对原模型首先采

17、用OLS法，得到随机误差项的近似估计量，以此构造W的估计量，进而得到权矩阵D-1。,即（假定2=1，这是完全可以的）,总结：加权最小二乘法的具体步骤（）,注意：用手工加权得到WLS法的结果，即先用GENR命令生成新序列E（残差的绝对值）及YE（即Y/E）、CE（即1/E）、XE（即X/E），然后用OLS法估计，得到WLS法的结果。要求能写出有关的命令格式。,注意,在实际建模过程中，人们通常并不对原模型进行异方差性检验，而是直接选择加权最小二乘法，尤其是采用截面数据作样本时。如果确实存在异方差，则被有效地消除了；如果不存在异方差，则加权最小二乘法等价于普通最小二乘法。,1.异方差稳健标准误法的

18、基本思想,异方差稳健标准误法（heteroscedasticity robust standard error）：该方法由怀特（White）于1980年提出，是指先采用普通最小二乘法估计原模型，然后用残差的平方作为相应的随机误差项方差的代表，对参数估计量的方差或标准误差进行修正。见教材P115-116。不要求，从略。,（二）异方差稳健标准误法,五、案例1（补充）某地区居民储蓄模型,某地区31年来居民收入与储蓄额数据表,1.普通最小二乘估计,直接使用OLS法，得到：,（-5.87）,（18.04）,R2=0.9182,2.异方差检验,（1）图示检验,G-Q检验【这里没有按X排序，是因为X是逐年增

19、大的】,求两个子样本（n1=n2=12）回归方程的残差平方和RSS1与RSS2；,计算F统计量,F=RSS2/RSS1=769899.2/162899.2=4.726,查表在5%的显著性水平下，第1和第2自由度均为（31-7）/2-2=10的F分布临界值为 F0.05(10,10)=2.97 由于 F=4.726 F0.05(10,10)=2.97因此，否定两组子样本的方差相同的假设，从而该总体随机误差项存在递增型异方差。,Park检验,显然，lnXi前的参数在统计上是显著的，表明原模型存在异方差。,3.异方差模型的估计,与OLS估计结果相比较，拟合效果更差。,为什么？,关于异方差形式的假定

20、可能存在问题。,与OLS估计结果相比较，拟合效果更好。,五、案例2（补充）中国消费函数模型,中国消费函数模型（二元回归）,根据消费模型的一般形式，选择消费总额为被解释变量，国内生产总值和前一年的消费总额为解释变量，变量之间关系为简单线性关系，选取1981年至1996年统计数据为样本观测值。,中国消费数据表单位：亿元,1.OLS估计结果,2.WLS估计结果,注：这里的权数E（也可以用别的符号）为OLS估计的残差项的绝对值的倒数。,3.比较,R2:0.999739 0.999999F:28682 980736e2:438613 29437 t:6.4 22.0 4.2 25.2 134.1 22

21、.9D.W.:1.45 1.81各项统计检验指标全面改善!,五、案例3中国农村居民人均消费函数模型,见第三版教材P116-120例4.1.4，也是一个非常好的案例（仅仅是把第二版的2001年数据替换成了2006年的数据）。主要的EViews软件输出结果如下：,全样本的OLS回归,软件操作：create u 1 31data y x1 x2,genr lny=log(y)genr lnx1=log(x1)genr lnx2=log(x2)ls lny c lnx1 lnx2,怀特检验的软件输出界面：,可见，怀特统计量nR2=20.55085【=31 0.662931】，大于自由度【也即辅助回归方

22、程中解释变量的个数】为5的2分布临界值11.07，因此，在5%的显著性水平下拒绝同方差的原假设。,在OLS方程对象窗口中，选择view/Residual test/White Heteroskedasticity。Eviews提供了包含交叉项的怀特异方差检验“White Heteroskedasticity（cross terms）”和没有交叉项的怀特异方差检验“White Heteroskedasticity（no cross terms）”这样两个选项。,按lnx2排序后，子样本1的OLS回归,按lnx2排序的操作：data T（用于还原）sort lnx2,子样本1的操作：smpl 1

23、12ls lny c lnx1 lnx2,按lnx2排序后，子样本2的OLS回归,子样本2的操作：smpl 20 31ls lny c lnx1 lnx2,将数据还原（包括样本区间还原、数据顺序还原），再采用WLS法回归,其中，w=1/abs(resid),数据还原的操作：smpl 1 31sort T,WLS的软件操作：ls lny c lnx1 lnx2genr w=1/abs(resid)然后，用菜单实现WLS,手工加权的回归结果,其中，E=abs(resid)，LNYE=LNY/E，CE=1/E，LNX1E=LNX1/E，LNX2E=LNX2/E,软件操作：smpl 1 31sort

24、Tls lny c lnx1 lnx2genr e=abs(resid),genr lnye=lny/egenr ce=1/egenr lnx1e=lnx1/egenr lnx2e=lnx2/els lnye ce lnx1e lnx2e,线性回归模型的基本假定(见教材P64-65),（2）解释变量Xj是确定性变量，不是随机变量，在重复抽样中取固定值；解释变量之间不存在严格的线性相关性（无完全多重共线性）。（3）各个解释变量Xj在所抽取的样本中具有变异性，而且随着样本容量的无限增加，各个解释变量Xj的样本方差趋于一个非零的有界常数Qj。即当n时，,（1）回归模型是正确设定的。,为使参数的普通最

25、小二乘估计量具有良好的统计性质，对多元线性回归模型提出下列基本假定：,（4）随机误差项具有零均值和同方差；随机误差项在不同样本点之间是独立的，不存在序列相关：E(i)=0 i=1,2,n Var(i)=2 i=1,2,n Cov(i,j)=0 ij i,j=1,2,n,注意：严格讲，这里应该是条件期望、条件方差和条件协方差的形式。教材P65指出：这里的条件期望、条件方差和条件协方差均可以简写为非条件的形式。,（5）随机误差项与解释变量之间不相关：Cov(Xij,i)=0 i=1,2,n；j=1,2,k（6）随机误差项服从零均值、同方差、零协方差的正态分布：iN(0,2)i=1,2,n,注意：以

26、上假设也称为线性回归模型的经典假设或高斯（Gauss）假设。满足这些假设的线性回归模型，也称为经典线性回归模型（Classical Linear Regression Model,CLRM）。在经典假设下，,严格讲，这里也应该是条件协方差形式。,严格讲，这里也应该是条件分布形式。,线性回归模型的基本假定（矩阵形式）,关于多元线性回归模型的基本假定26，也可以写成矩阵形式。见教材P64-65，一定要熟记。如：,秩(X)=k+1，即Xn(k+1)为列满秩矩阵。,线性回归模型的基本假定（矩阵形式）,线性回归模型的基本假定（矩阵形式）,返回,举例：变量显著性检验失去意义,对于一元线性回归模型,其普通最小二乘估计为,于是，在异方差的情况下有下式成立：,参见古扎拉蒂计量经济学上册P352,举例：变量显著性检验失去意义,所以，如果仍按同方差下的如下公式计算：,则必然存在偏误，导致t统计量失真（偏大或偏小）。,返回,

展开阅读全文