模型的建立与估计中的问题及对策.ppt

上传人:小飞机 文档编号:5776177 上传时间:2023-08-19 格式:PPT 页数:151 大小:1.03MB
返回 下载 相关 举报
模型的建立与估计中的问题及对策.ppt_第1页
第1页 / 共151页
模型的建立与估计中的问题及对策.ppt_第2页
第2页 / 共151页
模型的建立与估计中的问题及对策.ppt_第3页
第3页 / 共151页
模型的建立与估计中的问题及对策.ppt_第4页
第4页 / 共151页
模型的建立与估计中的问题及对策.ppt_第5页
第5页 / 共151页
点击查看更多>>
资源描述

《模型的建立与估计中的问题及对策.ppt》由会员分享,可在线阅读,更多相关《模型的建立与估计中的问题及对策.ppt(151页珍藏版)》请在三一办公上搜索。

1、Xianghong Shirley Wang-modified from Professor Anderson,1,第四章 模型的建立与估计中的问题及对策,Xianghong Shirley Wang-modified from Professor Anderson,2,误设定(misspecification)多重共线性(multicollinearty)异方差(heteroskedasticity)自相关(autocorrelation),实践中的常见问题:,Xianghong Shirley Wang-modified from Professor Anderson,3,经典假设与违背假

2、设的情况:,Xianghong Shirley Wang-modified from Professor Anderson,4,4.1 误设定,模型设定偏误主要有两大类解释变量选取的偏误,主要包括漏选相关变量和多选无关变量。模型函数形式选取的偏误。,当模型设定出现偏误时,模型估计结果也会与“实际”有偏差。这种偏差的性质及程度与模型设定偏误的类型密切相关。,Xianghong Shirley Wang-modified from Professor Anderson,5,遗漏相关变量(omitting relevant variables),例如,如果“正确”的模型为:,而我们将模型设定为:,即

3、设定模型时漏掉了一个相关的解释变量。这类错误称为遗漏相关变量。,模型中遗漏了对因变量有显著影响的解释变量将使模型参数估计量不再是无偏估计量。,Xianghong Shirley Wang-modified from Professor Anderson,6,误选无关变量(including irrevelant variables),例如,如果为“真”,但我们将模型设定为:,即设定模型时,多选了一个无关解释变量。这类错误称为误选无关变量。,模型中包括无关的解释变量,参数估计量仍无偏,但会增大估计量的方差,即增大误差。,Xianghong Shirley Wang-modified from P

4、rofessor Anderson,7,错误的函数形式(wrong functional form),例如,如果“真实”的回归函数为:,但却将模型设定为:,这就是设定了错误的函数形式。,这类错误中比较常见的是将非线性关系作为线性关系处理。函数形式选择错误,所建立的模型当然无法反映所研究现象的实际情况,后果是显而易见的。,Xianghong Shirley Wang-modified from Professor Anderson,8,解决解释变量误设定问题的原则,在模型设定中的一般原则是尽量不漏掉有关的解释变量。因为估计量有偏比增大误差更严重。但如果方差很大,得到的无偏估计量也就没有多大意义了

5、,因此也不宜随意乱增加解释变量。在回归实践中,有时要对某个变量是否应该作为解释变量包括在方程中作出准确的判断确实不是一件容易的事,因为目前还没有行之有效的方法可供使用。,Xianghong Shirley Wang-modified from Professor Anderson,9,理论:从理论上看,该变量是否应该作为解释变量包括在方程中?t检验:该变量的系数估计值是否显著?:该变量加进方程中后,是否增大?偏倚:该变量加进方程中后,其它变量的系数估计值是否显著变化?,如果对四个问题的回答都是肯定的,则该变量应该包括在方程中;如果对四个问题的回答都是“否”,则该变量是无关变量,可以安全地从方程

6、中删掉它。这是两种容易决策的情形。,选择解释变量的四条准则,Xianghong Shirley Wang-modified from Professor Anderson,10,在很多情况下,这四项准则的判断结果会出现不一致。例如,有可能某个变量加进方程后,增大,但该变量不显著。在这种情况下,作出正确判断不是一件容易的事,处理的原则是将理论准则放在第一位,再多的统计证据也不能将一个理论上很重要的变量变成“无关”变量。在选择变量的问题上,应当坚定不移地根据理论而不是满意的拟合结果来作决定,对于是否将一个变量包括在回归方程中的问题,理论是最重要的判断准则。如果不这样做,产生不正确结果的风险很大。,

7、Xianghong Shirley Wang-modified from Professor Anderson,11,检验模型误设定的RESET方法,拉姆齐(J.B.Ramsey)于1969年提出了一种回归设定误差检验法(RESET法)。RESET检验法的思路是在要检验的回归方程中加进 等项作为解释变量,然后看结果是否有显著改善。如有,则可判断原方程存在遗漏有关变量的问题或其它的误设定问题。,Xianghong Shirley Wang-modified from Professor Anderson,12,直观地看,这些添加的项是任何可能的遗漏变量或错误的函数形式的替身,如果这些替身能够通过

8、F 检验,表明它们改善了原方程的拟合状况,则我们有理由说原方程存在误设定问题。等项形成多项式函数形式,多项式是一种强有力的曲线拟合装置,因而如果存在误设定,则用这样一个装置可以很好地代表它们。,Xianghong Shirley Wang-modified from Professor Anderson,13,(1)用OLS法估计要检验的方程,得到(2)由上一步得到的值(i=1,2,n),计算,然后用OLS法估计:(3)用F检验比较两个方程的拟合情况,如果两方程总体拟合情况显著不同,则我们得出原方程可能存在误设定的结论。使用的检验统计量为:,RESET检验法的步骤,Xianghong Shir

9、ley Wang-modified from Professor Anderson,14,RSSM为第一步中回归的残差平方和,RSS为第二步中回归的残差平方和,M为约束条件的个数,这里是M=3。注意:拉姆齐RESET检验仅能检验误设定的存在,而不能告诉我们到底是哪一类的误设定,或者说,不能告诉我们正确的模型是什么。但该方法毕竟能给出模型误设定的信号,以便我们去进一步查找问题。另一方面,如果模型设定正确,RESET检验使我们能够排除误设定的存在,转而去查找其它方面的问题。,Xianghong Shirley Wang-modified from Professor Anderson,15,软件实

10、现,Eviews实现的步骤:方程窗口ViewStability TestsRamsey RESET Test输入Number of fittedOK。,Xianghong Shirley Wang-modified from Professor Anderson,16,4.2 多重共线性,多重共线性的概念 多重共线性产生的原因及后果 多重共线性的检验 解决多重共线性问题的方法 实例,Xianghong Shirley Wang-modified from Professor Anderson,17,一、多重共线性的概念,定义:如果某两个或多个解释变量高度线性相关,则称模型中存在多重共线性(Mu

11、lticollinearity)。,对于模型 Yi=0+1X1i+2X2i+kXki+ui,i=1,2,n,其基本假设之一是解释变量是互相独立的。表示为矩阵的秩,有rank(X)=k+1n,即解释变量之间不存在严格的线性关系,观测值个数大于待估参数的个数。,Xianghong Shirley Wang-modified from Professor Anderson,18,如果存在c1X1i+c2X2i+ckXki=0,i=1,2,n,其中 ci 不全为0,则称为解释变量间存在完全的多重共线性(perfect multicollinearity)如果存在c1X1i+c2X2i+ckXki+vi

12、=0,i=1,2,n,其中ci不全为0,vi 为随机误差项,则称为近似的多重共线性(approximate multicollinearity),Xianghong Shirley Wang-modified from Professor Anderson,19,在矩阵表示的线性回归模型Y=X+u中,完全的多重共线性指:rank(X)k+1,即,中,至少有一列向量可由其他列向量(不包括第一列)线性表出。,如:X2=X1,则 X2 对 Y 的作用可由 X1 代替。,Xianghong Shirley Wang-modified from Professor Anderson,20,二、多重共线性

13、产生的原因及后果,主要原因包括以下三个方面:,经济变量共同的变动趋势 时间序列数据:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。,Xianghong Shirley Wang-modified from Professor Anderson,21,滞后变量的引入 在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如:消费=f(当期收入,前期收入)显然,两期收入间具有较强的线性相关性。,Xianghong Shirley Wang-modif

14、ied from Professor Anderson,22,样本资料的限制 由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。例如:消费=f(收入,财富水平),当我们获得收入和财富的样本数据时,两个自变量可能高度相关。我们很难找到足够多的财富少而收入高的样本。,Xianghong Shirley Wang-modified from Professor Anderson,23,一般来说,简单线性模型中涉及到时间序列数据样本时往往会存在多重共线性;而对于截面数据样本,问题不那么严重,但多重共线性仍然是存在的。在多元线性回归模型中,我们关心的并不是多重共线性的有

15、无,而是多重共线性的程度。当多重共线性的程度较高时,会给最小二乘估计量带来严重的后果。,如何看待多重共线性呢?,Xianghong Shirley Wang-modified from Professor Anderson,24,多重共线性的后果,的OLS估计量为:,完全共线性下参数估计量不存在,如果存在完全共线性,则必有,故(XX)1 不存在,因此无法得到参数的估计量。,Xianghong Shirley Wang-modified from Professor Anderson,25,例:对于二元线性回归模型,如果两个解释变量完全相关,如X2=X1,则二元模型就会退化为一元线性回归模型:,

16、这时,只能确定综合参数 1+2 的估计值:,Xianghong Shirley Wang-modified from Professor Anderson,26,近似共线性下,可以得到OLS参数估计量,但参数估计量方差的表达式为:,由于|XX|0,引起(XX)-1 主对角线元素较大,即使得参数估计值的方差增大,估计值的精度降低。,近似共线性下OLS估计量的方差增大,Xianghong Shirley Wang-modified from Professor Anderson,27,仍以二元线性模型 为例:,恰为 X1与 X2的线性相关系数的平方r 2,由于 r 2 1,故 1/(1-r2)1。

17、,Xianghong Shirley Wang-modified from Professor Anderson,28,多重共线性使参数估计值的方差增大,1/(1-r 2)为方差膨胀因子(Variance Inflation Factor,VIF),当完全不共线时,r 2=0,当近似共线时,0 r 2 1,当完全共线时,r 2=1,,方差膨胀因子表,Xianghong Shirley Wang-modified from Professor Anderson,29,如果模型中两个解释变量具有线性相关性,例如 X2=X1,这时,X1 和 X2前的参数 1、2 并不反映各自与被解释变量之间的结构关

18、系,而是反映它们对被解释变量的共同影响。1、2 已经失去了应有的经济含义,于是经常表现出似乎反常的现象:例如 1 本来应该是正的,结果恰是负的。,参数估计量经济含义不合理,Xianghong Shirley Wang-modified from Professor Anderson,30,存在多重共线性时,参数估计值的方差与标准差变大,容易使通过样本计算的 t 值小于临界值,误导作出参数为 0 的推断,可能将重要的解释变量排除在模型之外,变量的显著性检验出现偏误,Xianghong Shirley Wang-modified from Professor Anderson,31,注意,除非是完

19、全共线性,多重共线性并不意味着任何基本假设的违背;即使出现较高程度的多重共线性,OLS估计量仍具有无偏性、线性性、有效性等良好的统计性质;但是,无偏性并不保证对某个给定的样本参数估计值等于真值,最小方差性也不保证参数估计量的方差在给定样本下很小。,Xianghong Shirley Wang-modified from Professor Anderson,32,通过分析回归的结果可以对是否存在多重共线性作出初步的判断:,三、多重共线性的检验,发现系数估计值的符号不对某些重要的解释变量t值偏低,而拟合优度不低当一个不太重要的解释变量被删除后,回归结果发生显著变化,如需具体判断哪些变量发生了多重

20、共线性,则需要进一步的检验,经常使用以下几种方法:,Xianghong Shirley Wang-modified from Professor Anderson,33,1.利用变量间的相关性判断,对只有两个解释变量的模型,采用简单相关系数法求出 X1与 X2 的简单相关系数 r,若|r|接近1,则说明两变量存在较强的多重共线性。一般软件可以提供各解释变量两两之间的相关系数矩阵。对于多个解释变量来说,可以将模型中每一个解释变量分别对其他解释变量进行回归,并计算拟合优度。如果某一种回归:Xji=1X1i+2X2i+kXki 的拟合优度较大,说明 Xj 与其他所有解释变量之间存在共线性。,Xian

21、ghong Shirley Wang-modified from Professor Anderson,34,2.使用方差膨胀因子(VIF)检验,这是一种比较正规的检验方法。该方法通过检查指定的解释变量能够被回归方程中其它全部解释变量所解释的程度来检测多重共线性。方程中每个解释变量有一个VIF,该VIF是关于多重共线性使相应的系数估计值的方差增大了多少的一个估计值。高VIF表明多重共线性增大了系数估计值的方差,从而产生一个减小了的 t 值。,Xianghong Shirley Wang-modified from Professor Anderson,35,设原方程为:Y=0+1X1+2X2+

22、kXk+u(1)Xi 对原方程中其它全部解释变量进行OLS回归,例如,若i=1,则回归下面的方程:X1=1+2X2+3X3+kXk+v(2)计算方差膨胀因子(VIF):其中Ri2是第一步辅助回归的拟合优度。,VIF检验的具体步骤如下:,Xianghong Shirley Wang-modified from Professor Anderson,36,(3)分析多重共线性的程度 VIF越高,多重共线性的影响越严重。由于没有VIF临界值表,我们只能使用经验法则:若,则存在严重多重共线性。也有人建议用VIF10作为存在严重多重共线性的标准,特别在解释变量多的情形应当如此。,需要指出的是,所有VIF

23、值都低,并不能排除严重多重共线性存在的可能性。,Xianghong Shirley Wang-modified from Professor Anderson,37,条件指数高,表明存在多重共线性。“经验法则”告诉我们:CI在5到10之间为弱相关性;在10到30之间为中强度多重共线性,而大于30表明存在严重的多重共线性。,3.通过条件指数检验,Xianghong Shirley Wang-modified from Professor Anderson,38,四、解决多重共线性问题的方法,方法一、增加数据多重共线性实质上是样本的问题,或者说是数据问题,因此,增加数据就有可能消除或减缓多重共线性

24、。具体方法包括增加观测值、将时间序列数据与截面数据并用或采用新的样本等。当然,如果解释变量的总体存在多重共线性,那么增加样本容量就不能降低解释变量之间的线性关系。,Xianghong Shirley Wang-modified from Professor Anderson,39,在存在多重共线性的模型中,依据经济理论施加某些约束条件,将减小系数估计量的方差。最典型的例子是在CobbDouglas生产函数中加进规模报酬不变的约束,可以解决资本和劳动的高度相关而引起的多重共线性问题。,方法二、对模型施加某些约束条件,Xianghong Shirley Wang-modified from Pro

25、fessor Anderson,40,这样做,实际上就是利用给定数据估计较少的参数,从而降低对观测信息的需求,以解决多重共线性问题。删除哪些变量,可根据经典理论和假设检验的结果确定。另一种思路就是在建模的过程中避免引入共线性较大的变量,具体可以采用逐步回归的方法。,方法三、略去一个或几个共线变量,Xianghong Shirley Wang-modified from Professor Anderson,41,逐步回归法,以 Y 为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。根据拟合优度的变化决定新引入的变量是否独立。如果拟合优度变化显著,则说明新引入的变量是一个独立解释变量;

26、如果拟合优度变化很不显著,则说明新引入的变量与其它变量之间存在共线性关系。,Xianghong Shirley Wang-modified from Professor Anderson,42,1.用被解释变量分别对每个解释变量进行线性回归,根据经济理论和统计检验从中选择一个最合适的回归方程作为基本回归方程,通常选取拟合优度最大的回归方程。2.在基本回归方程中逐个增加解释变量,重新进行线性回归:若新变量的引入提高了R2,并且回归方程中的其他参数统计上仍然显著,就在模型中保留该解释变量;若新变量的引入未能改进R2,则不在模型中保留该解释变量;若新变量的引入提高了R2,且显著地影响了其他回归参数估

27、计值的符号与数值,说明模型中存在多重共线性,对该解释变量同与之相关的其他解释变量进行比较,在模型中保留对被解释变量影响较大的,略去较小的。,逐步回归法的一般步骤:,Xianghong Shirley Wang-modified from Professor Anderson,43,如果某些解释变量之间高度相关,可以根据研究目的等实际情况,通过改变模型的形式来避免多重共线性。,方法四、改变模型的形式,例如:某商品的需求函数为:其中Q为需求量,X 为收入,P是该商品的价格,P*为替代商品的价格。通常P和P*往往呈同方向变动,它们之间高度相关。如果研究目的只是预测该商品的需求量,则可以用相对价格来替

28、代两个价格对Q的影响,即:这样就可以解决多重共线性问题。,Xianghong Shirley Wang-modified from Professor Anderson,44,时间序列数据、线性模型:将原模型变换为差分模型:Yi=1 X1i+2 X2i+k Xki+ui可以有效地消除原模型中的多重共线性。,一般来说,增量之间的线性关系远比总量之间的线性关系弱得多。,使用差分形式的模型,Xianghong Shirley Wang-modified from Professor Anderson,45,例如:个人消费取决于现期收入和过去的收入,模型为:,用被解释变量的滞后值替代解释变量的滞后值:

29、如果多重共线性是由解释变量的现期值与过去值高度相关引起的,则可以使用被解释变量的一期滞后值替代解释变量的滞后值,来避免多重共线性。,Xianghong Shirley Wang-modified from Professor Anderson,46,对于多项式回归模型,即模型中包含解释变量的不同次幂,它们之间一般存在较高的相关性。在实践中,如果将解释变量表达为离差的形式,即原值减去均值,多重共线性就可大为降低。,使用离差形式的模型,Xianghong Shirley Wang-modified from Professor Anderson,47,思路:将共线变量组合在一起形成一个或几个综合指

30、数(变量),用它来代表这组变量。构造综合指数的最常用方法是主成分法。主成分的特点是,各主成分之间互不相关,并且,用很少几个主成分就可以解释全部解释变量的绝大部分方差,因而在出现多重共线性时,可以用主成分替代原有解释变量进行回归计算,然后再将所得到的系数还原成原模型中的参数估计值。关于主成分分析的方法参考多元统计分析中有关主成分分析的内容。,方法五、主成分回归,Xianghong Shirley Wang-modified from Professor Anderson,48,运用多元统计技术的其他方法,如因子分析岭回归构造联立方程模型无为而治、置之不理,其他方法,Xianghong Shirl

31、ey Wang-modified from Professor Anderson,49,根据理论和经验分析,影响粮食生产(Y)的主要因素有:农业化肥施用量(X1)粮食播种面积(X2)受灾面积(X3)农业机械总动力(X4)农业劳动力(X5),已知中国粮食生产的相关数据,建立中国粮食生产函数:Y=0+1 X1+2 X2+3 X3+4 X4+4 X5+u,五、实例,Xianghong Shirley Wang-modified from Professor Anderson,50,1.用OLS法估计上述模型:,R2 接近于1;给定=5%,得 F 的临界值F0.05(5,12)=3.11,F=638.

32、4 15.19,故认上述粮食生产的总体线性关系显著成立。但X4、X5 的参数未通过 t 检验,且符号不正确,说明解释变量间可能存在多重共线性。,(-0.91)(8.39)(3.32)(-2.81)(-1.45)(-0.14),Xianghong Shirley Wang-modified from Professor Anderson,51,2.检验简单相关系数,发现:X1与 X4 之间存在高度相关性。,列出X1,X2,X3,X4,X5 的相关系数矩阵:,Xianghong Shirley Wang-modified from Professor Anderson,52,3.找出最简单的回归形

33、式,可见,应选第一个方程为初始的回归模型。,分别作Y与X1,X2,X4,X5间的回归:,(25.58)(11.49)R2=0.8919 F=132.1 DW=1.56,(-0.49)(1.14)R2=0.075 F=1.30 DW=0.12,(17.45)(6.68)R2=0.7527 F=48.7 DW=1.11,(-1.04)(2.66)R2=0.3064 F=7.07 DW=0.36,Xianghong Shirley Wang-modified from Professor Anderson,53,4.逐步回归,将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。,Xiangho

34、ng Shirley Wang-modified from Professor Anderson,54,回归方程以Y=f(X1,X2,X3)为最优:,5.结论,Xianghong Shirley Wang-modified from Professor Anderson,55,总结,多重共线性是普遍存在的,轻微的多重共线性问题可以不采取措施。如果模型仅用于预测,则只要拟合程度好,可以不处理多重共线性问题,因为它不会影响到预测的结果。如果模型用于结构分析,特别是要分解解释变量的单独效应,多重共线性则是一个非常严重的问题,最好能够合理解决。,Xianghong Shirley Wang-modif

35、ied from Professor Anderson,56,4.3 异方差,异方差的概念及类型 异方差产生的后果 异方差的检验 解决异方差问题的方法 实例,Xianghong Shirley Wang-modified from Professor Anderson,57,P(,Y,|,X,),o,Y,x,2,x,3,x,4,X,i,i,X,Y,E,1,0,),(,b,b,+,=,X,1,Xianghong Shirley Wang-modified from Professor Anderson,58,即对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则认为随机误差项出现了异方差

36、性(Heteroskedasticity)。,一、异方差的概念及类型,对于模型 Yi=0+1X1i+2X2i+kXki+ui,i=1,2,n,如果出现:,Xianghong Shirley Wang-modified from Professor Anderson,59,异方差的类型,同方差:i2=常数 异方差:i2=f(Xi),异方差一般可归结为三种类型:(1)单调递增型:i2 随 X 的增大而增大(2)单调递减型:i2 随 X 的增大而减小(3)复 杂 型:i2 与 X 的变化呈复杂形式,Xianghong Shirley Wang-modified from Professor Ande

37、rson,60,Xianghong Shirley Wang-modified from Professor Anderson,61,实际经济问题中的异方差性,例1:截面资料下研究居民家庭的储蓄行为:Yi=0+1Xi+ui Yi:第 i 个家庭的储蓄额 Xi:第 i 个家庭的可支配收入。,高收入家庭:储蓄的差异较大;低收入家庭:储蓄则更有规律性,差异较小;ui 的方差呈现单调递增型变化,Xianghong Shirley Wang-modified from Professor Anderson,62,例2:以绝对收入假设为理论假设、以截面数据为样本建立居民消费函数:Ci=0+1Yi+ui,将

38、居民按照收入等距离分成 n 组,取组平均数为样本观测值。,一般情况下,居民收入服从正态分布:中等收入组人数多,两端收入组人数少。而人数多的组平均数的误差小,人数少的组平均数的误差大。所以样本观测值的观测误差随着解释变量观测值的不同而不同,往往引起异方差性。,Xianghong Shirley Wang-modified from Professor Anderson,63,例3:以某一行业的企业为样本建立企业生产函数模型:,Y产出量;K资本;L劳动;A技术。每个企业所处的外部环境对产出量的影响被包含在随机误差项中。,每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。这时

39、,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。,Xianghong Shirley Wang-modified from Professor Anderson,64,二、异方差产生的后果,计量经济学模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:,OLS估计量仍然具有无偏性,但不具有有效性。,因为在有效性证明中利用了 E(uu)=2I,而且,在大样本情况下,尽管参数估计量具有一致性,但仍然不具有渐近有效性。,参数估计量非有效,Xianghong Shirley Wang-modified from Professor Anderson,6

40、5,变量的显著性检验失去意义,变量的显著性检验中,构造了t 统计量,如果出现异方差性,估计的 会出现偏误,(偏大或偏小),t 检验则失去意义。,Xianghong Shirley Wang-modified from Professor Anderson,66,模型的预测失效,一方面,由于上述后果,使得模型不具有良好的统计性质;,所以,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对 Y 的预测误差变大,降低预测精度,预测功能失效。,另一方面,在预测值的置信区间中也包含有参数方差的估计量。,Xianghong Shirley Wang-modified from Profess

41、or Anderson,67,检验思路:,由于异方差就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:检验异方差是否存在,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。,三、异方差的检验,Xianghong Shirley Wang-modified from Professor Anderson,68,关键问题是用什么来表示随机误差项的方差,一般的处理方法为:,首先采用OLS估计模型,以求得随机误差项的估计量(注意:该估计量是不严格的),我们称之为“近似估计量”。,Xianghong Shirley Wang-modified from Profes

42、sor Anderson,69,常用的检验方法有:,图示法帕克检验(Park test)格里瑟检验(Glesjer test)戈德弗尔德-匡特检验(Goldfeld-Quandt test)怀特检验(Whites General Heteroscedasticity test)布罗施-培甘(Breusch-Pagan)检验,Xianghong Shirley Wang-modified from Professor Anderson,70,1.图示法,(1)用 X-Y 的散点图进行判断 看是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中),Xianghong Shirley

43、Wang-modified from Professor Anderson,71,看是否形成一斜率为零的直线,Xianghong Shirley Wang-modified from Professor Anderson,72,2帕克(Park)检验,基本思路是:设定随机误差项的方差为解释变量的某个函数,从而把图示法进一步描述为具体的公式。帕克提出的函数形式为:,Xianghong Shirley Wang-modified from Professor Anderson,73,格里瑟检验的思路与帕克检验基本一致,但格里瑟建议使用残差的绝对值与解释变量做回归,而且他提出了多种函数形式:,3.格

44、里瑟(Glejser)检验,Xianghong Shirley Wang-modified from Professor Anderson,74,4.戈德弗尔德-匡特(Goldfeld-Quandt)检验,G-Q 检验以 F 检验为基础,适用于样本容量较大、异方差递增或递减的情况。其基本思想是:先将样本一分为二,对子样和子样分别作回归,然后利用两个子样的残差平方和之比构造统计量进行异方差检验。由于该统计量服从 F 分布,因此假如存在递增的异方差,则 F统计量远大于1;反之就会等于1(同方差)、或小于1(递减方差)。,Xianghong Shirley Wang-modified from Pr

45、ofessor Anderson,75,(1)将 n 对样本观察值(Xi,Yi)按观察值 Xi 的大小排队;(2)将序列中间的c=n/4个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为(n-c)/2;(3)对每个子样分别进行OLS回归,并计算各自的残差平方和;,G-Q 检验的具体步骤:,Xianghong Shirley Wang-modified from Professor Anderson,76,(4)在同方差性假定下,构造如下满足 F 分布的统计量:,(5)给定显著性水平,确定临界值 F(v1,v2),若 F F(v1,v2),则拒绝同方差性假设,

46、表明存在异方差。当然,还可根据两个残差平方和对应的子样的顺序判断是递增型异方差还是递减型异方差。,Xianghong Shirley Wang-modified from Professor Anderson,77,5.怀特(White)检验,怀特检验不需要排序,且适合任何形式的异方差。怀特检验的基本思想与步骤(以二元为例):,(2)做如下辅助回归:,Xianghong Shirley Wang-modified from Professor Anderson,78,(4)在大样本下,对统计量 nR2 进行相应的 检验。如果统计量大于一定显著性水平的临界 值,则意味着原模型存在异方差性。,如果

47、存在异方差性,则表明确与解释变量的某种组合有显著的相关性,这时往往显示出有较高的可决系数以及某一参数的 t 检验值较大。当然,在多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有时可去掉交叉项。,Xianghong Shirley Wang-modified from Professor Anderson,79,6.布罗施-培甘(Breusch-Pagan)检验,即 为非随机变量z的函数(z);,部分或全部解释变量Xj可以作为z。,假设异方差性的模型由以下更一般的形式给出:,H0:1=2=m=0,(即)H1:存在某个 j0,j=1,2,m,原假设与备择假设如下:,Xiang

48、hong Shirley Wang-modified from Professor Anderson,80,B-P检验的具体步骤如下:,(4)用pi 对以下模型运用OLS回归,(2)求出:,Xianghong Shirley Wang-modified from Professor Anderson,81,,对给定的显著性水平,,当 时,拒绝原假设,即异方差性存在。,使用B-P检验时,不需要特别对函数(z)的类型进行限制,只需要其中包含常数项。,(5)得到回归平方和ESS,并且定义,可以证明如果有同方差性,则,Xianghong Shirley Wang-modified from Profe

49、ssor Anderson,82,四、解决异方差问题的方法,基本思路:变换原模型,使经过变换后的模型具有同方差性,然后再用OLS法进行估计。对于模型 设随机扰动项的方差表示为:,Xianghong Shirley Wang-modified from Professor Anderson,83,所以变换后随机扰动项的方差为常数,可以应用OLS法进行估计,得到的参数估计量为BLUE。但这里得到的OLS估计量是模型变形后的OLS估计量。对于原模型而言,它已不是OLS估计量,我们称为广义最小二乘估计量(GLS估计量)。,Xianghong Shirley Wang-modified from Pro

50、fessor Anderson,84,广义最小二乘法(Generalized least squares)下面用矩阵形式的模型来推导出GLS估计量的一般计算公式。设GLS模型为:Y=X+u 满足 E(u)=0,E(uu)=2,X非随机,X的秩=k+1n,其中为正定矩阵。,根据矩阵代数知识可知,对于任一正定矩阵,存在着一个满秩矩阵P,使得,Xianghong Shirley Wang-modified from Professor Anderson,85,Xianghong Shirley Wang-modified from Professor Anderson,86,这表明,新模型中的扰动项

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号