回归模型的检验.ppt

上传人:小飞机 文档编号:6381080 上传时间:2023-10-22 格式:PPT 页数:64 大小:835KB
返回 下载 相关 举报
回归模型的检验.ppt_第1页
第1页 / 共64页
回归模型的检验.ppt_第2页
第2页 / 共64页
回归模型的检验.ppt_第3页
第3页 / 共64页
回归模型的检验.ppt_第4页
第4页 / 共64页
回归模型的检验.ppt_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《回归模型的检验.ppt》由会员分享,可在线阅读,更多相关《回归模型的检验.ppt(64页珍藏版)》请在三一办公上搜索。

1、第三章 回归模型的检验,3.1 多元线性回归模型的统计检验,一、拟合优度检验 二、方程的显著性检验(F检验)三、变量的显著性检验(t检验)四、参数的置信区间,一、拟合优度检验,1、可决系数与调整的可决系数,则,总离差平方和的分解,可决系数,该统计量越接近于1,模型的拟合优度越高。,问题:由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。,调整的可决系数(adjusted coefficient of determination),在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:

2、,其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。,*2、赤池信息准则和施瓦茨准则,为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的标准还有:赤池信息准则(Akaike information criterion,AIC),施瓦茨准则(Schwarz criterion,SC),这两准则均要求仅当所增加的解释变量能够减少AIC值或AC值时才在原模型中增加该解释变量。,Eviews的估计结果显示:中国居民消费一元例中:AIC=7.09 AC=7.19 中国居民消费二元例中:AIC=6.68 AC=6.83从这点看,可以说前期人均居民消费CONSP(-1)应包括在模型

3、中。,二、方程的显著性检验(F检验),方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。,1、方程显著性的F检验,即检验模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n中的参数j是否显著不为0。,可提出如下原假设与备择假设:,H0:0=1=2=k=0 H1:j不全为0,根据数理统计学中的知识,在原假设H0成立的条件下,统计量,服从自由度为(k,n-k-1)的F分布,给定显著性水平,可得到临界值F(k,n-k-1),由样本求出统计量F的数值,通过 F F(k,n-k-1)或 FF(k,n-k-1)来拒绝或接受原假设H0,以判定原方程总体

4、上的线性关系是否显著成立。,对于中国居民人均消费支出的例子:一元模型:F=285.92 二元模型:F=2057.3,给定显著性水平=0.05,查分布表,得到临界值:一元例:F(1,21)=4.32 二元例:F(2,19)=3.52,显然有 F F(k,n-k-1)即二个模型的线性关系在95%的水平下显著成立。,2、关于拟合优度检验与方程显著性检验关系的讨论,由,可推出:,与,或,三、变量的显著性检验(t检验),方程的总体线性关系显著每个解释变量对被解释变量的影响都是显著的,因此,必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。这一检验是由对变量的 t 检验完成的。,1、

5、t分布,2、t检验,设计原假设与备择假设:,H1:i0,给定显著性水平,可得到临界值t/2(n-k-1),由样本求出统计量t的数值,通过|t|t/2(n-k-1)或|t|t/2(n-k-1)来拒绝或接受原假设H0,从而判定对应的解释变量是否应包括在模型中。,H0:i=0(i=1,2k),注意:一元线性回归中,t检验与F检验一致,一方面,t检验与F检验都是对相同的原假设H0:1=0 进行检验;另一方面,两个统计量之间有如下关系:,在中国居民人均收入-消费支出二元模型例中,由应用软件计算出参数的t值:,给定显著性水平=0.05,查得相应临界值:t0.025(19)=2.093。,可见,计算的所有t

6、值都大于该临界值,所以拒绝原假设。,四、参数的置信区间,参数的置信区间用来考察:在一次抽样中所估计的参数值离参数的真实值有多“近”。在变量的显著性检验中已经知道:,容易推出:在(1-)的置信水平下i的置信区间是,其中,t/2为显著性水平为、自由度为n-k-1的临界值。,在中国居民人均收入-消费支出二元模型例中,给定=0.05,查表得临界值:t0.025(19)=2.093,计算得参数的置信区间:0:(44.284,197.116)1:(0.0937,0.3489)2:(0.0951,0.8080),从回归计算中已得到:,如何才能缩小置信区间?,增大样本容量n,因为在同样的样本容量下,n越大,t

7、分布表中的临界值越小,同时,增大样本容量,还可使样本参数估计量的标准差减小;提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型优度越高,残差平方和应越小。提高样本观测值的分散度,一般情况下,样本观测值越分散,(XX)-1的分母的|XX|的值越大,致使区间缩小。,3.2 回归模型的其他函数形式,一、模型的类型与变换 二、非线性回归实例,在实际经济活动中,经济变量的关系是复杂的,直接表现为线性关系的情况并不多见。,如著名的恩格尔曲线(Engle curves)表现为幂函数曲线形式、宏观经济学中的菲利普斯曲线(Pillips cuves)表现为双曲线形式等。但是,大部分非线性关系

8、又可以通过一些简单的数学处理,使之化为数学上的线性关系,从而可以运用线性回归的方法进行计量经济学方面的处理。,一、模型的类型与变换,1、倒数模型、多项式模型与变量的直接置换法,例如,描述税收与税率关系的拉弗曲线:抛物线 s=a+b r+c r2 c0 s:税收;r:税率,设X1=r,X2=r2,则原方程变换为 s=a+b X1+c X2 c0,2、幂函数模型、指数函数模型与对数变换法,例如,Cobb-Dauglas生产函数:幂函数 Q=AKLQ:产出量,K:投入的资本;L:投入的劳动,方程两边取对数:ln Q=ln A+ln K+ln L,3、复杂函数模型与级数展开法,方程两边取对数后,得到:

9、,(1+2=1),Q:产出量,K:资本投入,L:劳动投入:替代参数,1、2:分配参数,例如,常替代弹性CES生产函数,将式中ln(1K-+2L-)在=0处展开台劳级数,取关于的线性项,即得到一个线性近似式。,如取0阶、1阶、2阶项,可得,并非所有的函数形式都可以线性化,无法线性化模型的一般形式为:,其中,f(x1,x2,Xk)为非线性函数。如:,二、非线性回归实例,例 建立中国城镇居民食品消费需求函数模型。,根据需求理论,居民对食品的消费需求函数大致为,Q:居民对食品的需求量,X:消费者的消费支出总额P1:食品价格指数,P0:居民消费价格总指数。,零阶齐次性,当所有商品和消费者货币支出总额按同

10、一比例变动时,需求量保持不变,(*),(*),为了进行比较,将同时估计(*)式与(*)式。,根据恩格尔定律,居民对食品的消费支出与居民的总支出间呈幂函数的变化关系:,首先,确定具体的函数形式,对数变换:,考虑到零阶齐次性时,(*),(*),(*)式也可看成是对(*)式施加如下约束而得,因此,对(*)式进行回归,就意味着原需求函数满足零阶齐次性条件。,X:人均消费X1:人均食品消费GP:居民消费价格指数FP:居民食品消费价格指数XC:人均消费(90年价)Q:人均食品消费(90年价)P0:居民消费价格缩减指数(1990=100)P:居民食品消费价格缩减指数(1990=100,中国城镇居民人均食品消

11、费,特征:消费行为在19811995年间表现出较强的一致性1995年之后呈现出另外一种变动特征。,建立19811994年中国城镇居民对食品的消费需求模型:,(9.03)(25.35)(-2.28)(-7.34),按零阶齐次性表达式回归:,(75.86)(52.66)(-3.62),为了比较,改写该式为:,发现与,接近。,意味着:所建立的食品需求函数满足零阶齐次性特征,3.3 受约束回归,在建立回归模型时,有时根据经济理论需对模型中变量的参数施加一定的约束条件。,如:0阶齐次性 条件的消费需求函数 1阶齐次性 条件的C-D生产函数,模型施加约束条件后进行回归,称为受约束回归(restricted

12、 regression);不加任何约束的回归称为无约束回归(unrestricted regression)。,一、模型参数的线性约束 二、对回归模型增加或减少解释变量 三、参数的稳定性*四、非线性约束,一、模型参数的线性约束,对模型,施加约束,得,或,(*),(*),如果对(*)式回归得出,则由约束条件可得:,然而,对所考查的具体问题能否施加约束?,需进一步进行相应的检验。常用的检验有:F检验、x2检验与t检验,,主要介绍F检验,在同一样本下,记无约束样本回归模型为,受约束样本回归模型为,于是,受约束样本回归模型的残差平方和RSSR,于是,ee为无约束样本回归模型的残差平方和RSSU,(*)

13、,受约束与无约束模型都有相同的TSS,由(*)式 RSSR RSSU从而 ESSR ESSU,这意味着,通常情况下,对模型施加约束条件会降低模型的解释能力。,但是,如果约束条件为真,则受约束回归模型与无约束回归模型具有相同的解释能力,RSSR 与 RSSU的差异变小。,可用RSSR-RSSU的大小来检验约束的真实性,根据数理统计学的知识:,),(,/,),(,2,2,R,U,U,R,k,k,RSS,RSS,-,-,c,s,于是:,),1,(,),1,/(,),/(,),(,-,-,-,-,-,-,-,=,U,R,U,U,U,R,U,U,R,k,n,k,k,F,k,n,RSS,k,k,RSS,R

14、SS,F,讨论:如果约束条件无效,RSSR 与 RSSU的差异较大,计算的F值也较大。,于是,可用计算的F统计量的值与所给定的显著性水平下的临界值作比较,对约束条件的真实性进行检验。,注意,kR-kU恰为约束条件的个数。,例 中国城镇居民对食品的人均消费需求实例中,对零阶齐次性检验:,取=5%,查得临界值F0.05(1,10)=4.96 判断:不能拒绝中国城镇居民对食品的人均消费需求函数具有零阶齐次特性这一假设。,无约束回归:RSSU=0.00324,kU=3 受约束回归:RSSR=0.00332,KR=2 样本容量n=14,约束条件个数kU-kR=3-2=1,这里的F检验适合所有关于参数线性

15、约束的检验,如:多元回归中对方程总体线性性的F检验:H0:j=0 j=1,2,k,这里:受约束回归模型为,),1,/(,/,),1,/(,/,),(,),1,/(,/,),(,),1,/(,),/(,),(,-,-,=,-,-,-,=,-,-,-,-,=,-,-,-,-,=,k,n,RSS,k,ESS,k,n,RSS,k,RSS,TSS,k,n,RSS,k,RSS,ESS,TSS,k,n,RSS,k,k,RSS,RSS,F,U,U,U,U,U,U,R,U,U,R,U,U,R,这里,运用了ESSR 0。,二、对回归模型增加或减少解释变量,考虑如下两个回归模型,(*),(*),(*)式可看成是(*

16、)式的受约束回归:,H0:,相应的统计量为:,如果约束条件为真,即额外的变量Xk+1,Xk+q对没有解释能力,则统计量较小;否则,约束条件为假,意味着额外的变量对有较强的解释能力,则统计量较大。因此,可通过F的计算值与临界值的比较,来判断额外变量是否应包括在模型中。,讨论:,统计量的另一个等价式,三、参数的稳定性,1、邹氏参数稳定性检验,建立模型时往往希望模型的参数是稳定的,即所谓的结构不变,这将提高模型的预测与分析功能。如何检验?,假设需要建立的模型为,在两个连续的时间序列(1,2,,n1)与(n1+1,,n1+n2)中,相应的模型分别为:,合并两个时间序列为(1,2,,n1,n1+1,,n

17、1+n2),则可写出如下无约束回归模型,如果=,表示没有发生结构变化,因此可针对如下假设进行检验:H0:=(*)式施加上述约束后变换为受约束回归模型,(*),(*),因此,检验的F统计量为:,记RSS1与RSS2为在两时间段上分别回归后所得的残差平方和,容易验证,,于是,参数稳定性的检验步骤:,(1)分别以两连续时间序列作为两个样本进行回归,得到相应的残差平方:RSS1与RSS2(2)将两序列并为一个大样本后进行回归,得到大样本下的残差平方和RSSR(3)计算F统计量的值,与临界值比较:若F值大于临界值,则拒绝原假设,认为发生了结构变化,参数是非稳定的。,该检验也被称为邹氏参数稳定性检验(Ch

18、ow test for parameter stability)。,2、邹氏预测检验,上述参数稳定性检验要求n2k。如果出现n2k,则往往进行如下的邹氏预测检验(Chow test for predictive failure)。,邹氏预测检验的基本思想:先用前一时间段n1个样本估计原模型,再用估计出的参数进行后一时间段n2个样本的预测。如果预测误差较大,则说明参数发生了变化,否则说明参数是稳定的。,分别以、表示第一与第二时间段的参数,则,其中,,如果=0,则=,表明参数在估计期与预测期相同,(*),(*)的矩阵式:,可见,用前n1个样本估计可得前k个参数的估计,而不外是用后n2个样本测算的预

19、测误差X2(-),(*),如果参数没有发生变化,则=0,矩阵式简化为,(*),(*)式与(*)式,),1,/(,/,),(,),1,/(,),/(,),(,1,1,2,1,-,-,-,=,-,-,-,-,=,k,n,RSS,n,RSS,RSS,k,n,RSS,k,k,RSS,RSS,F,R,U,U,U,R,U,R,这里:KR-KU=n2 RSSU=RSS1,分别可看成受约束与无约束回归模型,于是有如下F检验:,第一步,在两时间段的合成大样本下做OLS回归,得受约束模型的残差平方和RSSR;第二步,对前一时间段的n1个子样做OLS回归,得残差平方和RSS1;第三步,计算检验的F统计量,做出判断:

20、,邹氏预测检验步骤:,给定显著性水平,查F分布表,得临界值F(n2,n1-k-1)如果 FF(n2,n1-k-1),则拒绝原假设,认为预测期发生了结构变化。,例 中国城镇居民食品人均消费需求的邹氏检验。,1、参数稳定性检验,19811994:,RSS1=0.003240,19952001:,(9.96)(7.14)(-5.13)(1.81),19812001:,(14.83)(27.26)(-3.24)(-11.17),给定=5%,查表得临界值F0.05(4,13)=3.18 判断:F值临界值,拒绝参数稳定的原假设,表明中国城镇居民食品人均消费需求在1994年前后发生了显著变化。,2、邹氏预测

21、检验,给定=5%,查表得临界值F0.05(7,10)=3.18判断:F值临界值,拒绝参数稳定的原假设,*四、非线性约束,也可对模型参数施加非线性约束,如对模型,施加非线性约束12=1,得到受约束回归模型:,该模型必需采用非线性最小二乘法(nonlinear least squares)进行估计。非线性约束检验是建立在最大似然原理基础上的,有最大似然比检验、沃尔德检验与拉格朗日乘数检验.,1、最大似然比检验(likelihood ratio test,LR),估计:无约束回归模型与受约束回归模型,方法:最大似然法,检验:两个似然函数的值的差异是否“足够”大。,记L(,2)为一似然函数:无约束回归

22、:Max:,受约束回归:Max:,或求极值:,g():以各约束条件为元素的列向量,:以相应拉格朗日乘数为元素的行向量,约束:g()=0,受约束的函数值不会超过无约束的函数值,但如果约束条件为真,则两个函数值就非常“接近”。,由此,定义似然比(likelihood ratio):,如果比值很小,说明两似然函数值差距较大,则应拒绝约束条件为真的假设;如果比值接近于,说明两似然函数值很接近,应接受约束条件为真的假设。,具体检验时,由于大样本下:,h是约束条件的个数。因此:通过LR统计量的2分布特性来进行判断。,在中国城镇居民人均食品消费需求例中,对零阶齐次性的检验:,LR=-2(38.57-38.7

23、3)=0.32,给出=5%、查得临界值20.05(1)3.84,判断:LR 20.05(1),不拒绝原约束的假设,表明:中国城镇居民对食品的人均消费需求函数满足零阶齐次性条件。,、沃尔德检验(Wald test,W),沃尔德检验中,只须估计无约束模型。如对,在所有古典假设都成立的条件下,容易证明,因此,在1+2=1的约束条件下,记,可建立沃尔德统计量:,如果有h个约束条件,可得到h个统计量z1,z2,zh 约束条件为真时,可建立大样本下的服从自由度为h的渐近2 分布统计量,其中,Z为以zi为元素的列向量,C是Z的方差-协方差矩阵。因此,W从总体上测量了无约束回归不满足约束条件的程度。对非线性约

24、束,沃尔德统计量W的算法描述要复杂得多。,3、拉格朗日乘数检验,拉格朗日乘数检验则只需估计受约束模型.受约束回归是求最大似然法的极值问题:,是拉格朗日乘数行向量,衡量各约束条件对最大似然函数值的影响程度。,如果某一约束为真,则该约束条件对最大似然函数值的影响很小,于是,相应的拉格朗日乘数的值应接近于零。因此,拉格朗日乘数检验就是检验某些拉格朗日乘数的值是否“足够大”,如果“足够大”,则拒绝约束条件为真的假设。,拉格朗日统计量LM本身是一个关于拉格朗日乘数的复杂的函数,在各约束条件为真的情况下,服从一自由度恰为约束条件个数的渐近2分布。,n为样本容量,R2为如下被称为辅助回归(auxiliary regression)的可决系数:,如果约束是非线性的,辅助回归方程的估计比较复杂,但仍可按(*)式计算LM统计量的值。最后,一般地有:LMLRW,同样地,如果为线性约束,LM服从一精确的2分布:,(*),3.4 多元线性回归模型的预测,一、E(Y0)的置信区间 二、Y0的置信区间,一、E(Y0)的置信区间,于是,得到(1-)的置信水平下E(Y0)的置信区间:,其中,t/2为(1-)的置信水平下的临界值。,二、Y0的置信区间,如何根据置信区间正确地陈述预测结果?,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号