《《多元回归模型》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《多元回归模型》PPT课件.ppt(83页珍藏版)》请在三一办公上搜索。
1、第三章 经典单方程计量经济学模型:多元线性回归模型Multiple Linear Regression Model,本章内容,多元线性回归模型概述 多元线性回归模型的参数估计 多元线性回归模型的统计检验多元线性回归模型的预测可化为线性的非线性模型受约束回归,3.1 多元线性回归模型概述(Regression Analysis),一、多元线性回归模型二、多元线性回归模型的基本假设,一、多元线性回归模型,总体回归模型,总体回归模型:总体回归函数的随机表达形式,k为解释变量的数目。习惯上,把常数项看成为虚变量的系数,该虚变量的样本观测值始终取1。于是,模型中解释变量的数目为(k+1)。j称为回归参数
2、(regression coefficient)。,总体回归函数:描述在给定解释变量Xi条件下被解释变量Yi的条件均值。,j也被称为偏回归系数(partial regression coefficients),表示在其他解释变量保持不变的情况下,Xj每变化1个单位时,Y的均值E(Y)的变化。或者说j给出了Xj的单位变化对Y均值的“直接”或“净”(不含其他变量)影响。,总体回归函数,样本回归函数与样本回归模型,从一次抽样中获得的总体回归函数的近似,称为样本回归函数(sample regression function)。样本回归函数的随机形式,称为样本回归模型(sample regression
3、 model)。,在一个容量为n的样本下,样本回归函数和样本回归模型可表示为:,样本回归函数的矩阵表示,二、多元线性回归模型的基本假设,假设1:模型设定正确假设。假设2:解释变量X1,X2,Xk是非随机的或固定的。且Xj之间不存在严格线性相关性。假设3:各在所抽取的样本中具有变异性,而且随着样本容量的无限增加,各解释变量的样本方差趋于一个非零的有限常数。,假设4:随机误差项具有条件零均值、同方差以及不序列相关性。,假设5:解释变量与随机误差项之间不相关。,假设6:随机误差项满足正态分布。,3.2 多元线性回归模型的估计,一、普通最小二乘估计二、参数估计量的性质 三、样本容量问题四、估计实例,一
4、、普通最小二乘估计(OLS),在满足基本假设的情况下,多元线性模型结构参数的普通最小二乘估计具有线性性、无偏性、有效性。同时,随着样本容量增加,参数估计量具有渐近无偏性、渐近有效性、一致性。,二、参数估计量的性质,三、样本容量问题,1、最小样本容量,所谓“最小样本容量”,即从最小二乘原理和最大或然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。,样本最小容量必须不少于模型中解释变量的数目(包括常数项),即 n k+1,2、满足基本要求的样本容量,从统计检验的角度:n30 时,Z检验才能应用;n-k8时,t分布较为稳定。,一般经验认为:当n30或者至少n3(k+1)时,才能说
5、满足模型估计的基本要求。,模型的良好性质只有在大样本下才能得到理论上的证明。,四、例题,地区城镇居民消费模型,被解释变量:地区城镇居民人均消费Y解释变量:地区城镇居民人均可支配收入X1前一年地区城镇居民人均消费X2样本:2006年,31个地区,数据,变量间关系,变量间关系,OLS估计,OLS估计结果,经济意义:X1的回归系数为0.56,表示在其他变量不变的情况下,人均可支配收入每增加1元,人均消费支出可增加0.56元。X2的回归系数为0.25,表示在其他变量不变的情况下,上一年人均消费支出每增加1元,下一年人均消费支出可增加0.25元。,回归方程,随机误差项的方差,3.3 多元线性回归模型的统
6、计检验 Statistical Test of Multiple Linear Regression Model,一、拟合优度检验 二、方程的显著性检验(F检验)三、变量的显著性检验(t检验)四、参数的置信区间,一、拟合优度检验 Goodness of Fit,1、概念,拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。,2、可决系数与调整的可决系数,总离差平方和的分解,可决系数(Coefficient of Determination),该统计量越接近于1,模型的拟合优度越高。,在应用过程中发现,如果在模型中增加解释变量,R2往往增大。,这就给人一个错觉:要使得模型拟合得好,只要增
7、加解释变量即可。,但是,由增加解释变量引起的R2的增大与拟合好坏无关,所以R2需调整。,调整的可决系数(adjusted coefficient of determination),其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。,调整的可决系数多大才是合适的?,回归平方和ESS的自由度为:,k,3、赤池信息准则和施瓦茨准则,为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的标准还有:赤池信息准则(Akaike information criterion,AIC),施瓦茨准则(Schwarz criterion,SC),这两准则均要求仅当所增加的解释变量能够减少AI
8、C值或SC值时才在原模型中增加该解释变量。,地区城镇居民消费模型(k=2),地区城镇居民消费模型(k=1),与k=2比较,有所减小但变化不大,二、方程的显著性检验(F检验)Testing the Overall Significance of a Multiple Regression(the F test),1、方程显著性的F检验,方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。在多元模型中,即检验模型中的参数j是否显著不为0。,F检验的思想来自于总离差平方和的分解式 TSS=ESS+RSS,如果这个比值较大,则X的联合体对Y的解释程度高,可认为
9、总体存在线性关系,反之总体上可能不存在线性关系。因此,可通过该比值的大小对总体线性关系进行推断。,在原假设H0成立的条件下,统计量,给定显著性水平,可得到临界值F(k,n-k-1),由样本求出统计量F的数值,如果 F F(k,n-k-1),拒绝原假设H0,则原方程总体上的线性关系显著成立。FF(k,n-k-1),接受原假设H0,则原方程总体上的线性关系不能显著成立。,地区城镇居民消费模型,拒绝零假设,犯错误的概率为0,在Eviews结果中,可根据F统计量的P值来决定是否拒绝H0假设。即p0.05,接受零假设,反之则拒绝零假设。,3、关于拟合优度检验与方程显著性检验关系的讨论,对于一般的实际问题
10、,在5%的显著性水平下,F统计量的临界值所对应的R2的水平是较低的。所以,不宜过分注重R2值,应注重模型的经济意义;在进行总体显著性检验时,显著性水平应该控制在5%以内。,三、变量的显著性检验(t检验)Testing the Significance of Variables(the t test),方程的总体线性关系显著不等于每个解释变量对被解释变量的影响都是显著的。必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。这一检验是由对变量的 t 检验完成的。,1、t统计量,以cjj表示矩阵(XX)-1 主对角线上的第j个元素,2、t检验,设计原假设与备择假设:,H1:j 0
11、,给定显著性水平,可得到临界值t/2(n-k-1),由样本求出统计量t的数值,通过|t|t/2(n-k-1)或|t|t/2(n-k-1)判断拒绝或不拒绝原假设H0,从而判定对应的解释变量是否应包括在模型中。,H0:j=0(j=1,2k),地区城镇居民消费模型,在Eviews结果中,可根据t统计量的P值来决定是否拒绝H0假设。即p0.05,接受零假设,反之则拒绝零假设。,3、关于常数项的显著性检验,T检验同样可以进行。一般不以t检验决定常数项是否保留在模型中,而是从经济意义方面分析回归线是否应该通过原点。,四、参数的置信区间 Confidence Interval of Parameter,1、
12、参数的置信区间,在(1-)的置信水平下,地区城镇居民消费模型,2、如何才能缩小置信区间?,增大样本容量n,因为在同样的样本容量下,n越大,t分布表中的临界值越小,同时,增大样本容量,还可使样本参数估计量的标准差减小。提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型优度越高,残差平方和应越小。提高样本观测值的分散度,一般情况下,样本观测值越分散,(XX)-1的分母的|XX|的值越大,致使区间缩小。,3.4 多元线性回归模型的预测,一、E(Y0)的置信区间 二、Y0的置信区间,(1-)的置信水平下,E(Y0)的置信区间:,其中,t/2为(1-)的置信水平下的临界值。,一、E(
13、Y0)的置信区间,二、Y0的置信区间,(1-)的置信水平下,Y0的置信区间:,3.5 回归模型的其他函数形式,一、模型的类型与变换 二、非线性回归实例,说 明,在实际经济活动中,经济变量的关系是复杂的,直接表现为线性关系的情况并不多见。如著名的恩格尔曲线(Engle curves)表现为幂函数曲线形式、宏观经济学中的菲利普斯曲线(Pillips cuves)表现为双曲线形式等。但是,大部分非线性关系又可以通过一些简单的数学处理,使之化为数学上的线性关系,从而可以运用线性回归模型的理论方法。,一、模型的类型与变换,1、倒数模型、多项式模型与变量的直接置换法,例如,商品的需求曲线是一种双曲线形式,
14、商品的需求量Q与商品的价格P之间的关系表现为非线性关系:,一、模型的类型与变换,1、倒数模型、多项式模型与变量的直接置换法,再如,描述税收与税率关系的拉弗曲线:抛物线 s=a+b r+c r2 c0 s:税收;r:税率,设X1=r,X2=r2,则原方程变换为 s=a+b X1+c X2,c0,2、幂函数模型、指数函数模型与对数变换法,例如,Cobb-Dauglas生产函数:幂函数 Q=AKLeQ:产出量,K:投入的资本;L:投入的劳动,方程两边取对数:ln Q=ln A+ln K+ln L,已知某国生产函数如下:其中,Y为国内生产总值(亿元),K为资本投入(亿元),L为劳动力投入(人)(1)解
15、释参数的经济意义。(2)若资本投入增加10%将导致国内生产总值如何变化?(3)在资本投入增加10%情况下,劳动投入降低多少即可保持国内生产总值不变。,答:(1)根据模型结果可知资本的产出弹性约为0.76,即在其他情况不变的条件下,资本投入每增加一个百分点,产出平均提高0.76个百分点。劳动投入的产出弹性为0.64,即在其他条件不变的条件下,劳动投入每增加一个百分点,产出平均提高0.64个百分点。(2)若资本投入增加10%将导致国内生产总值增加7.6%。(3)在资本投入增加10%情况下,劳动投入降低11.875%即可保持国内生产总值不变。,3、复杂函数模型与级数展开法,方程两边取对数后,得到:,
16、(1+2=1),Q:产出量,K:资本投入,L:劳动投入:替代参数,1、2:分配参数,例如,常替代弹性CES生产函数,将式中ln(1K-+2L-)在=0处展开泰勒级数,取关于的线性项,即得到一个线性近似式。,如取0阶、1阶、2阶项,可得,二、可化为线性的非线性回归实例,例 建立中国城镇居民食品消费需求函数模型。,根据需求理论,居民对食品的消费需求函数大致为,Q:居民对食品的需求量,X:消费者的消费支出总额P1:食品价格指数,P0:居民消费价格总指数。,零阶齐次性,当所有商品价格和消费者货币支出总额按同一比例变动时,需求量保持不变,(1),(2),为了进行比较,将同时估计(1)式与(2)式。,根据
17、恩格尔定律,居民对食品的消费支出与居民的总支出间呈幂函数的变化关系:,首先,确定具体的函数形式,对数变换:,考虑到零阶齐次性时,(3),(4),(4)式也可看成是对(3)式施加如下约束而得,因此,对(4)式进行回归,就意味着原需求函数满足零阶齐次性条件。,X:人均消费X1:人均食品消费GP:居民消费价格指数FP:居民食品消费价格指数Q:人均食品消费(2000年价)P0:居民消费价格缩减指数(2000年=100)P1:居民食品消费价格缩减指数(2000年=100),按(3)式估计,具体解释估计结果及其经济含义。,按(4)式估计,具体解释估计结果及其经济含义。,3.6 受约束回归 Restrict
18、ed Regression,一、模型参数的线性约束 二、对回归模型增加或减少解释变量,说 明,在建立回归模型时,有时根据经济理论需要对模型中的参数施加一定的约束条件。例如:需求函数的0阶齐次性条件生产函数的1阶齐次性条件模型施加约束条件后进行回归,称为受约束回归(restricted regression);未加任何约束的回归称为无约束回归(unrestricted regression)。,一、模型参数的线性约束,1、参数的线性约束,2、参数线性约束检验,对所考查的具体问题能否施加约束?需进一步进行相应的检验。常用的检验有:F检验、x2检验与t检验。F检验构造统计量;检验施加约束后模型的解释
19、能力是否发生显著变化。,受约束样本回归模型的残差平方和RSSR大于无约束样本回归模型的残差平方和RSSU。这意味着,通常情况下,对模型施加约束条件会降低模型的解释能力。,如果约束条件为真,则受约束回归模型与无约束回归模型具有相同的解释能力,RSSR 与 RSSU的差异较小。可用(RSSR RSSU)的大小来检验约束的真实性。,例 中国城镇居民对食品的人均消费需求实例中,对零阶齐次性检验:,取=5%,查得临界值F0.05(1,18)=4.41 结论:不能拒绝中国城镇居民对食品的人均消费需求函数具有零阶齐次特性这一假设。,无约束回归:RSSU=0.017748,kU=3 受约束回归:RSSR=0.
20、017787,KR=2 样本容量n=22,约束条件个数kU-kR=3-2=1,二、对回归模型增加或减少解释变量,前者可以被看成是后者的受约束回归,通过约束检验决定是否增加变量。,H0:,如果约束条件为真,即额外的变量Xk+1,Xk+q对Y没有约束能力,则F统计量较小;否则条件为假,额外的变量Xk+1,Xk+q对Y有较强的约束能力,则F统计量较大。,因此可通过给定某一显著水平下F分布的临界值与F统计量的计算值的比较来判断额外变量Xk+1,Xk+q是否应包括在模型中,例在例中,无约束模型为:,去掉两个价格因素的受约束回归模型的结果:,可进行如下F检验:,在0.05显著水平下,F0.05(2,18)=3.55,拒绝零假设,则两变量的系数不同时为0。,去掉城镇居民消费价格指数P0,在0.05显著水平下,F0.05(1,18)=4.41,接受零假设,P0的系数显著为0。,习题13,即资产与劳动的产出弹性之和近似为1,表明中国制造业在该年基本呈现规模报酬不变的状态。,参数约束检验:,F统计量对应的P值为0.7520.05所以,不拒绝原假设,原假设为真。,