《回归分析中的伪回归及其处理ppt课件.ppt》由会员分享,可在线阅读,更多相关《回归分析中的伪回归及其处理ppt课件.ppt(60页珍藏版)》请在三一办公上搜索。
1、回归分析中的伪回归及其处理方法 长期均衡关系 误差修正回归模型,回归分析的主要作用,1.描述分析与探索分析2.预测分析3.结构分析与实证分析4.政策评价,回归分析的主要作用,1.描述分析与探索分析2.预测分析3.结构分析与实证分析4.政策评价,回归分析应用预测中经常出现的问题,1、根据解释变量的预测值测算被解释变量的未来值,扩大了最后的预测误差要预测某期的GDP,需要知道解释变量的同期数值, 而实际上,在预测GDP之前,上述解释变量的同期数值也是未知的,因此,需要首先通过其他方法对解释变量的数值进行预测,然后,再利用回归模型预测GDP。这种根据解释变量的预测值回归测算被解释变量未来值的方法无形
2、之中扩大了最后的预测误差。,回归分析应用预测中经常出现的问题,2、利用非平稳时间序列直接建模容易产生“伪回归”问题 如:,回归分析应用预测中经常出现的问题,2、利用非平稳时间序列直接建模容易产生“伪回归”问题 印度的人口增长比较快,中国的GDP增长也比较快,这两个序列有着共同的趋势,能否把这两个序列建立一个模型。,回归分析应用预测中经常出现的问题,2、利用非平稳时间序列直接建模容易产生“伪回归”问题,?,较为普遍的现象!,很多经济时间序列都是非平稳的(从直观上看,随着经济的发展,多数经济时间序列呈明显的上升趋势),而直接采用非平稳时间序列建立回归模型,很容易产生“伪回归”问题。,回归分析应用预
3、测中经常出现的问题,3、存在着因果关系的变量间建立的回归预测模型的预测效果越来越差 我们建立的模型是一个均衡的模型,而实际情况不可能总是在均衡状态下,实际往往会偏离其均衡状态而处于不均衡状态。这时,则需要根据上一期的不均衡程度调整本期的预测值。,利用非平稳时间序列直接建模容易产生“伪回归”问题存在着因果关系的变量间建立的回归预测模型的预测效果越来越差怎么办?检验是否存在长期稳定的均衡关系,误差修正,一、长期均衡关系,1. 问题的提出,经典回归模型(classical regression model)是建立在稳定数据变量基础上的。对于非稳定变量,不能使用经典回归模型,否则会出现虚假回归 (伪回
4、归) 等诸多问题。,由于许多经济变量是非稳定的,这就给经典的回归分析方法带来了很大限制。但是,如果变量之间有着长期的稳定关系(即它们之间是协整的cointegration),则是可以使用经典回归模型方法建立回归模型的。例如,中国居民人均消费水平与人均GDP变量之间的回归预测模型要比ARMA模型有更好的预测功能,其原因在于,从经济理论上说,人均GDP决定着居民人均消费水平,而且它们之间有着长期的稳定关系。,某些经济变量间确实存在着长期均衡关系,这种均衡关系意味着经济系统不存在破坏均衡的内在机制,如果变量在某时期受到干扰后偏离其长期均衡点,则均衡机制将会在下一期进行调整以使其重新回到均衡状态。 假
5、设X与Y间的长期“均衡关系”由式描述:,2. 长期均衡,式中:t是随机扰动项。 该均衡关系意味着:给定X的一个值,Y相应的均衡值也随之确定为0+1X。,在t-1期末,存在下述三种情形之一:,(1)Y等于它的均衡值:Yt-1= 0+1Xt -1; (2)Y小于它的均衡值:Yt-1 0+1Xt -1; 在时期t,假设X有一个变化量Xt,如果变量X与Y在时期t与t-1末期仍满足它们间的长期均衡关系,则Y的相应变化量由式给出:,式中,vt=t-t-1。,实际情况往往并非如此,如果t-1期末,发生了上述第二种情况,即Y的值小于其均衡值,则Y的变化往往会比第一种情形下Y的变化Yt大一些; 反之,如果Y的值
6、大于其均衡值,则Y的变化往往会小于第一种情形下的Yt 。,可见,如果Yt=0+1Xt+t正确地提示了X与Y间的长期稳定的“均衡关系”,则意味着Y对其均衡点的偏离从本质上说是“临时性”的。 因此,一个重要的假设就是:随机扰动项t必须是平稳序列。 显然,如果t有随机性趋势(上升或下降),则会导致Y对其均衡点的任何偏离都会被长期累积下来而不能被消除。,式Yt=0+1Xt+t中的随机扰动项也被称为非均衡误差(disequilibrium error),它是变量X与Y的一个线性组合:,(*),因此,如果Yt=0+1Xt+t式所示的X与Y间的长期均衡关系正确的话,(*)式表述的非均衡误差应是一平稳时间序列
7、,并且具有零期望值,即是具有0均值的I(0)序列。,3.协整 从这里已看到,非稳定的时间序列,它们的线性组合也可能成为平稳的。 假设Yt=0+1Xt+t式中的X与Y是I(1)序列,如果该式所表述的它们间的长期均衡关系成立的话,则意味着由非均衡误差(*)式给出的线性组合是I(0)序列。这时我们称变量X与Y是协整的(cointegrated)。,检验变量之间的协整关系,在建立计量经济学模型中是非常重要的。 而且,从变量之间是否具有协整关系出发选择模型的变量,其数据基础是牢固的,其统计性质是优良的。,建立回归模型时,如 只要变量选择是合理的(具有长期稳定的关系,即协整关系),随机误差项一定是“白噪声
8、”(即均值为0,方差不变的稳定随机序列),模型参数有合理的经济解释。 这也解释了尽管这两时间序列是非稳定的,但却可以用经典的回归分析方法建立回归模型的原因。,二、协整检验,为了检验两变量Yt,Xt是否为协整,Engle和Granger于1987年提出两步检验法,也称为EG检验。 第一步,用OLS方法估计方程: Yt=0+1Xt+t并计算非均衡误差,得到:,称为协整回归(cointegrating)或静态回归(static regression)。第二步,检验员 的单整性,如果 是稳定的序列,则认为因变量与自变量之间具有协整关系。检验的方法仍然是DF检验或ADF检验。,进行检验时,拒绝零假设H0
9、:=0,意味着误差项et是平稳序列,从而说明X与Y间是协整的。,而OLS法采用了残差最小平方和原理,因此估计量是向下偏倚的,这样将导致拒绝零假设的机会比实际情形大。 于是对et平稳性检验的DF与ADF临界值应该比正常的DF与ADF临界值还要小。,MacKinnon(1991)通过模拟试验给出了协整检验的临界值,下表是双变量情形下不同样本容量的临界值。,例 检验中国居民人均消费水平CPC与人均国内生产总值GDPPC的协整关系。,已知C与GDP都是I(2)序列,它们的回归式:,R2=0.9981,通过对该式计算的残差序列作ADF检验,得适当检验模型,(-4.47) (3.93) (3.05),t=
10、-4.47-3.75=ADF0.05,拒绝存在单位根的假设,残差项是稳定的,因此中国居民人均消费水平与人均GDP是(2,2)阶协整的,说明了该两变量间存在长期稳定的“均衡”关系。,三、误差修正模型,前文已经提到,对于非稳定时间序列,可通过差分的方法将其化为稳定序列,然后才可建立经典的回归分析模型。 例如:建立人均消费水平(Y)与人均可支配收入(X)之间的回归模型:,1、误差修正模型,式中, vt= t- t-1,差分,X,Y成为平稳序列,建立差分回归模型,如果Y与X具有共同的向上或向下的变化趋势,然而,这种做法会引起两个问题:,(1)如果X与Y间存在着长期稳定的均衡关系: Yt=0+1Xt+t
11、且误差项t不存在序列相关,则差分式: Yt=1Xt+t 中的t是一个一阶移动平均时间序列,因而是序列相关的;,(2)如果采用差分形式进行估计,则关于变量水平值的重要信息将被忽略,这时模型只表达了X与Y间的短期关系,而没有揭示它们间的长期关系。 因为,从长期均衡的观点看,Y在第t期的变化不仅取决于X本身的变化,还取决于X与Y在t-1期末的状态,尤其是X与Y在t-1期的不平衡程度。,例如,使用Yt=1Xt+t回归时,很少出现截距项显著为零的情况,即我们常常会得到如下形式的方程:,在X保持不变时,如果模型存在静态均衡(static equilibrium),Y也会保持它的长期均衡值不变。,(*),但
12、如果使用(*)式,即使X保持不变,Y也会处于长期上升或下降的过程中,这意味着X与Y间不存在静态均衡。 这与大多数具有静态均衡的经济理论假说不相符。 可见,简单差分不一定能解决非平稳时间序列所遇到的全部问题,因此,误差修正模型便应运而生。,误差修正模型(Error Correction Model,简记为ECM)是一种具有特定形式的模型,它的主要形式是由Davidson、 Hendry、Srba和Yeo于1978年提出的,称为DHSY模型。,通过一个具体的模型来介绍它的结构。 假设两变量X与Y的长期均衡关系为: Yt=0+1Xt+t,由于现实经济中X与Y很少处在均衡点上,因此实际观测到的只是X与
13、Y间的短期的或非均衡的关系。 实际上,第t期的Y值,不仅与X的变化有关,而且与t-1期X与Y的状态值有关。假设具有如下(1,1)阶分布滞后形式:,上面回归方程不能直接运用OLS法。对上述分布滞后模型适当变形得:,或,,式中,,(*),上面回归方程不能直接运用OLS法。对上述分布滞后模型适当变形得:,或,,式中,,(*),Y的变化决定于X的变化以及前一时期的非均衡程度。,上面回归方程不能直接运用OLS法。对上述分布滞后模型适当变形得:,或,,式中,,(*),Y的变化决定于X的变化以及前一时期的非均衡程度。,t-1期的非均衡误差项,上面回归方程不能直接运用OLS法。对上述分布滞后模型适当变形得:,
14、或,,式中,,(*),Y的变化决定于X的变化以及前一时期的非均衡程度。,t-1期的非均衡误差项,Y的值已对前期的非均衡程度作出了修正。,(*),表示误差修正项,ecm的修正作用: (1)若(t-1)时刻Y大于其长期均衡解0+1X,ecm为正,则(-ecm)为负,使得Yt减少; (2)若(t-1)时刻Y小于其长期均衡解0+1X ,ecm为负,则(-ecm)为正,使得Yt增大。,知,一般情况下|1 ,由关系式=1-得:01。可以据此分析,ecm的修正作用: (1)若(t-1)时刻Y大于其长期均衡解0+1X,ecm为正,则(-ecm)为负,使得Yt减少; (2)若(t-1)时刻Y小于其长期均衡解0+
15、1X ,ecm为负,则(-ecm)为正,使得Yt增大。 (*)体现了长期非均衡误差对的控制。,其主要原因在于变量对数的差分近似地等于该变量的变化率,而经济变量的变化率常常是稳定序列,因此适合于包含在经典回归方程中。,在实际分析中,变量常以对数的形式出现。,于是: (1)长期均衡模型 Yt=0+1Xt+t中的1可视为Y关于X的长期弹性(long-run elasticity),(2)短期非均衡模型 Yt=0+1Xt+2Xt-1+Yt-1+t中的1可视为Y关于X的短期弹性(short-run elasticity)。,更复杂的误差修正模型可依照一阶误差修正模型类似地建立。,引入二阶滞后的模型为:,
16、多变量的误差修正模型也可类似地建立。,如三个变量如果存在如下长期均衡关系:,则其一阶非均衡关系可写成:,于是它的一个误差修正模型为:,参数估计法(一),参数估计法(二),可以采用打开误差修整模型中非均衡误差项括号的方法直接用OLS法估计模型。,可打开非均衡误差项的括号直接估计下式:,这时短期弹性与长期弹性可一并获得。,经济理论指出,居民消费支出是其实际收入的函数。 以中国国民经济核算中的居民消费支出经过居民消费价格指数缩减得到中国居民实际消费支出时间序列(C); 以支出法GDP对居民消费价格指数缩减近似地代表国民收入时间序列(GDP)。 时间段为19782000,例 中国居民消费的误差修正模型
17、,(1)对数据lnC与lnGDP进行单整检验,容易验证lnC与lnGDP是一阶单整的,首先,建立lnC与lnGDP的回归模型:,(2)检验lnC与lnGDP的协整性,并建立长期均衡关系,(0.30) (57.48) R2=0.994 DW=0.744,发现有残关项有较强的一阶自相关性。考虑加入适当的滞后项,得lnC与lnGDP的分布滞后模型:,(1.63) (6.62) (4.92) (-2.17) R2=0.994 DW=1.92 LM(1)=0.00 LM(2)=2.31,自相关性消除,因此可初步认为是lnC与lnGDP的长期稳定关系。,(*),残差项的稳定性检验:,(-4.32) R2=
18、0.994 DW=2.01 LM(1)=0.04 LM(2)=1.34,t=-4.32-3.64=ADF0.05 说明lnC与lnGDP是(1,1)阶协整的,(*)式即为它们长期稳定的均衡关系:,(*),以稳定的时间序列 如下:,(3)建立误差修正模型,做为误差修正项,可建立,误差修正模型:,(6.96) (2.96) (-1.91) (-3.15) R2=0.994 DW=2.06 LM(1)=0.70 LM(2)=2.04,(*),可得lnC关于lnGDP的长期弹性: (0.698-0.361)/(1-0.622)=0.892; 由(*)式可得lnC关于lnGDP的短期弹性:0.686,由(*)式:,用打开误差修正项括号的方法直接估计误差修正模型,适当估计式为:,(1.63) (6.62) (-2.99) (2.88) R2=0.791 =0.0064 DW=1.93 LM(2)=2.31 LM(3)=2.78,写成误差修正模型的形式如下:,(*),由(*)式知,lnC关于lnGDP的短期弹性为0.698,长期弹性为0.892。 可见两种方法的结果非常接近。,