《计量经济学-理论和应用8-随机时间序列模型.ppt》由会员分享,可在线阅读,更多相关《计量经济学-理论和应用8-随机时间序列模型.ppt(73页珍藏版)》请在三一办公上搜索。
1、计量经济学理论和应用,张红霞,时间序列数据的建模,如何建立一个平稳时间序列模型,如何进行预测不是以不同变量间的因果关系为基础,而是寻找时间序列自身的变化规律,不以任何经济理论为基础,主要内容,时间序列模型的基本概念及其适用性随机时间序列模型的平稳性条件随机时间序列模型的识别随机时间序列模型的估计随机时间序列模型的检验,时间序列模型的基本概念及其适用性,基本概念利用自身的过去预测自身的未来。一般形式 Xt=F(Xt-1,Xt-2,t)具体模型的建立需要:具体形式滞后期随机扰动项的结构,线性模型,一期滞后,白噪声,时间序列模型的基本概念及其适用性,基本概念上面的模型是一阶自回归过程AR(1)一般的
2、p阶自回归过程AR(p)为 Xt=1Xt-1+2Xt-2+pXt-p+t 如果随机扰动项是一个白噪声(t=t),则上式为一纯AR(p)过程(pure AR(p)process),记为 Xt=1Xt-1+2Xt-2+pXt-p+t,时间序列模型的基本概念及其适用性,基本概念如果t不是一个白噪声,通常认为它是一个q阶的移动平均(moving average)过程MA(q):t=t-1t-1-2t-2-qt-q 这是一个纯MA(q)过程(pure MA(p)process)注意:MA(q)也可记为,时间序列模型的基本概念及其适用性,基本概念纯AR(p)与纯MA(q)结合,得到一个一般的自回归移动平均
3、(autoregressive moving average)过程ARMA(p,q)Xt=1Xt-1+2Xt-2+pXt-p+t-1t-1-2t-2-qt-q一个随机时间序列可以通过一个自回归移动平均过程生成,即该序列可以由其自身的过去或滞后值以及随机扰动项来解释如果该序列是平稳的,即它的行为并不会随着时间的推移而变化,那么我们就可以通过该序列过去的行为来预测未来。,随机时间序列模型的平稳性条件,AR(p)模型的平稳性条件如果一个p阶自回归模型AR(p)生成的时间序列是平稳的,就说该AR(p)模型是平稳的,否则,就说该AR(p)模型是非平稳的 对p阶自回归模型AR(p)Xt=1Xt-1+2Xt
4、-2+pXt-p+t 引入滞后算子 LXt=Xt-1,L2Xt=Xt-2,LpXt=Xt-p,随机时间序列模型的平稳性条件,变为(1-1L-2L2-pLp)Xt=t 记(L)=(1-1L-2L2-pLp)则多项式(z)=(1-1z-2z2-pzp)=0称为AR(p)的特征方程。可以证明,如果AR(p)的特征方程的所有根都在单位圆外(模大于1),则AR(p)模型是平稳的,随机时间序列模型的平稳性条件,AR(1)模型的平稳性条件,如果模型稳定,则有E(Xt2)=E(Xt-12),从而上式可变换为,稳定条件下,方差是一非负的常数,从而有|1,AR(1)的特征方程,随机时间序列模型的平稳性条件,根为
5、z=1/AR(1)稳定,即|1,意味着特征根z大于1。,随机时间序列模型的平稳性条件,AR(2)模型的平稳性,方程两边同乘以Xt,再取期望得:而 因此,随机时间序列模型的平稳性条件,同样有方差为 由平稳性的定义,该方差必须是一不变的正数,于是有 1+21,2-11,|2|1,随机时间序列模型的平稳性条件,这就是AR(2)的平稳性条件,或称为平稳域。它是一顶点分别为(-2,-1),(2,-1),(0,1)的三角形。,(0,1),模型的平稳域,(-2,-1),(2,-1),随机时间序列模型的平稳性条件,AR(2)模型对应的特征方程1-1z-2z2=0 的两个根z1、z2满足:z1z2=-1/2,z
6、1+z2=-1/2解出1,2,随机时间序列模型的平稳性条件,由AR(2)的平稳性,|2|=1/|z1|z2|1,有于是|z2|1。由 2-1 1可推出同样的结果。,随机时间序列模型的平稳性条件,对高阶自回模型AR(p)来说,多数情况下没有必要直接计算其特征方程的特征根,但有一些有用的规则可用来检验高阶自回归模型的稳定性:AR(p)模型稳定的必要条件是:1+2+p1 由于i(i=1,2,p)可正可负,AR(p)模型稳定的充分条件是:|1|+|2|+|p|1,随机时间序列模型的平稳性条件,MA(q)模型的稳定性,Xt=t-1t-1-2t-2-qt-q,当滞后期大于q时,Xt的自协方差系数为0。有限
7、阶移动平均模型总是平稳的。,随机时间序列模型的平稳性条件,ARMA(p,q)模型的稳定性 MA(q)模型总是平稳的,因此ARMA(p,q)模型的平稳性取决于AR(p)部分的平稳性。当AR(p)部分平稳时,则该ARMA(p,q)模型是平稳的,否则,不是平稳的.,随机时间序列模型的平稳性条件,一个平稳的时间序列总可以找到生成它的平稳的随机过程或模型;一个非平稳的随机时间序列通常可以通过差分的方法将它变换为平稳的,对差分后平稳的时间序列也可找出对应的平稳随机过程或模型,随机时间序列模型的平稳性条件,如果一个非平稳时间序列通过d次差分,变为平稳的,然后用一个平稳的ARMA(p,q)模型作为它的生成模型
8、,则我们就说该原始时间序列是一个自回归单整移动平均(autoregressive integrated moving average)时间序列,记为ARIMA(p,d,q)。一个ARIMA(2,1,2)时间序列在它成为平稳序列之前先得差分一次,然后用一个ARMA(2,2)模型作为它的生成模型的。,随机时间序列模型的识别,随机时间序列模型的识别,就是对于一个平稳的随机时间序列,找出生成它的合适的随机过程或模型,即判断该时间序列是遵循一纯AR过程、还是遵循一纯MA过程或ARMA过程所使用的工具主要是时间序列的自相关函数(autocorrelation function,ACF)及偏自相关函数(pa
9、rtial autocorrelation function,PACF),随机时间序列模型的识别,AR(p)过程的识别自相关函数ACF 例 一阶自回归模型 Xt=Xt-1+t 其k阶滞后自协方差为AR(1)模型的自相关函数为 由AR(1)的稳定性知|1,因此,k时,呈指数形衰减,直到零。这种现象称为拖尾或称AR(1)有无穷记忆(infinite memory)。,随机时间序列模型的识别,AR(p)过程的识别例 阶自回归模型AR(2)Xt=1Xt-1+2Xt-2+tk期滞后自协方差k 阶自相关函数为 其中:1=1/(1-2),0=1,如果AR(2)稳定,则由1+21知|k|衰减趋于零,呈拖尾状。
10、至于衰减的形式,要看AR(2)特征根的实虚性,若为实根,则呈单调或振荡型衰减,若为虚根,则呈正弦波型衰减。,AR(p)过程的识别 p阶自回归模型AR(p)Xt=1Xt-1+2Xt-2+pXt-p+t 其k期滞后协方差为:自相关函数可见,无论k有多大,k的计算均与其到p阶滞后的自相关函数有关,因此呈拖尾状。如果AR(p)是稳定的,则|k|递减且趋于零,事实上,自相关函数是一p阶差分方程,其通解为其中:1/zi是AR(p)特征方程(z)=0的特征根,由AR(p)平稳的条件知,|zi|1;因此,当1/zi均为实数根时,k呈几何型衰减(单调或振荡);当存在虚数根时,则一对共扼复根构成通解中的一个阻尼正
11、弦波项,k呈正弦波衰减。,AR(p)过程的识别偏自相关函数 为什么提出偏自相关函数?例:在AR(1)随机过程中,Xt与Xt-2间有相关性可能主要是由于它们各自与Xt-1间的相关性带来的:即自相关函数中包含了这种所有的“间接”相关。与之相反,Xt与Xt-k间的偏自相关函数(partial autocorrelation,简记为PACF)则是消除了中间变量 Xt-1,Xt-k+1 带来的间接相关后的直接相关性,它是在已知序列值Xt-1,Xt-k+1的条件下,Xt与Xt-k间关系的度量。,在AR(1)中,从Xt中去掉Xt-1的影响,则只剩下随机扰动项t,显然它与Xt-2无关,因此我们说Xt与Xt-2
12、的偏自相关系数为零,记为同样地,在AR(p)过程中,对所有的kp,Xt与Xt-k间的偏自相关系数为零。AR(p)的一个主要特征是:kp时,k*=Corr(Xt,Xt-k)=0 即k*在p以后是截尾的。,AR(p)随机时间序列的识别原则:若Xt的偏自相关函数在p以后截尾,即kp时,k*=0,而它的自相关函数k是拖尾的,则此序列是自回归AR(p)序列。当kp时,rk*不会全为0,而是在0的上下波动。但可以证明,当kp时,rk*服从如下渐近正态分布:rk*N(0,1/n)式中n表示样本容量。,MA(q)过程的识别,对MA(1)过程,其自协方差系数:,于是,MA(1)过程的自相关函数为:,可见,当k1
13、时,k=0,即Xt与Xt-k不相关,MA(1)自相关函数是截尾的。,MA(q)过程的识别 MA(1)过程可以等价地写成t关于无穷序列Xt,Xt-1,的线性组合的形式:是一个AR()过程,它的偏自相关函数非截尾但却趋于零,因此MA(1)的偏自相关函数是非截尾但却趋于零的,MA(q)过程的识别,其自协方差系数为,q阶移动平均过程MA(q),相应的自相关函数为,可见,当kq时,Xt与Xt-k不相关,即存在截尾现象,因此,当kq时,k=0是MA(q)的一个特征。于是:可以根据自相关系数是否从某一点开始一直为0来判断MA(q)模型的阶。与MA(1)相仿,可以验证MA(q)过程的偏自相关函数是非截尾但趋于
14、零的。MA(q)模型的识别规则:若随机序列的自相关函数截尾,即自q以后,k=0(kq);而它的偏自相关函数是拖尾的,则此序列是滑动平均MA(q)序列,同样需要注意的是:在实际识别时,由于样本自相关函数rk是总体自相关函数k的一个估计,由于样本的随机性,当kq时,rk不会全为0,而是在0的上下波动。但可以证明,当kq时,rk服从如下渐近正态分布:rkN(0,1/n)式中n表示样本容量。,ARMA(p,q)过程的识别 ARMA(p,q)的自相关函数,可以看作MA(q)的自相关函数和AR(p)的自相关函数的混合物。当p=0时,它具有截尾性质;当q=0时,它具有拖尾性质;当p、q都不为0时,它具有拖尾
15、性质 从识别上看,通常:ARMA(p,q)过程的偏自相关函数(PACF)可能在p阶滞后前有几项明显的尖柱(spikes),但从p阶滞后项开始逐渐趋向于零;而它的自相关函数(ACF)则是在q阶滞后前有几项明显的尖柱,从q阶滞后项开始逐渐趋向于零。,ACF PACF,模型,1,:,随机时间序列模型的估计,估计方法最小二乘估计;矩估计;利用自相关函数的直接估计。,AR(p)模型的Yule Walker方程估计,在AR(p)模型的识别中,曾得到,利用k=-k,得到如下方程组:,AR(p)模型的Yule Walker方程估计 此方程组被称为Yule Walker方程组。该方程组建立了AR(p)模型的模型
16、参数1,2,p与自相关函数1,2,p的关系。估计方法:首先,求得自相关函数的估计值 然后利用Yule Walker方程组,求解模型参数的估计值,2的估计值,MA(q)模型的矩估计,将MA(q)模型的自协方差函数中的各个量用估计量代替,得到:,首先求得自协方差函数的估计值,上式是一个包含(q+1)个待估参数,的非线性方程组,可以用直接法或迭代法求解。,常用的迭代方法有线性迭代法和Newton-Raphsan迭代法。,MA(1)模型的直接算法,于是,或,有,于是有解,由于参数估计有两组解,可根据可逆性条件|1|1来判断选取一组。,MA(q)模型的迭代算法,第一步,给出,的一组初值,比如,代入上式,
17、计算出第一次迭代值,第二步,将第一次迭代值重新代入原式,计算出第二次迭代值,按此反复迭代下去,直到第m步的迭代值与第m-1步的迭代值相差不大时(满足一定的精度),便停止迭代,并用第m步的迭代结果作为近似解。,ARMA(p,q)模型的矩估计 在ARMA(p,q)中共有(p+q+1)个待估参数1,2,p与1,2,q以及2,其估计量计算步骤及公式如下:第一步,估计1,2,p 是总体自相关函数的估计值,可用样本自相关函数rk代替。,第二步,改写模型,求1,2,q以及2的估计值,将模型,写成,于是,构成一个MA模型。按照估计MA模型参数的方法,可以得到1,2,q以及2的估计值。,令,AR(p)模型的最小
18、二乘估计设已有1,2,p的估计值 残差的平方和为:根据最小二乘原理,解该方程组,就可得到待估参数的估计值。与Yule Walker方程比较 而,得到或解得比较发现,当n足够大时,二者是相似的。,j=1,2,p,j=1,2,p,随机时间序列模型的检验,随机时间序列模型在识别中,其滞后项阶数的选择并不容易,因此在识别与估计之后还需要进行检验。ARMA(p,q)是在随机干扰项是白噪声的基础上进行的,因此,如果模型估计正确,残差应代表一个白噪声序列在实际识别ARMA(p,q)模型时,有可能存在不止一组(p,q)值都能通过识别检验。增加p,q的阶数,可以增加拟合优度,但同时降低了自由度。存在模型的简洁与
19、拟合优度的权衡选择问题。,随机时间序列模型的检验,残差项的白噪声检验如果通过所估计的模型计算的样本残差不代表一白噪声,则说明模型的识别与估计有误,需重新识别与估计。可用QLB的统计量进行2检验:在给定显著性水平下,可计算不同滞后期的QLB值,通过与2分布表中的相应临界值比较,来检验是否拒绝残差序列为白噪声的假设。若大于相应临界值,则应拒绝所估计的模型,需重新识别与估计。,自由度与拟合优度的权衡常用的模型选择的判别标准有:赤池信息准则(Akaike information criterion,简记为AIC)与施瓦兹贝叶斯准则(Schwartz Bayesian criterion,简记为SBC)
20、:,其中,n为待估参数个数(p+q+可能存在的常数项),T为可使用的观测值,RSS为残差平方和(Residual sum of squares)。在选择可能的模型时,AIC与SBC越小越好 显然,如果添加的滞后项没有解释能力,则对RSS值的减小没有多大帮助,却增加待估参数的个数,因此使得AIC或SBC的值增加。需注意的是:在不同模型间进行比较时,必须选取相同的时间段。,例:中国支出法GDP的ARMA(p,q)模型数据表如前。支出法GDP的一阶差分平稳,对一阶差分后的序列建立模型识别 记GDP经一阶差分后的新序列为GDPD1,该新序列的样本自相关函数图与偏自相关函数图、样本自相关函数和偏自相关函
21、数如下。,图形:样本自相关函数图形呈正弦线型衰减,而偏自相关函数图形则在滞后两期后迅速趋于0。因此可初步判断该序列满足2阶自回归过程AR(2)。自相关函数与偏自相关函数的函数值:相关函数具有明显的拖尾性;偏自相关函数值在k2以后,偏自相关函数是截尾的。一阶差分后的GDP满足AR(2)随机过程。,估计有如下Yule Walker 方程:解得,估计 最小二乘估计(7.91)(-3.60)r2=0.8469 R2=0.8385 DW=1.15 有时,在用回归法时,也可加入常数项。(1.99)(7.74)(-3.58)r2=0.8758 R2=0.8612 DW.=1.22,检验三模型的残差项的自相关
22、系数及QLB检验值,用建立的AR(2)模型对中国支出法GDP进行外推预测模型1已知t-1、t-2、t-3期的GDP时,就可对第t期的GDP作出外推预测。,例:中国人均居民消费(CPC)的随机时间序列模型,中国人均居民消费(CPC)经过二次差分后的新序列记为CPCD2,在5%的显著性水平下,通过Q统计量容易验证该序列本身就接近于一白噪声,因此可考虑采用零阶MA(0)模型:由于k=2时,|r2|=|-0.29|因此,也可考虑采用下面的MA模型:,纯MA模型中,模型4具有较好的性质,但由于MA(5)的t检验偏小,因此可选取模型3。通过模型3的外推预测 t表示预测期的随机扰动项,它未知,可假设为0,于是t期的预测式为:为模型3中滞后2期与滞后4期的相应残差项的估计值,