《时间序列模型案例分析.docx》由会员分享,可在线阅读,更多相关《时间序列模型案例分析.docx(22页珍藏版)》请在三一办公上搜索。
1、 案例分析1:中国人口时间序列模型(file:b2c1)(怎样建立AR模型) 图2.11 中国人口序列(1949-2000) 图2.12 中国人口一阶差分序列(1950-2000)从人口序列图可以看出我国人口总水平除在1960和1961两年出现回落外,其余年份基本上保持线性增长趋势。51年间平均每年增加人口1451.5万人,年平均增长率为17.5 。由于总人口数逐年增加,实际上的年人口增长率是逐渐下降的。把51年分为两个时期,即改革开放以前时期(19491978)和改革开放以后时期(19791996),则前一个时期的人口年平均增长率为20,后一个时期的年平均增长率为13.4。从人口序列的变化特
2、征看,这是一个非平稳序列。见人口差分序列图。建国初期由于进入和平环境,同时随着国民经济的迅速恢复,人口的年净增数从1950年的1029万人,猛增到1957年的1825万人。由于粮食短缺,三年经济困难时期是建国后我国惟一一次人口净负增长时期(1960,1961),人口净增值不但没有增加,反而减少。随着经济形势的好转,从1962年开始人口年增加值迅速恢复到1500万的水平,随后呈连年递增态势。1970年是我国历史上人口增加最多的一个年份,为2321万人。随着70年代初计划生育政策执行力度的加强,从1971年开始。年人口增加值逐年下降,至1980年基本回落到建国初期水平。1981至1991年人口增加
3、值大幅回升,主要原因是受19621966年高出生率的影响(1963年为43.73)。这种回升的下一个周期将在2005年前后出现,但强势会有所减弱。从数据看,1992年以后,人口增加值再一次呈逐年下降趋势。由于现在的人口基数大于以往年份,所以尽管年增人口仍在1千万人以上,但人口增长率却是建国以来最低的(1996年为10.5)。从yt的变化特征看,1960,1961年数据可看作是两个离群值,其它年份数据则表现为平稳特征。但也不是白噪声序列,而是一个含有自相关和(或)移动平均成分的平稳序列。下面通过对人口序列yt和人口差分序列Dyt的相关图,偏相关图分析判别其平稳性以及识别模型形式。图2.13 yt
4、的相关图,偏相关图图2.14 Dyt的相关图,偏相关图(虚线到中心线的距离是2 (1/) = 0.28)见图2.13和图2.14。人口序列yt是非平稳序列。人口差分序列Dyt是平稳序列。应该用Dyt建立模型。因为Dyt均值非零,结合图2.14拟建立带有漂移项的AR(1)模型。估计结果如下:Dyt = 0.1429 + 0.6171 (Dyt-1 - 0.1429) + vt (8.7) (5.4) R2 = 0.38, Q(10) = 5.2, Qa (k-p-q) = Q0.05 (10-1-0-1) = 15.5模型参数都通过了显著性t检验。注意:(1)根据Wold分解定理,EViews的
5、输出格式表示的是,对序列(Dyt - 0.1429) 建立AR(1)模型,而不是对Dyt建立AR(1)模型。(2)整理输出结果:Dyt = 0.1429 (1-0.6171) + 0.6171 Dyt-1 + vt = 0.0547 + 0.6171 Dyt-1 + vt漂移项a = 0.0547,特征根是1 / 0.62 = 1.61。输出结果中的0.1429是Dyt的均值,不是模型漂移项。以AR(1)过程xt=a+f1 xt-1 + ut为例,两侧求期望,得均值m 和漂移项q0的关系是E(xt) =m ,或 a =m (1-f1) 对整理后的输出结果两侧求期望,就会反求出m = 0.054
6、7/ (1-0.6171) = 0.1429(3)有没有漂移项对求特征方程和特征根无影响。模型残差的相关图和偏相关图如下,图2.15 表2.5中模型(1)残差序列的相关图,偏相关图因为Q(10) = 5.2 c20.05( 10-1-0) = 16.9可以认为模型误差序列为非自相关序列。EViews操作方法:从EViews主菜单中点击Quick键,选择Estimate Equation功能。随即会弹出Equation specification对话框。输入漂移项非零的AR(1)模型估计命令(C表示漂移项)如下: D(Y) C AR(1)注意:(1)不能把命令中的AR(1)写成D(Y (-1)(
7、写成D(Y (-1)意味着做OLS估计)。(2)写成D(Y)的好处是EViews可以直接对Y、D(Y)进行预测。(3)模型中若含有移动平均项,EViews命令用MA(q)表示。(4)估计的时间序列模型的R2不可能很高。因为变量差分后损失了很多信息。(5)估计的模型是否成立应该从3个方面检查,模型参数估计量必须通过t检验;全部的特征根的倒数必须在单位圆以内;模型的残差序列必须通过Q检验。(6)在模型估计结果窗口通过View/ARMA Structure/Correlogram命令可以观察样本的相关图与理论AR(1)过程相关图的对比图。下面进行预测:Dy2001 = 0.0547 + 0.6171
8、 Dy2000 + v2001 = 0.0547 + 0.6171 0.0957 +0= 0.1138 y2001 = y2000 + Dy2001 = 12.6743 + 0.1138 = 12.7881EViews给出的预测值是12.78806,结果相同。预测的EViews操作方法:把样本容量调整到1949-2001。打开估计式窗口,在Equation Specification(方程设定)选择框输入命令,D(Y) C AR(1),保持Method(方法)选择框的缺省状态(LS方法),在Sample(样本)选择框中把样本范围调整至1949-2000。点击OK键,得到估计结果后,点击功能条中
9、的预测(Forecast)键。得对话框及各种选择状态见下图。点击OK键,YF和YFse序列出现在工作文件中。打开YF序列窗口,得2001年预测值12.78806,见前图。已知2001年中国人口实际数是12.7627亿人。预测误差为 h = 0.002图2.17 点击forecast键只选取2001年动态或静态的预测结果 解法2: 把中国人口序列yt看作是含有确定性趋势的平稳序列。前提是中国人口序列yt必须是退势平稳序列。用yt对时间t回归,得yt = 5.0152 + 0.1502 t + ut(110) (102) R2 = 0.995, (1949-2001)用ut检验单位根如下。dut
10、= -0.0940 ut-1 + 0.6681 dut-1(-2.5) (6.3) R2 = 0.45, (1951-2001), DF0.05 = -1.96图16 ut序列ut是一个平稳序列。所以yt是一个退势平稳序列。有理由建立一个含有固定趋势项的时间序列模型。图17 ut的相关图和偏相关图通过观察ut的相关图和偏相关图,判定ut是一个二阶自回归过程。f1为正,f2为负。特征根应该为复根。建立含有固定趋势项的二阶自回归模型 Y C trend(1948) AR(1) AR(2)估计结果如下:写表达式如下:yt = 4.9729 + 0.1508 t + ut, (1949,t = 1)(
11、34.9) (35.4) 其中ut = 1.5503 ut-1 - 0.6491 ut-2 + vt , (1949,t = 1) (13.7) (-5.9) 或写为 yt = 4.9729 + 0.1508 t + 1.5503 ut-1 - 0.6491 ut-2 + vt , (1949,t = 1)(34.9) (35.4) (13.7) (-5.9) R2 = 0.995, (1951-2000) , Q(10) = 4.6, Qa (k-p-q) = Q0.05 (10-2-0-2) = 12.6模型残差序列的相关与偏相关图如下,根据上式预测,2001年中国人口预测数是y2001
12、= 4.9729 +0.1508253 +1.5503(-0.15179) - 0.6491 (-0.09728)=12.7942(亿人), (2001年, t = 53)也可以把输出结果写为,yt = 4.9729+0.1508 t +1.5503 (yt-1-4.9729-0.1508(t-1) - 0.6491(yt-2-4.9729-0.1508(t-2)+vt(34.9) (35.4) (13.7) (-5.9) 整理后得yt = 0.5293+0.0149 t +1.5503 yt-1 - 0.6491yt-2 + vt 注意:EViews的输出格式表示的是对序列(yt -4.97
13、29-0.1508t)估计AR(2)模型。根据上式预测,2001年中国人口预测数是y2001 = 0.5293 + 0.0149 53 +1.5503 (12.6743)-0.6491 (12.5786)=12.8032(亿人), (2001年, t = 53)EViews预测的结果是12.8033。已知2001年中国人口实际数是12.7627亿人。预测误差为 h = 0.003图2.18 点击forecast键只选取2001年动态或静态的预测结果案例2 日本人口时间序列模型(file:japopu)(怎样建立缺项的AR模型) 图1 日本人口序列(yt) 日本人口差分序列(Dyt) 人口数字之
14、所以起于1872年,是因为1872年日本才有了全国人口统计数字。在122年间(1872-1994),日本人口从3480.6万人增至12503.4万人(3.6倍)。日本人口增加的特点是两头慢,中间快。同时在1944-1946年和1972年人口总量出现了激烈波动。1944-1946年的波动是因为战败,1972年的波动是由于美国归还冲绳。由图1中的相关图可以判定日本人口序列yt是一个非平稳序列。由图2可以看出日本人口差分序列Dyt是一个平稳序列。图3是日本人口的二次差分序列DDyt。它也是一个平稳序列。差分序列Dyt的极差是0.059,差分序列DDyt的极差是0.087。可见DDyt是一个过度差分序
15、列。应该用Dyt建立时间序列模型。日本历史上有两次大规模向国外学习的过程。一次是大化改新。大化改新(公元645-649)是一场以圣德太子政治理念为基础的贵族革命。圣德太子(公元574-622)一心加强皇权,决心向中国学习,启蒙日本。他四度向中国派遣使团和留学生。在它的影响下,其死后23年,即公元645年,中大兄皇子发动政变,成功地建立了类似唐朝的中央集权机构。一次是明治维新。明治维新始于1868年。从而开始了全面向西方学习的历史。口号是“富国强兵”(福泽谕吉)。主要措施是(1)加强中央集权,1871年实施“废藩治县”,(2)1872年采取美国三权分立的政治体制,(3)1872年统一货币,实行1
16、日元=1美元的兑换率,(3)1872年开始修铁路、建立现代统计制度,采用阳历等,(4)1873年迁都东京。 图2 yt的相关图与偏相关图, Dyt的相关图与偏相关图 图3 日本人口二次差分序列D2yt D2yt相关图、偏相关图由Dyt的相关图、偏相关图(见图2)初步判定应建立均值非零的AR(3) 或AR(4) 模型。估计结果如下: 先估计AR(4) 模型,化简至AR(3) 模型图4 EViews估计结果图5 模型 (2.79) 残差的相关图与偏相关图对应的模型表达式是Dyt = 0.0076 + 0.2627 (Dyt-1 - 0.0076) + 0.2767 (Dyt-3 - 0.0076)
17、 + vt (7.4) (3. 0) (3.2) R2 = 0.19, Q = 7.0, Qa (k-p-q) = Q0.05 (15-2-0) = 22.4注意:EViews的输出格式表示的是对序列(Dyt - 0.0076)估计AR(3)模型。整理:Dyt = 0.0076 (1-0.2627-0.2767) + 0.2627 Dyt-1 + 0.2767 Dyt-3 + vtDyt = 0.0035 + 0.2627 D yt-1 + 0.2767 D yt-3 + vt通过t值、DW值、F值和Q值,说明 (2.79) 式是一个满意的日本人口模型。图5显示模型 (2.79) 的残差中已不
18、含有自回归和移动平均成分。模型特征方程的3个根是 z1 = 1 / 0.75 = 1.33 z2 = 1 / (-0.24 - 0.56 i ) = 0.9375 - 2.1875i z3 = 1 / (-0.24 + 0.56 i ) = 0.9375 +2.1875i下面利用模型 (2.79) 预测 y1995,并计算预测误差。已知dy1994 = 0.0027,dy1992 = 0.00409,则预测结果是, 1995 = 0.0035 + 0.2627 Dy1994 + 0.2767 Dy1992 = 0.0035 + 0.2627 0.0027 + 0.2767 0.0041 = 0
19、.0053 1995 = y1994 +1995 = 1.25034 + 0.0053 = 1.25564已知1995年日本人口实际数是1.25569亿人。预测误差为 h = 0.00004案例3 中国粮食产量序列(yt)的MA模型(file: 5arma07)(怎样建立MA模型) 粮食产量(yt)定义见中国统计年鉴2005。Yt是一个非平稳序列。用它的对数差分序列dLnyt建立时间序列模型。dLnyt的自相关函数见下图。dLnyt是一个ARMA过程或MA过程。ARMA()过程首先估计ARMA(1,1)模型。结果如下:dLnyt = 0.025 -0.320 (dLnyt-1 - 0.025)
20、 + vt +0.784 vt-1 (2.3) (-1.7) (6.1)R2 = 0.19, Q(15) = 11.6, Qa (k-p-q) = Q0.05 (15-1-1) = 22.4 注意:如果估计结果中有均值项,只在自回归项中减之,不必在移动平均项中减之。自回归项没有显著性,去掉AR(1)项,进一步建立MA(1)模型。结果如下:dLnyt = 0.027 + vt +0.5963 vt-1 (2.1) (5.6) R2 = 0.13, Q(20) = 28.2, Qa (k-p-q) = Q0.05 (20-0-1-1) = 28.9上述模型的各种检验与诊断都能通过,可以作为备选模型
21、。如果进一步分析,还可以把模型做得更好。观察残差序列发现在7年和10年上仍有较大的自相关。这预示着序列中还存在710年的变化周期。下图给出的是dLnyt 作3年移动平均后退去趋势的序列,显然该序列存在着710年的变化周期。把vt-7和vt-10作为变量加入模型。得结果如下:dLnyt = 0.025 + vt +0.3187 vt-1 -0.1623 vt-7 -0.6895 vt-10 (4.8) (4.2) (-3.0) (-14.1) R2 = 0.37, Q(15) = 17.0, Qa (k-p-q) = Q0.05 (15-0-3-1) = 19.72.7回归与ARMA组合模型(c
22、ombined regression-time series model)。 已经学习回归模型和时间序列模型,如果把这两种分析方法结合在一起,有时会得到比其中任何一种方法都好的预测结果。 例如有如下回归模型yt = b0 + b1 xt + ut (15)其中xt是解释变量,yt是被解释变量,ut是随机误差项。上述模型的估计式是yt =+xt +令= 0,用上式可预测yt的值。是一个平稳的、非自相关的残差序列。当存在自相关时,时间序列分析的一个有效应用是对残差序列建立ARMA模型。然后将上式中的残差项用ARMA模型替换。在利用上述模型预测yt时,可以利用ARMA模型先预测出的值。有时,这会使y
23、t的预测值更准确。这种回归与时间序列相结合的模型形式是yt =+xt + F -1(L) Q (L) vt (16)其中= F -1(L) Q (L) vt,或写成F (L)= Q (L) vt。vt是服从正态分布的、非自相关的误差项。vt的方差一般与不一样。这种回归与时间序列相组合的模型称作转(变)换函数模型(transfer function model),多元(变量)自回归移动平均模型(multivariate autoregressive -moving average model),简称MARMA模型,或回归与时间序列组合模型(combined regression-time ser
24、ies model)。 假设(15)式中的ut是一个ARMA(1, 1)过程,则估计(15)式的EViews估计命令是Y c X AR(1) MA(1) 注意:(1)如果(15)式中的ut是一个AR(1) 过程,则回归与ARMA组合模型表达的就是误差项为一阶自相关的经典回归模型。(2)以(16)式为例,按Wold分解定理,也可以对转换函数模型作如下理解。yt - b0 - b1 xt = ut表示在yt中剔除了确定性影响b0 +b1 xt后所得序列ut是一个不含任何确定性成分的平稳的随机序列。用ut建立时间序列模型。回归与ARMA组合模型也可以由被解释变量及其滞后项、一个或多个解释变量及其滞后
25、项、和描述随机误差序列的时间系列模型3部分组成。 只含有一个解释变量的转换函数模型,即一元回归与ARMA组合模型的一般形式是A(L) yt = B(L) xt +F -1(L) Q (L) vt其中ut =F -1(L) Q (L) vt。A(L)是yt的特征多项式,B(L)是xt的特征多项式。F(L)是ut的特征多项式,Q(L)是vt的特征多项式。在实际应用中,转换函数模型的结构部分可以利用经济理论和计量经济分析方法得到,而转换函数模型的时间序列部分(ut)可以通过时间序列模型的分析方法得到。案例4 中国宏观消费案例(file:china)中带有自相关的估计结果如下= 0.1932 + 0.
26、9256 LnGDPt (3.0) (118.8) R2 = 0.9965, DW = 0.77, s.e. = 0.0584, (1952-2002)残差序列的相关与偏相关图如下。应该是一个2阶自回归过程。对LnCPt建立回归与时间序列组合模型,或对上式残差建立时间序列模型,EViews命令是:LnCP C LnGDP AR(1) AR(2)估计结果如下,LnCPt = 0.1635 + 0.9291 LnGDPt + 0.6166 AR(1) - 0.5318 AR(2) + (1.6) (57.4) (7.1) (-4.2) R2 = 0.998, DW = 1.84, s.e. = 0
27、.04, (1954-2002) 即,LnCPt = 0.1635 + 0.9291 LnGDPt + 0.6166- 0.5318+ 消费对国内生产总值的真实弹性是0.929。案例5:(file: 5line03,5autoco7,autoco7)(广义2阶差分)中国储蓄存款总额(Y,亿元)与GDP(亿元)的计量经济模型 用Yt对GDPt回归(eq03),Yt = -3028.56 -0.6975 GDPt(-4.6) (36.6) R2 = 0.97, DW=0.17, T = 42, (1960-2001) 残差图如下,图1 线性模型的拟合与残差图 (2阶自相关的LM检验结果,存在自相关
28、。)(无交叉项White异方差检验结果,存在异方差。)上面估计模型误差项中既存在严重的自相关又存在异方差。下面建立对数线性模型。(eq01)LnYt = -8.8685 -1.7647 LnGDPt(-38.9) (69.6) R2 = 0.99, DW=0.23, T = 42, (1960-2001)图2 对数线性模型的拟合与残差图(2阶自相关的LM检验结果,存在自相关)模型中自相关仍然很严重。用残差直接拟合2阶自回归,回归参数都有显著性。模型中已不存在异方差。上面的回归结果可以看出残差中存在2阶自相关。克服自相关方法(1):采取2阶广义差分变量继续回归。GLnYt = LnYt -1.1
29、8 LnYt-1+0.36 Ln Yt-2GLnGDPt = LnGDPt -1.18 LnGDPt-1+0.36 LnGDPt-2 做异方差和自相关检验。(1阶自相关LM检验结果)(2阶自相关LM检验结果)(无交叉项White异方差检验结果)模型符合要求。储蓄存款总额(Y,亿元)对GDP的弹性是1.75。即GDP每增长1%,储蓄存款总额增长1.75%。克服自相关方法(2):用回归加ARMA模型方法。对数线性模型LnYt = -8.8685 -1.7647 LnGDPt(-38.9) (69.6) R2 = 0.99, DW=0.23, T = 42, (1960-2001)的残差的相关图、偏
30、相关图。(残差的相关图、偏相关图)在对数线性模型中加入两个AR项。模型中已不存在自相关和异方差。(自相关检验结果)(异方差检验结果)模型符合要求。储蓄存款总额(Y,亿元)对GDP的弹性是1.74。即GDP每增长1%,储蓄存款总额增长1.74%。弹性系数的OLS估计结果是1.765,GLS估计结果是1.751,回归与ARMA组合模型估计结果是1.744。注意:这个方法要求对ARMA模型的设定一定要正确,否则对回归系数影响非常大。应介绍的内容:序列是否平稳,过度差分问题,序列是否含有漂移项,识别模型结构,怎样写EViews估计命令(自回归项用AR()表示,移动平均项用MA()表示),t检验,Q检验,正确写出输出结果(模型含有均值项时,要在每个AR项中减去均值,但移动平均项中不减均值),预测方法,均值与漂移项的关系。时间序列估计模型的可决系数R2不会很大。