《第七章季节性时间序列分析方法.docx》由会员分享,可在线阅读,更多相关《第七章季节性时间序列分析方法.docx(43页珍藏版)》请在三一办公上搜索。
1、第七章 季节性时间序列分析方法由于季节性时间序列在经济生活中大量存在,故将季节时间序列从非平稳序列中抽出来,单独作为一章加以研究,具有较强的现实意义。本章共分四节:简单随机时间序列模型、乘积季节模型、季节型时间序列模型的建立、季节调整方法X-11程序。本章的学习重点是季节模型的一般形式和建模。1 简单随机时序模型在许多实际问题中,经济时间序列的变化包含很多明显的周期性规律。比如:建筑施工在冬季的月份当中将减少,旅游人数将在夏季达到高峰,等等,这种规律是由于季节性(seasonality)变化或周期性变化所引起的。对于这各时间数列我们可以说,变量同它上一年同一月(季度,周等)的值的关系可能比它同
2、前一月的值的相关更密切。一、 季节性时间序列1含义:在一个序列中,若经过S个时间间隔后呈现出相似性,我们说该序列具有以S为周期的周期性特性。具有周期特性的序列就称为季节性时间序列,这里S为周期长度。注:在经济领域中,季节性的数据几乎无处不在,在许多场合,我们往往可以从直观的背景及物理变化规律得知季节性的周期,如季度数据(周期为4)、月度数据(周期为12)、周数据(周期为7);有的时间序列也可能包含长度不同的若干种周期,如客运量数据(S=12,S=7)2处理办法:(1)建立组合模型;(1) 将原序列分解成S个子序列(Buys-Ballot 1847)周期 周期点123S总和平均1X1X2X3XS
3、T*1A*12XS+1XS+1XS+3X2ST*2A*23XS+1X2S+2X2S+3X3ST*3A*3nX(n-1)S+1X(n-1)S+2X(n-1)S+3XnST*nA*1n总和T1*T2*T3*TS*TT/S平均A1*A2*A3*AS*T/NT/SN对于这样每一个子序列都可以给它拟合ARIMA模型,同时认为各个序列之间是相互独立的。但是这种做法不可取,原因有二:(1)S个子序列事实上并不相互独立,硬性划分这样的子序列不能反映序列的总体特征;(2)子序列的划分要求原序列的样本足够大。启发意义:如果把每一时刻的观察值与上年同期相应的观察值相减,是否能将原序列的周期性变化消除?(或实现平稳化
4、),在经济上,就是考查与前期相比的净增值,用数学语言来描述就是定义季节差分算子。定义:季节差分可以表示为。二、 随机季节模型1含义:随机季节模型,是对季节性随机序列中不同周期的同一周期点之间的相关关系的一种拟合。AR(1):,可以还原为:。MA(1):,可以还原为:。2形式:广而言之,季节型模型的ARMA表达形式为 (1)这里,。注:(1)残差的内容;(2)残差的性质。2 乘积季节模型一、 乘积季节模型的一般形式由于不独立,不妨设,则有 (2)式中,为白噪声;。在(1)式两端同乘,可得: (3)注:(1)这里表示不同周期的同一周期点上的相关关系;则表示同一周期内不同周期点上的相关关系。二者的结
5、合就能同时刻划两个因素的作用,仿佛是显像管中的电子扫描。(2)从结构上看,它是季节模型与ARIMA模型的结合形式,称之为乘积季节模型,阶数用来表示。(3)将乘积季节模型展开便会得到一般的ARIMA模型。例如:,可以展开为,此时也有,并且其中有许多系数为0。但其参数并不独立。所以尽管模型的阶数可能很高,然而真正独立的参数不多,我们称这类模型为疏系数模型(带有一定约束条件的疏系数模型)。二、 常用的两个模型1 类型为: (4)2 类型为: (5)三、 乘积季节模型与ARIMA模型的关系我们可以将乘积季节模型 (3)展成ARIMA模型形式。例如,是季节模型,将式子的右边展成: (6)这是一个阶ARI
6、MA模型,但是其参数不是独立的,有下面的约束关系 (7)尽管模型的阶数很高,然而真正独立的参数并不多,有许多参数取值为零3 季节性时间序列模型的建立季节性时间序列模型的建立也包含这样几个过程:模型的识别、模型的定阶、参数估计、诊断检验等。基本上采用的是BOX-JENKINS方法,也就是立足于考察数据序列的样本自相关、偏自相关函数。如果样本自相关、偏自相关函数既不截也不拖尾,而且也不呈线性衰减趋势,相反地,在相应于周期S的整数倍点上,自相关(或偏自相关)函数出现绝对值相当大的峰值并呈现振荡变化,我们就可以判明原数据序列适合于乘积季节模型。一、 季节性MA模型的自相关函数是一个季节性时间序列,如果
7、,则 (6)不平稳,设,则 (7)我们就能得到一个乘积季节模型 (8) (9)当S=12时,有 (10)可以计算出:因此有:注:(1)为的一阶自相关系数,为的一阶自相关系数;(2)与比较容易求解;(3)可以推广到更一般的形式。二、 季节性AR模型的偏自相关函数是一个季节性时间序列,如果,则 (11)不平稳,设,则 (12)我们就能得到一个乘积季节模型 (13) (14)当S=12时,有 (15)可以根据YULE-WORK方程求出偏自相关函数。注:(1)根据它在周期点上的偏自相关函数的截尾性和拖尾性识别模型的类型和定阶;(2)可以推广到更一般的形式。三、 季节性时间序列模型的建模方法利用B-J建
8、模方法:判别周期性,即S的取值;根据SACF和SPACF提供的信息识别模型类型和阶数,最后进行估计和诊断检验。具体做法:第一步:对时间序列进行普通差分和季节差分,以得到平稳的序列,;第二步:计算差分后序列的SACF和SPACF,选择一个暂定的模型;第三步:由SACF和SPACF函数的值,利用矩估计法得到的值作为初始值,对模型参数作最小二乘估计;第四步:模型的诊断与检验。注:(1)关于差分阶数d和季节差分阶数D的选取可采用试探的方法 详见备课笔记。;也可使用差分后序列均方差的大小挑选;(2)季节差分算子的阶数不宜过高。四、 应用实例【例6-1】试用1987年到1996年甲地某商品各月销售量资料为
9、例建立季节性时间序列模型 资料来源王振龙:时间序列分析,中国统计出版社,P189。建模型过程:1时间序列图明显存在着季节性变化,并且以12为周期。2SACF和SPACF函数图SACF 再次证明,时间序列存在着以S=12为周期的季节性变动。SPACF3进行差分变换需要进行一阶普通差和以12为周期的季节差分,得到 (17) (16)计算其自相关系数。一阶普通差分图一阶普通差分和一阶季节差分序列图4模型的识别与定阶5参数估计6诊断检验7模型应用预测结果【例6-2】表显示了我国1990年1月至1997年12月工业总产值的月度资料(1990年不变价格),记作IPt,共有96个观测值,对序列IPt建立AR
10、MA模型 资料来源易丹辉:数据分析与EVIEWS应用,P125。,在建模过程中将1997年12个月的观测值留出作为评价预测精度的参照对象。1990年1月至1997年12月我国工业总产值单位:亿元月/年1990199119921993199419951996199711421.4001757.8001984.2002179.1002903.3002996.7003476.6003843.84021367.4001485.7001812.4002408.7002513.8002740.3002790.3003181.26031719.7001893.9002274.7002869.4003409.
11、0003580.9003942.6004404.49041759.6001969.8002328.9002916.7003499.5003746.3004067.6004520.18051795.7002033.7002373.1003022.1003642.6003817.9004746.8994638.99061848.1002103.0002515.8003274.5003871.4004046.6004417.2994969.93071637.3001836.3002288.0002862.9003373.0003483.9003806.8004146.89981670.9001914
12、.7002321.0002864.2003463.4003510.6003746.3004198.70091760.1002022.2002441.1002908.0003663.7403703.1004011.1004536.839101789.5002045.1002502.6002911.8003753.3803810.7004129.6004718.910111888.6002069.2002608.8003101.3003973.1704091.0004372.8995034.939121981.4002136.0002823.8003664.3004469.0204650.7994
13、991.5005545.7401时间序列图表明数据或者序列是非平稳的。2进行相应的差分变换为消除趋势同时减小序列的波动,对原序列做一阶自然对数并逐期差分,即是差分运算与对数运算的结合。由时间序列图可以看到,序列的趋势已经基本消除,但可能存在着季节性变化,这一点可以从序列的自相关图看出。由图形可以看出,在12的整数倍上,样本的偏自相关系数显著不为零,因此需要做季节差分处理。此时差分后序列的自相关图为可以对序列进行零均值的检验,详见易丹辉:数据分析与EVIEWS应用,P128。3模型识别与定阶因为经过一阶逐期差分,序列趋势基本消除,故d=1;经过一阶季节差分,季节性基本消除,故D=1。所以选用AR
14、IMA(p,d,q)(P,D,Q)S模型。由上图的偏自相关函数图得p=2或p=3比较合适;自相关函数图q=1比较适合。考虑到AR模型是线性方程估计,相对于MA和ARMA模型的非线性估计容易,且参数意义便于解释,故实际建模时常希望用高阶的AR模型替换相应的MA或ARMA模型。综合考虑,可供选择的(p,q)组合有:(3,1)、(4,0)、(2,1)和(3,0)。由于K=12时,样本自相关和偏自相关系数都显著不为0,所以,P=Q=1。4模型估计在命令主窗口输入:D(LOG(IP),1,12) AR(1) AR(2) AR(3) MA(1) SAR(12) SMA(12)5检验和预测包括模型的适应性检
15、验和评价精度的检验,对未来进行预测。【例6-3】时间序列资料ARIMA季节乘积模型及其应用,资料来源于张蔚等:时间序列资料ARIMA季节乘积模型及其应用,第三军医大学学报。4 季节调整一、 对时间序列季节调整的几点认识 资料来源于国家统计局国民经济核算司 刘丽萍的文章。西方国家开展时间序列的季节调整已有几十年的历史,在他们的公开出版物中经常会看到经过季节调整后的数据,在经济分析和国民核算中,也经常会遇到关于国内生产总值时间序列季节调整的方法研究。结合本人在加拿大学习了解到的情况,本文谈一点对这个问题的粗浅认识。1为什么要对时间序列进行季节调整季节调整是对时间序列中隐含的由于季节性因素造成的季节
16、变化的影响加以纠正的过程。时间序列是指在规定的时间间隔内,对所发生的经济活动进行连续测算而形成的数据。一般根据测算是一年一次,三个月一次,还是每月一次,而区分为年度序列、季度序列或月度序列。一般认为,季节性因素是指在正常年度情况下,季度或月度序列(统称为子年度序列)中表现出来的有规律的波动变化。为什么子年度序列中包含有季节性因素?子年度序列相对于年度序列而言,其特点是指标的核算期或指标所对应的时期少于一年。年度序列与日历年度的周期相对应,而人类传统经济活动的运作起始也一般与日历年度相对应,因此年度序列能够反映一个日历年度内经济活动的一个完整的周期,如果将不同年度的指标进行比较,具有可比性。但是
17、子年度序列则不同,由于其对应的时期只是日历年度中的某一部分,因此不同时期的子年度指标所对应的季节相互之间各不相同。由于不同的季节对经济活动的影响程度不同,相同的经济活动在不同季节里产生的经济效果不同,因此不同的子年度指标之间存在不可比因素。如春季和冬季这两个不同的季节对建筑业的影响明显不同,建筑业的活动规模和由此产生的与建筑业有关的指标建筑业产值、建筑业就业人数等在这两个季节也就大不相同。在宏观经济环境都相同的情况下,这其中最主要的一个原因就是季节性因素的影响。季节性因素的影响对季节变化比较明显的国家和地区尤为突出。随着经济发展的迅速以及人们对经济关注程度的提高,子年度指标在经济分析和宏观调控
18、中的作用越来越重要,利用子年度时间序列做经济模型和分析问题成为经济研究中的一个重要内容。为了使不同季节的指标之间具有可比性,满足经济分析和管理的需要,季节调整的理论及方法应运而生。2季节调整的理论依据研究表明子年度指标的时间序列中隐含有周期、趋势、季节性因素、交易日因素和偶然因素等构成成分。周期是指标的时间序列所表现出的持续的周期性的波动,一个完整的周期具有扩张阶段、转折点、衰退阶段和恢复阶段四个不同的阶段。趋势反映的是经济现象的长期演变方向。周期与趋势比较,趋势主要是反映经济发展的总体方向,如是上升、持平还是下降。而周期侧偏重于瞬间的经济变化。由于测算趋势在实际工作中有一定的难度,因此一般把
19、趋势与周期放在一起不再进行区分。季节性因素是时间序列围绕趋势和周期年复一年的重复出现的一种有规律的波动。产生季节性因素的原因有多方面,如气候的原因使建筑业和农业在冬季生产量减少,也使失业的人数多于其他季节。社会因素也可以产生季节性因素,如由于传统的节假日而产生的节假日期间销售额的增长。季节性的影响还可使一些食品工业的生产具有季节性因素。实际上在许多情况下季节性因素是由气候、社会等原因综合在一起而产生的,如失业。交易日因素是由于一个星期里每一天的数量在一个月里出现的次数不同,而一个星期里不同的日期所发生的经济活动不同引起的某些变量的变化。如,如果人们大多在星期五集中购物,那么这一天的商品零售额必
20、然高于一星期里的其他日子。如果一个月有30天,那么30天在一个星期中的分布有可能星期一和星期二是五天余下的星期三到星期日是四天,也可能是其他的组合。如果在某一个月里星期五的天数是五天,那么这个月的商品零售额就会多于星期五只有四天的月份,这时如果以星期五有五天的月份与星期五只有四天的月份相比就存在不可比因素。这个不可比因素就是交易日因素。交易日因素表现出的商业行为有时会掩盖经济的周期,其对时间序列的影响与季节性因素相同。偶然因素反映的是其他有规律因素无法解释的残差或随机因素产生的变化,它包括经济活动的参与者们的不稳定决策、数据程序或样本的错误以及非正常的事件如罢工、自然灾害等对经济活动的影响。
21、季节调整就是通过数学的方法把原始子年度时间序列中隐含的季节性因素、交易日因素剔除掉,季节调整后的时间序列是趋势周期和偶然因素的合成。3西方国家季节调整的做法及其季节调整后数据的利弊目前西方国家大多都对包括国内生产总值在内的子年度时间序列(如工业产值、就业人数、零售额等等)进行季节调整,季节调整使用比较多的模型是加拿大统计局达根(Dagun)研究开发的X11ARIMA,它是采用自回归和移动平均的方法对原始的时间序列进行季节调整,消除时间序列中季节性因素和交易日因素的影响。在对季度国内生产总值的季节调整中,大多数国家是利用没经过季节调整的基础数据进行国民核算,然后根据季节调整模型对估计出的季度国内
22、生产总值进行季节调整。但法国、意大利和西班牙是在季度国内生产总值核算之前对计算季度国内生产总值所需的基础数据先进行季节调整,然后直接计算出季节调整后的国内生产总值。在他们的数据公布系统中,一些国家是同时公布经季节调整过的和未经季节调整的两种数据,另一些国家则只公布季节调整后的数据,但是在经济分析和利用时间序列做经济模型时,大多用季节调整后的数据。季节调整后数据的优点。由于季节调整后的数据消除了季节性因素的影响,使得不同季度之间的数据可以直接比较,数据具有可比性。与没有经过季节调整的数据相比,调整后数据最重要的一个特点,就是可以及时反映经济的瞬间变化,反映经济变化的转折点,为从事经济活动的人们制
23、定科学的决策提供比较科学的依据。这对经济分析非常有价值。我国传统上是采取与上年同期的数据进行比较的方法来反映经济的增长变化,这种方法可以消除季节性因素的影响,但有它的局限性,它不能及时反映经济变化的转折点并由此产生错误的结论。如,假定没有经过季节调整的原始数据表明今年二月与上年二月失业人数的比较是下降的,我们据此得出结论失业率下降了,但是实际上如果把经过季节调整后的今年二月的数据与今年一月进行比较就可以看到另一个现象,就是二月的失业率是上升的。实际情况是近几个月的失业率一直是上升的,只是上升的幅度低于去年前几个月的下降幅度。研究表明,采用不经过季节调整的数据与去年同期进行比较所反映的经济周期的
24、转折点往往要平均滞后六个月。这种分析会给经济决策带来不利的影响。季节调整后数据的另一个特点是,可以进行年率化的测算。以季度数据为例,由于调整后的数据剔除了季节性等不可比因素的影响,因此把经过季节调整后的现价季度数据乘4就可看成是相应的年度数据;把经过季节调整后的季度增长速度4次方则可看成是相应年度的增长率。季节调整后数据的这一特点可以提高经济分析的价值,使得以现行的短期经济指标观察全年的情况成为可能。季节调整后的数据也有其不易理解的方面。首先,调整后的时间序列是观察出来的而不是计算的结果。未调整的时间序列相互之间是独立的,经过调整以后,改变了序列的统计特征,使其成为相互之间关联的、变化趋小的调
25、整序列。换一句话说,就是季节调整后的数据,不论其总量还是增长速度都与实际计算的数据之间有很大的差异,数据反映出的经济含义不是核算期的实际经济含义。其次,经季节调整的时间序列,其终端数据比中间数据的可信度低。原因是在形成最终序列前,容易对起始端共四年的数据加以修改。如果将季节调整后的时间序列建立的子年度模型用于预测,其用于建立模型的数据,通常是季节调整后序列中可信度最差的数据。再次,同一个数据,经过不同次的季节调整(因为每一次新的数据出来以后都要作为时间序列的一部分而重新进行季节调整),可以出现不同的数据值,这对于传统上一个时期只有唯一的一个数据来说,在理解上有一个接受的过程。4我国时间序列季节
26、调整面临的问题目前我国所有的子年度时间序列都没有进行季节调整,消除不可比因素的一个主要方法是与去年同期数据进行比较。随着改革开放的进一步深入,我国的经济将进一步融入到世界经济一体化的格局中,这在客观上对我们传统的统计方法提出了挑战,要求我们与国际通行的方法接轨。从统计自身来讲,引入时间序列的季节调整方法,不仅仅在于提高数据的分析使用价值,同时也对传统的统计数据搜集方式提出了改革的要求。要开展时间序列的季节调整,以下几个方面的工作需要跟上:首先,基础统计数据的搜集方式。我国大部分基础数据是以本期(本月或本季)和累计的形式同时搜集,但是也有一部分数据是仅仅以累计数的方式搜集上来,或者是在本期数与累
27、计数同时都搜集的情况下,以累计的数据为准。季节调整是对每一个独立的本期数据(月度或季度)进行季节调整,而不是累计数。以累计的形式搜集上来的基础数据,不仅专业数据本身无法直接进行季节调整,根据专业数据计算的季度国内生产总值(我国季度国内生产总值数据也是累计的形式)也无法直接进行季节调整。尽管从理论上讲累计数据可以加工出本期数据,但是由于本期与累计的数据之间往往存在一些口径和时间上的差异,调整出来的本期数据反映的趋势有时不尽合理。如果要引入时间序列的季节调整,首先要做的也是最重要的工作是改善我们的基础数据搜集方式,以搜集本期的数据为主。所有的专业统计都有了本期数据,在此基础上可以直接计算出分季度的
28、国内生产总值,更重要的是可以直接对专业数据和季度国内生产总值进行季节调整。其次,理论和技术培训。季节调整的方法是一个技术性比较强的工作,要开展季节调整工作,必须对模型有一个全面的理解,不仅要会操作,还要懂得季节调整的原理,因为模型中有多种选择,不同的数据特征要适应模型中不同的选择。这些技术问题都需要经过系统的理论学习和培训。再次,开展宣传工作。季节调整后的数据改变了原始数据的本来面貌,与没有经过季节调整的数据比较,在总量和增长速度方面都存在一定的差异。如果对外公开公布季节调整后的数据,需要做一系列的宣传和解释工作。总之,开展时间序列的季节调整利弊同在,但我认为这是一项我国迟早都要开展工作,因为
29、它毕竟是一种先进的科学的方法。抓住机遇开展这项工作,将会对我国传统的统计数据搜集方式的变革、对统计分析方法和统计分析水平的提高起到积极的推动作用。二、 概述1季节调整的历史与发展(1)季节调整问题最早是由美国著名经济学家Persons.W.M.在1919年提出的;(2)1931年,Macawley提出了季节调整的比率滑动平均法,该方法成为X-11程度的基础;(3)1954年,Shiskin J在美国国势普查局的Uniwac1型机上将比率滑动平均编制成季节调整的计算机程序,后来不断改进它,相继研制了X-3到X-10等一系列的季节调整程序,于1965年推出了著名的X-11季节调整程序(The X-
30、11 Variant of the Cencus Method Seasonal Adjustment Program) X-11方案,在原理上与其它的传统分解方法相似,但X-11它不仅考虑了季节结构变化的可能性,而且自动估计工作日因素、星期因素等的变化。因而X-11方法更精确、更实用,成为一种极为有效的中、短期预测技术。;(4)20世纪60年代末期,B-J的随机模型;1970年,Tiao 详见曹金红:时间序列分析与季节调整方法浅析,统计与预测,2000年第3期,P56。找出了与X-11程序对应的ARIMA模型;1978年加拿大的Dagum提出了X-11-ARIMA程序,将B-J的随机建模方法
31、引入了X-11程序;(5)1979年,日本统计学家Akaike提出了季节调整的Bayes模型;(6)20世纪80年代初期,Harvey.A.C和Kitagawa G.运用状态空间方法对季节性序列建立状态空间模型,将Kalman滤波引入时间序列分析领域。2季节调整的基本概念与基本模型以月份或季度为观测单位的经济时间序列可以用(1)趋势部分;(2)季节部分;(3)周期部分;(4)不规则部分这几个部分来描述。常使用的分解模型有:加法模型和乘法模型。判断的依据:趋势变化特性及季节变化的波动幅度。若数据序列呈指数变化趋势,且波动的幅度随时间而增大,则用乘法模型;否则用加法模型。绝大部分情况下,使用乘法模
32、型。3季节调整的意义和作用(1)进行短期预报;(2)研究经济发展中的外部事件和政策变量之间的关系;(3)使数据序列在经济意义上具有可比性。三、 X-11季节调整程序 详细的论述可以参见顾岚:时间序列分析在经济中的应用,中国统计出版社,P235;蒋万进、陶晓峰:中央银行定量分析概论,中华工商联合出版社,P30。1基本原理:乘法原理与加法原理2基本方法:滑动平均法3X-11程序的计算过程(1)分离趋势项(2)分离季节项(3)日历调整(4)修正不规则因素的特殊项(修正异常值)(5)增补缺失项4X-11程序的迭代过程【例6-4】对airln序列进行季节调整,操作过程详见易丹辉:数据分析与EVIEWS应用,P90。1时间序列图迭代并进行一年预测的结果。【例6-5】对乙地某商品销售量资料进行X-11季节调整,教材P198。1时间序列资料如图所示2趋势因子3季节因子【本章思考题】1什么是季节差分,如何进行季节性时间序列模型的建立?2ARIMA模型和乘积型时间序列模型之间的关系?3X-11季节调整的基本原理,核心技术是什么?