《Excel与时间序列分析.ppt》由会员分享,可在线阅读,更多相关《Excel与时间序列分析.ppt(80页珍藏版)》请在三一办公上搜索。
1、Excel与时间序列分析,万钟林东莞职业技术学院,主要内容,最早的时间序列分析,7000年前,古埃及人把尼罗河涨落的情况逐天记录下来,就构成所谓的时间序列。对这个时间序列长期的观察使他们发现尼罗河的涨落非常有规律。当天狼星第一次和太阳同时升起的那一天之后,再过200天左右,尼罗河就开始泛滥,泛滥期将持续7080天,洪水过后,土地肥沃,随意播种就会有丰厚的收成。由于掌握了尼罗河泛滥的规律,使得古埃及的农业迅速发展,解放出大批的劳动力去从事非农业生产,从而创建了埃及灿烂的史前文明。,1月1日,6月17日,10月,12月,尼罗河泛滥期,“落泪夜,主要内容,时间序列的定义,时间序列:将说明社会经济现象
2、在各个不同时期或时点上某种数量特征的指标数值,按时间先后顺序排列起来而形成的一种统计数列,也称动态数列或时间序列(Time Series)。,案例,我们想研究全国高校招生人数的发展变化规律通过统计,得到的19992008年全国高等学校的招生人数序列就构成一个序列长度为10的观察值序列我国19992008年全国普通高等学校招生人数(单位:万人)159.7,220.6,268.3,320.5,382.2447.3,504.5,546.1,565.9,607.7,1999-2008年全国普通高等学校招生人数(单位:万人),时间序列分析,时间序列分析,就是研究时间序列在演变过程中存在的统计规律的方法,
3、研究问题包括:长期变动趋势、季节变动规律、循环变动规律,以及预测未来时刻的发展和变化等。为了认识和掌握这些规律,我们必须对时间序列进行深入分析,以便鉴往知来,预测事物发展的前景,为各级领导制定政策与计划、实行科学管理提供有效的咨询服务。,主要内容,时间序列分析方法,描述性时序分析通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,序列,统计时序分析利用数理统计学的基本原理,分析序列值内在的相关关系,描述性时间序列分析,早期的时序分析通常都是通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析。古埃及人发现尼罗河泛滥的规律就是依靠这种分析方法。在天文、物理
4、、海洋学等自然科学领域,这种简单的描述性时序分析方法也常常能使人们发现意想不到的规律。,描述性时序分析案例粮食生产与价格,史记.货殖列传记载,早在我国春秋战国时期,范蠡和计然就提出我国农业生产具有“六岁穰,六岁旱,十二岁一大饥”的自然规律。越绝书计倪内经则描述得更加详细:“太阴三岁处金则穰三岁处水则毁三岁处木则康三岁处火则旱天下六岁一穰六岁一康凡十二岁一饥。”翻译成现代文就是:“木星绕天空运行运行三年,如果处于金位,则该年为大丰收年如果处于水位则该年为大灾年;再运行三年,如果至木位则该年为小丰收年如果处于火位则该年为小灾年,所以天下平均六年一大丰收,六年一小丰收,十二年一大饥荒。”这是2500
5、多年前,我国对农业生产具有3年一小波动,12年左右一个大周期的记录,是一个典型的描述性时间序列分析。,我国稳定粮价的方法“平粜法”,范蠡根据“六岁穰,六岁旱,十二岁一大饥”的自然规律提出了我国最早稳定粮价的方法:“平粜法”“夫粜,二十病农,九十病末。末病则财不出,农病则草不辟矣。上不过八十,下不减三十,则农末俱利,平粜齐物,关市不乏,治国之道也。”这段话的意思是:如果是丰收年,粮食贱卖,会伤害农民种粮的积极性。如果是大灾年,粮食天价,会伤到老百姓的生存。所以要实行“平粜法”。政府应该在粮食丰收时高于最低价购买粮食进行储备,以保护农民的利益;在粮食短缺时,将储备粮食投放市场,以稳定粮价,确保百姓
6、的生存。这是对农民和百姓都有利的政策,是一个国家的治国之道。,欧洲粮食产量的描述性时序图,在范蠡之后2000年,欧洲经济学家在研究欧洲各地粮食产量时发现了类似规律。1884-1939年苏格兰与威尔士每英亩大麦产量时序图,Beveridge小麦价格指数序列,贝弗里奇(Beveridge)小麦价格指数序列,它由1500-1869年逐年估计的小麦价格构成,可以清晰地看到该序列有一个13年左右的周期,太阳黑子的运动规律,德国业余天文学家施瓦贝()发现太阳黑子的活动具有11-12年左右的周期,粮食价格波动的天文学解释,太阳黑子的运动周期和农业生产的周期长度非常接近,这引起了英国天文学家、天王星的发现者威
7、廉赫歇尔(F.W.Herschel)的关注。最后他发现当太阳黑子变少时,地球上的雨量也会减少。所以在没有良好人工灌溉技术的时代,农业生产会呈现出和太阳黑子近似的变化周期。我们没有采用任何复杂的模型或分析方法,仅仅是沿着时间顺序收集数据,描述和呈现序列的波动,就了解到小麦产量的周期波动特征,以及产生该周期波动的气候成因及该周期对价格的影响。,描述性时序分析,通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析 描述性时序分析方法具有操作简单、直观有效的特点,它通常是人们进行统计时序分析的第一步。局限性:它只能展示非常明显的规律性。而在金融、保险、法律、人口、心
8、理学等社会科学研究领域,随机变量的发展通常会呈现出非常强的随机性,想通过对序列简单的观察和描述,总结出随机变量发展变化的规律,并准确预测出它们将来的走势通常是非常困难的。,统计时序分析方法,频域分析方法,时域分析方法,统计时序分析,频域分析方法,原理假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动发展过程早期的频域分析方法借助富里埃分析从频率的角度揭示时间序列的规律 后来借助了傅里叶变换,用正弦、余弦项之和来逼近某个函数 20世纪60年代,引入最大熵谱估计理论,进入现代谱分析阶段 特点非常有用的动态数据分析方法,但是由于分析方法复杂,结果抽象,有一定的使用局限性,时域分析方法,原
9、理事件的发展通常都具有一定的惯性,这种惯性用统计的语言来描述就是序列值之间存在着一定的相关关系,这种相关关系通常具有某种统计规律。目的寻找出序列值之间相关关系的统计规律,并拟合出适当的数学模型来描述这种规律,进而利用这个拟合模型预测序列未来的走势特点理论基础扎实,操作步骤规范,分析结果易于解释,是时间序列分析的主流方法,时域分析方法的分析步骤,考察观察值序列的特征根据序列的特征选择适当的拟合模型根据序列的观察数据确定模型的口径检验模型,优化模型利用拟合好的模型来推断序列其它的统计性质或预测序列将来的发展,时域分析方法的发展过程,启蒙阶段,基础阶段,发展阶段,YuleWalker,BoxJenk
10、ins,Engle Granger,启蒙阶段,英国数学家。1927年,Yule提出用线性回归方程来模拟一个时间序列,这是最早的AR模型。英国数学家,天文学家。1931年,Walker利用Yule的分析 方法 研究了衰减正弦时间序列,得出Yule-Walker方程,基础阶段,和 1970年,他们出版了Time Series Analysis Forecasting and Control一书书中,他们系统地阐述了ARIMA模型的识别、估计、检验及预测的原理及方法。这些知识现在被称为经典时间序列分析方法,是时域分析方法的核心内容。为了记念Box和Jenkins对时间序列发展的特殊贡献,现在人们也常
11、把ARIMA模型称为Box-Jenkins模型。ARIMA模型的实质单变量、同方差场合的线性模型,完善阶段,异方差场合Robert F.Engle,1982年,ARCH模型Bollerslov,1985年,GARCH模型 Nelson等人提出了GARCH模型的多种衍生模型多变量场合C.Granger,1987年提出了协整(co-integration)理论非线性场合汤家豪等,1980年,门限自回归模型C.Granger,1978年,双线性模型,Robert F.Engle,C.Granger,主要内容,偶然性因素:局部的、临时的、非决定性作用:变化无常,基本因素(系统性因素):长期、决定性作用
12、:规律性,随机变动,时间数列的影响因素分析,一、时间数列的构成要素与模型,1社会经济指标的时间数列包含以下四种变动因素:,(1)长期趋势(T),(2)季节变动(S),(3)循环变动(C),(4)随机变动(I),可解释的变动,不规则的不可解释的变动,又称趋势变动时间序列在较长持续期内表现出来的总态势。是由现象内在的根本性的、本质因素决定的,支配着现象沿着一个方向持续上升、下降或在原有水平上起伏波动。如股票市场的“牛市”和“熊市”。,1.长期趋势变动(T),2.季节变动(S),由于自然季节因素(气候条件)或人文习惯季节因素(节假日)更替的影响,时间序列随季节更替而呈现的周期性变动。季节周期:通常以
13、“年”为周期、也有以“月、周、日”为周期的准季节变动。,3.循环变动(C),时间序列中以若干年为周期、上升与下降交替出现的循环往复的运动。如:经济增长中:“繁荣衰退萧条复苏繁荣”商业周期。,由于偶然性因素的影响而表现出的不规则波动。故也称为不规则变动。随机变动的成因:自然灾害、意外事故、政治事件;大量无可言状的随机因素的干扰。前三种因素都有一定的的规律性,可以用统计方法加以测定,不规则变动是无规律的随机波动,难以测定,一般可做为误差项处理。,4.随机变动(I):,注意,1、社会经济现象的发展变化,都是上述四种因素的全部或部分变动影响的结果。2、如果观察时期不够长,循环波动因素可能不考虑3、以年
14、为单位的时间序列无季节变动,(二)时间序列分析模型,1.加法模型:假定四种变动因素相互独立,数列各时期发展水平是各构成因素之总和。2.乘法模型:假定四种变动因素之间存在着交互作用,数列各时期发展水平是各构成因素之乘积。3.混合模型:是指时间序列由有关因素乘积后再加总的总和结构模型。,时间序列因素分析的基本原理,以乘法模型为例:进行分析时,一般是先测定长期趋势值T,用长期趋势去除时间序列,即可得到消除长期趋势影响的时间序列;进一步测定季节变动值S,再用季节变动去除时间序列,即可得出消除长期趋势的季节变动影响的时间序列;将只包含循环变动和不规则变动影视的时间序列,加以移动平均,即可得到循环变动影响
15、值C;消除长期趋势和季节变动影响后,其数值接近于1时,则时间序列受循环变动和不规则变动的影响可略而不计;如果其数值和1有较大的离差,还要进一步测定循环变动和不规则变动。,趋势分析,目的有些时间序列具有非常显著的趋势,我们分析的目的就是要找到序列中的这种趋势,并利用这种趋势对序列的发展作出合理的预测 常用方法趋势拟合法平滑法,趋势拟合法,趋势拟合法就是把时间作为自变量,相应的序列观察值作为因变量,建立序列值随时间变化的回归模型的方法 分类线性拟合非线性拟合,1)线性趋势方程逐期增长量大致相等。2)二次曲线趋势方程逐期增长量大致等量递增或递减。3)指数曲线方程环比发展速度近似一个常数。,常见的趋势
16、方程,线性拟合,使用场合长期趋势呈现出线形特征模型结构,例4.1,澳大利亚政府19811990年每季度的消费支出序列,线性拟合,模型参数估计方法最小二乘估计参数估计值,拟合效果图,非线性拟合,使用场合长期趋势呈现出非线形特征 参数估计指导思想能转换成线性模型的都转换成线性模型,用线性最小二乘法进行参数估计实在不能转换成线性的,就用迭代法进行参数估计,例4.2:对我国1949-2008年化肥产量序列进行曲线拟合,非线性拟合,模型变换参数估计方法线性最小二乘估计拟合模型口径,拟合效果图,线性模型法线性趋势方程,线性方程的形式为,时间序列的趋势值 t 时间标号 a趋势线在Y 轴上的截距 b趋势线的斜
17、率,表示时间 t 变动一个 单位时观察值的平均变动数量,根据最小二乘法得到求解 a 和 b 的标准方程为,解得:,【例5-12】已知我国GDP资料(单位:亿元)如下,拟合直线趋势方程,并预测1999年的水平。,解:,预测:,当t=0时,有,解:,预测:,若原数列呈周期变动,应选择现象的变动周期作为移动的时距长度。,原数列,新数列,y1,y4,y2,y3,y5,y6,原数列,新数列,y1,y4,y2,y3,y5,y6,原数列,三项移动平均,五项移动平均,四项移动平均,移动平均法应注意的问题移动平均对原数列有修匀作用,平均的时距项数越大,对数列的修匀作用越强。移动平均时距项数为奇数项时,只需一次移
18、动均,其平均值作为移动平均项数中间一期的数值;移动平均项数为偶数项时,移动平均值需再进行一次相邻两平均值的移动平均。,移动间隔长短应适中:一般地:如果现象的发展具有一定的周期性,应以周期的长短作为移动间隔的长度。若时间序列是季度资料,应采用4项移动平均若时间序列是月份资料,应采用12项移动平均移动平均后,其数列的项数较原数列减少,当数列项数N为奇数时,新数列首尾各减少(N-1)/2项;当数列项数N为偶数时,首尾各减少N/2项。移动平均法是用于分析时间序列的长期趋势,但不适合对现象未来的发展趋势进行预测。,趋势方程中的两个未知常数 a 和 b 按最小二乘法(Least-square Method
19、)求得根据回归分析中的最小二乘法原理使各实际观察值与趋势值的离差平方和为最小最小二乘法既可以配合趋势直线,也可用于配合趋势曲线根据趋势线计算出各个时期的趋势值,季节变动(S),现象在一年内随季节更换形成的有规律变动特点;季节性变动重复进行;季节变动按照一定的周期进行;每个周期变化强度大体相同.,测定目的,确定现象过去的季节变化规律对未来现象季节变动作出预测消除时间序列中季节因素,5.4.3 季节变动的测定与预测,动季节变分析的原理,季节指数:反映季节变动的相对数以全年月或季资料的平均数为基础计算的平均数等于100%月(季)的指数之和为1200%(或400%)指数越远离其平均数(100%)季节变
20、动程度越大计算方法有按月(季)平均法和移动平均趋势剔除法,根据季节指数与其平均数的偏差程度测定季节变动的程度如果现象没有季节变动,各期的季节指数为100%如果某一月份或某一季度有明显的季节变动,各期的季节指数应大于或小于100%,1、按月或季平均法根据原始时间序列通过简单算术平均计算季节指数假定时间序列没有明显的长期趋势和循环变动,季节变动测定方法,的平均数计算全年计算季节指数的步骤:计算各年同期(月或季)数据的总平均数。计算季节指数。,例4.6季节指数的计算,例4.6季节指数图,例4.6季节指数的理解,本例中,七月份的季节指数最大,这说明7月份是北京最热的月份;1月份的季节指数最小,这说明1
21、月份是北京最冷的月份;最接近于年平均气温的是10月份,这个月的平均气温是13.62,和年平均气温的差异只有4.5%由任意两个季节指数,我们可以得到单纯的“季节”变动对事件影响的大小。比如3月份的季节指数为0.551,而6月份的季节指数为1.919,这说明6月份的平均气温一般是3月份的3.48倍,假如明年3月份北京市的平均气温为7,那么根据季节效应我们有理由预测在大气环境不发生大的改变的前提下,北京市6月份的平均气温应该在21左右。,社会商品零售额季节指数计算表,先将序列中的长期趋势予以消除,再计算季节指数数列中包含有明显的上升(下降)趋势或循环变动 计算季节指数的步骤:通过移动平均法测定出长期
22、趋势T;将实际值(Y)除以相应的趋势值,得出剔除长期趋势因素后的新数列;将所得新数列重新排列,求出同月或同季平均数,即得到季节指数。,2、移动平均趋势剔除法,例4.7,对1993年2000年中国社会消费品零售总额序列进行确定性时序分析。,(1)绘制时序图,(2)选择拟合模型,对于一个同时受到趋势和季节因素影响的序列,首先要判断趋势和季节之间的相互影响关系。常用的经验如果季节波动的振幅不受到趋势变动的影响,那么季节与趋势之间通常没有交互影响关系,可以认为是可加关系。如果季节波动的振幅随着趋势的变化而变化,那么季节与趋势之间意味着有交互影响关系,可以认为是乘法关系。本例中,周期的振幅随着零售总额趋
23、势的递增而加大,也就是说季节与趋势之间有交互影响关系,可以尝试使用乘积模型或者是混合模型,我们在此使用混合模型(b),(3)计算季节指数,季节指数图,季节调整后的序列图,(4)拟合长期趋势,(5)残差检验,(6)短期预测,例4.7拟合预测结果解释,残差图显示残差序列仍然存在一定的相关性。这说明我们拟合的这个模型还没有把原序列中蕴含的相关信息充分提取出来,这是确定性分析方法常见的缺点。因素分解方法的侧重点在于确定性信息的快速、便捷地提取,但对于信息提取的充分性常常不能达到完美。根据拟合图的直观显示,可以看出我们所拟合的确定性时序分析模型对该序列总体变化规律的把握还是比较准确的。这说明在本例中,尽管确定性因素分解方法对信息的提取不够充分,但是由于确定性因素影响非常强劲,相比而言,残差序列的影响非常微弱,遗漏残差序列中蕴含的小部分相关信息,对模型的拟合精度没有显著性的影响。所以该确定性因素分解模型仍然是显著有效的。,谢谢!,