《传统时间序列分析.ppt》由会员分享,可在线阅读,更多相关《传统时间序列分析.ppt(43页珍藏版)》请在三一办公上搜索。
1、1,第4章 传统时间序列分析,2,4.1 趋势模型与分析,4.1.1 趋势模型,3,趋势模型的选择是定性分析和定量分析相结合的分析过程。定性分析要求:在选模型之前,要弄清模型的条件和预测对象的性质、特点二例如,指数曲线模型成立的条件是后一期与前一期之比为常数,即发展速度为常数。实际现象的逐期增长率不可能严格等一某一常数,但常会围绕某一常数上下波动。如果分析对象具备上述特点,可以考虑采用指数模型;否则,不宜采用。,4.1.2 模型的选择,4,有一些趋势模型是从其他领域特别是生物学领域移植过来的。比如,Logistic曲线最初用于研究生物种群发展规律。它假定种群的增长取决于两个因素:种群的现有规模
2、和环境(生存空间、光照、水、食物等),其中环境是限制性因素。在有限的环境(如有限的生存空间)之中,种群不可能无限增长,而是存在增长极限。如果用Logistic曲线分析某种现象,必须首先确认:该现象是否在发展到一定规模后增长速度会逐步下降,该现象是否存在增长的极限等。,5,除定性分析外,根据资料把握现象的特点也是选择模型的重要环节。定量分析需要用到多种初等分析方法,比如,计算样本的逐期增长率,看是否满足指数曲线模型的要求。更常用的方法是绘制曲线图,直观地判断现象大体符合哪种模型。有时数据中不仅包含趋势,还存在周期波动和较强的随机变动,造成趋势识别的困难,需要对数据进行预处理。其方法主要包括数据的
3、平滑和周期调整(如季节调整)。,6,例4.1(承接例3.7,表3.13)化肥施用量,非线性化模型通常采用非线性最小二乘法。求解参数的方法通常是令对参数偏导等于零。但在模型复杂的情况下也无法求出精确解,这时,通常用迭代法,求出参数估计的初始值,通过迭代求出一个新的估计值,重复迭代直到估计值收敛。求初始值通常可以用一些初等的方法,如三和值法。,命令:Expand 1975 2015Genr t=trendLs k=c(1)/(1+c(2)*exp(-1)*c(3)*t),7,三和值法,三和值法的基本思想是:若模型有三个未知参数,将数据三等分。分别对每部分的数据求和,将每部分和的值代入方程,可得到一
4、个方程,一共可得到三个方程,然后解方程组可以获得三个参数的估计值。由于模型不同,求解的具体过程有所不同。,8,9,例4.2(承接例4.1)建立Logistic模型,Expand 1975 2015Genr t=trendParam c(1)7116386.979 c(2)7.377132419 c(3)0.109384469或:genr c(1)=7116386.979 genr c(2)=7.377132419 genr c(3)=0.109384469(三和值法计算过程见Excel文档)Ls k=c(1)/(1+c(2)*exp(-1)*c(3)*t)预测,作图,10,Logistic曲线
5、参数最小二乘估计结果,趋势模型为:K=7115797.46558/(1+8.77729632665*EXP(-1)*0.106882882043*T),11,4.2 季节模型与分析,4.2.1 季节模型类型,12,4.2 季节模型与分析,4.2.1 季节模型类型,季节模型是反映具有季节变动规律的时间序列模。季节变动是指以一年.为一个周期的变化。引起季节变动的首要因素是四季更迭,比如冷饮的市场销量随着冬去夏来年复一年地发生周期变动。以年为周期的变化还可由历史的、人文的或制度的因素引起,比如春节、穆斯林的斋月等。传统的时间序列分析把时间序列的波动归结为四大因素:趋势变动,季节变动,循环变动和不规则
6、变动,其中,循环变动指周期为数年的变动,通常指经济周期。不规则变动即随机变动。四种变动与原序列(Y)的关系被概括为两种模型:乘法模型:Y=TSCI加法模型:Y=T+S+C+I,13,经济指标的月度或季度时间序列包含4种变动要素:乘法模型:Y=TSCI加法模型:Y=T+S+C+I 长期趋势要素T;季节变动要素S;循环要素C;不规则要素I,经济时间序列的分解,14,图1 我国工业总产值的时间序列 Y 图形 图2 工业总产值的趋势循环要素 TC 图形,图3 工业总产值的季节变动要素 S 图形 图4 工业总产值的不规则要素 I 图形,15,4.2.2 季节因子与季节调整,季节调整就是将时间序列季节因素
7、剔除乘法模型:Y/S=TCI加法模型:Y-S=T+C+I,16,4.2.2 季节因子与季节调整,例 民航客运量(表4.3)命令:seas airln序列窗口:Proc/Seasonal Adjust/Cencus X12作图,17,Series sa=airln/airlnsa,18,4.2.3 时间序列的分解与合成,1.时间序列的分解分解的主要目的是将时间序列各波动因素分解开,可以清楚地观察各部分波动的具体情况,以便为深入研究各部分波动的变化规律提供条件。,19,4.2.3 时间序列的分解与合成,例4.4 民航客运量序列窗口:Proc/Seasonal Adjust/Cencus X12,随
8、后选择相应成分,选择要保存的季节调整后分量序列,X12将加上相应的后缀存在工作文件中。季节调整后序列(SA);季节因子序列(SF);趋势循环叠加序列(TC);不规则波动要素(IR);创建群group01,输入命令Group01.line(m)或line(m)airln_ir airln_sa airln_sf airln_tc,20,21,民航客运量序列airln具有明显的季节变动和周期循环变动等影响,其折线图呈现向上趋势的锯齿状。序列airln-TC是经过季节调整消除季节变动和不规则变动要素所得的趋势-循环序列,与原序列比较,其折线图比较光滑,其向上趋势比较明显。序列airln-SF是季节要
9、素因子,其形状呈现波形状,并且周期较为固定,大约为一年,其振幅大致为1.17序列airln-IR是不规则要素,其形状杂乱无章。,22,2.时间序列的合成 合成的主要目的是清楚认识各部分波动的规律的前提下,将分解开来的因素再重新合并,构成比较完整的模型,其主要目的是预测。,23,例4.4 民航客运量,我国民航客运量数据(1993年10月-1998年3月),建立预测模型,24,该序列有两个比较明显的有规律的波动,趋势T和季节变动S,因此.打算建立如下预测模型:,f(t)是模型趋势部分;si是相应的季节指数,25,例4.4 民航客运量建立模型:,趋势模型:,genr t=trendls airln_
10、sa=c(1)+c(2)*t+c(3)*t2expand 1993,10 1998,12预测得:airln_saf复制airln_sf 合成:genr y=airln_saf*airln_sf作图,26,4.3 指数平滑法,27,本章前两节介绍的方法适合于比较有规律的数据,有比较明显的趋势变动和季节波动的序列。实际问题中数据有时并不那么有规则。例如,深圳股市连续130周的周综含指数数据的变动如图所示。由图可以看出,数据有明显趋势,但没有季节变动。图中的虚线是直线趋势模型.人们不大可能沿着这条线进行短期预测。,28,上证综合指数,趋势可分为长期趋势和短期趋势。有时短期趋势经常改变。如果仔细观察图
11、中序列的波动情况,会发现不同时期的短期趋势并不一样,有时向上有时朝下。如该序列在2001年后的基本趋势是向下发展。因此,如果有一种方法能够自动追踪数据的变化,不断调整对序列中所含短期趋势的估计,必然会收到较好短期预测的效果,指数平滑法属于这类方法。,29,4.3.2 一次指数平滑,一次这种单指数平滑方法适用于序列值在一个常数均值上下随机波动的情况,无趋势及季节要素。yt 平滑后的序列 计算式如下,t=2,3,T其中:,为平滑因子。越小,越平缓,重复迭代,可得到,由此可知为什么这种方法叫指数平滑,y 的预测值是 y 过去值的加权平均,而权数被定义为以时间为指数的形式。,30,很明显,一次指数平滑
12、的预测值,是实际值序列的加权平均,因而适用于比较平稳的序列。由于权数呈指数衰减,越早的数据被赋子的权数值越小,因此预测值主要倚重近期样本数据,远期数据对它得影响较小(甚至没有影响,这要看平滑系数取什么值)。一次指数平滑预测最突出的优点是方法简单,甚至只要有样本末期的平滑值,就可得到预测结果。如果获得新的观察值,据此可以很方便地更新预测值。,31,一次指数平滑法揭示所有指数平滑法的共同特点:能够追踪数据的变化。由于权数是指数衰减的,因此预测总是倚重最新的样本数据。如果在预测过程中添加新的样本数据,按照本方法新数据会自动取代老数据的地位,老数据会逐渐被置于次要地位。甚至被淘汰。这样,预测值总是反映
13、最新的数据结构 如果预测持续进行,同时数据又被持续更新,最新的预测总是反映最新数据所带来的信息。,32,一次指数平滑法有局限性。第一,预测值是常数,不能反映趋势变动、季节波动等有规律地变动。若研究对象存在这些变动不宜采用一次指数平滑法。第二。短期预测较灵敏但不适合中长期预测。第三,由于预测值是历史数据的均值,因此,与实际序列的变化相比,预测值序列的变动有滞后现象。,33,4.3.3 二次指数平滑,这种方法是将单指数平滑进行两次(使用相同的参数)。适用于有线性趋势的序列。序列y的双指数平滑以递归形式定义为,其中:0 1,St 是单指数平滑后的序列,Dt 是双指数平滑序列。注意双指数平滑是阻尼因子
14、为 0 1 的单指数平滑方法。,34,1.Holt-Winters 无季节趋势(两个参数),这种方法适用于具有线性时间趋势无季节变差的情形。这种方法与双指数平滑法一样以线性趋势无季节成分进行预测。双指数平滑法只用了一个参数,这种方法用两个参数。yt 平滑后的序列 由下式给出,其中:a 表示截距;b表示斜率,即趋势。,4.3.4 多次数指数平滑,35,这两个参数由如下递归式定义,其中:k 0,在0-1之间,为阻尼因子。这是一种有两个参数的指数平滑法。预测值计算如下,这些预测值具有线性趋势,截距为 aT,斜率为 bT,T 是估计样本的期末值。,36,2.Holt-winters乘法模型(三个参数)
15、,这种方法适用于序列具有线性趋势和乘法季节变化。yt 的平滑序列 由下式给出,其中:at 表示截距,bt 表示斜率,at+bt k 表示趋势,St 为乘法模型的季节因子,s 表示季节周期长度,月度数据 s=12,季度数据 s=4。需要用简单的方法给出季节因子的第一年的初值,以及截距和斜率的初值。,37,这三个系数定义如下,其中:k 0,在01之间,为阻尼因子。预测值由下式计算,其中:ST+k-s 用样本数据最后一年的季节因子,T 是估计样本的期末值。,38,4.3.5 操作方法,例4.5 上证指数(教材为深圳指数)expand 1991,1 2003,12smooth(d)shanghai或s
16、hanghai.smooth(d)或:主菜单:Quick/Series Statistics/Exponential Smoothing序列窗口:Procs/Exponential Smoothing采用Holter-Winter 非季节模型(Holter-Winter no seasonal),39,操作方法,例4.5 上证指数(教材为深圳指数)作图genr t=trendls shanghai c t预测,40,例4.5 上证指数(教材为深圳指数)二次指数平滑预测的趋势与趋势线所显示的趋势完全不同。前者更像数据序列的自然延伸。它代表短期趋势,适合短期预测。趋势线代表的是长期趋势。,41,例4.6民航客运量,操作方法expand 1993,10 1998,12smooth(m)airln或airln.smooth(m)或:主菜单:Quick/Series Statistics/Exponential Smoothing序列窗口:Procs/Exponential Smoothing采用Holter-Winter 季节乘积模型(Holter-Winter Multiplicative),42,例4.6民航客运量,作图,43,