2012预测-第5讲(时间序列分析)-1.ppt

上传人:laozhun 文档编号:2801398 上传时间:2023-02-25 格式:PPT 页数:106 大小:1.95MB
返回 下载 相关 举报
2012预测-第5讲(时间序列分析)-1.ppt_第1页
第1页 / 共106页
2012预测-第5讲(时间序列分析)-1.ppt_第2页
第2页 / 共106页
2012预测-第5讲(时间序列分析)-1.ppt_第3页
第3页 / 共106页
2012预测-第5讲(时间序列分析)-1.ppt_第4页
第4页 / 共106页
2012预测-第5讲(时间序列分析)-1.ppt_第5页
第5页 / 共106页
点击查看更多>>
资源描述

《2012预测-第5讲(时间序列分析)-1.ppt》由会员分享,可在线阅读,更多相关《2012预测-第5讲(时间序列分析)-1.ppt(106页珍藏版)》请在三一办公上搜索。

1、预测理论与方法,授课教师:杨小宝 副教授北京交通大学2012.12,6.1 时间序列分析概述 6.2 数据准备 6.3 时间序列的图形化观察及检验 6.4 时间序列的预处理(重点)6.5 简单回归分析法和趋势外推法(自学)6.6 指数平滑法(重点)6.7 ARIMA模型分析(重点)6.8 季节调整法(重点),时间序列分析,6.1 时间序列分析概述,6.1.1 时间序列的相关概念6.1.2 时间序列分析的一般步骤6.1.3 SPSS时间序列分析的特点,时间序列分析是研究事件发展变化规律的一种量化分析方法。一般情况下,那些依时间先后顺序排列起来的一系列有相同内涵的数据通信都可以称为时间序列。时间序

2、列与一般的统计数据的不同之处在于:这是一些有严格先后顺序的数据。大多数情况下它们往往存在某种前后相承的关系,而非互相独立的。时间序列分析就是包含了针对这种独特数据特点而形成和发展起来的一系列统计分析方法的一个完整的体系。,6.1.1 时间序列分析概述,研究时间序列问题时常会涉及到以下概念:1.指标集T 指标集T可理解为时间t的取值范围。2.采样间隔t 采样间隔t可理解为时间序列中相邻两个数的时间间隔。3.平稳随机过程和平稳时间序列 时间序列的平稳性是指时间序列的统计规律不会随着时间的推移而发生变化。,直观上,一个平稳的时间序列可以看作是一条围绕其均值上下波动的曲线。从理论上,有两种意义的平稳性

3、,一个是严平稳或完全平稳,一个是宽平稳或广义平稳。严平稳:如果对 t1,t2,tn,hT和任意整数n,都使(yt1,yt2,ytn)与(yt1+h,yt2+h,ytn+h)同分布,则概率空间(W,F,P)上随机过程y(t),tT称为平稳过程。具有时间上的平稳不变性。实践当中是非常困难甚至是不可能的。,直观上,一个平稳的时间序列可以看作是一条围绕其均值上下波动的曲线。从理论上,有两种意义的平稳性,一个是严平稳或完全平稳,一个是宽平稳或广义平稳。严平稳:如果对 t1,t2,tn,hT和任意整数n,都使(yt1,yt2,ytn)与(yt1+h,yt2+h,ytn+h)同分布,则概率空间(W,F,P)

4、上随机过程y(t),tT称为平稳过程。具有时间上的平稳不变性。实践当中是非常困难甚至是不可能的。,宽平稳:宽平稳是指随机过程的均值函数、方差函数均为常数,自协方差函数仅是时间间隔的函数。如二阶宽平稳随机过程定义为:E(yt)=E(yt+h)为常数,且对 t,t+hT都使协方差Eyt E(yt)yt+h E(yt+h)存在且与t无关,只依赖于时间间隔h。,4.白噪声序列:若随机序列yt由互不相关的随机变量构成,即对所有st,Cov(ys,yt)=0,则称其为白噪声序列。白噪声序列是一种特殊的平稳序列,在不同时点上的随机变量的协方差为0。该特性通常被称为“无记忆性”,意味着无法根据其过去的特点推测

5、其未来的走向,其变化没有规律可循。当模型的残差序列成为白噪声序列时,可认为模型达到了较好的效果,剩余残差中已经没有可以识别的信息。因此,白噪声序列对模型检验也是很有用处的。,5.时点序列和时期序列人们研究的那些按时间先后顺序排列的一系列时间序列数据往往由两部分组成:一是观测值;二是观测值对应的时间点或时间段。指标集T中的每个元素表示的是一段时间,这种数据被称为时期数据;指标集T中的每个元素表示的是一个时间点,这种数据被称为时点数据。,6.1.2 时间序列分析的一般步骤,数据的准备阶段;数据的观察及检验阶段:总体把握时间序列发展变化的特征,以便选择恰当的模型进行分析,包括图形方法和统计检验方法;

6、数据的预处理阶段:一方面能够使序列的特征体现得更加明显,利于分析模型的选择;另一方面使数据满足于模型的要求;,数据分析和建模阶段:根据时间序列的特征和分析的要求,选择恰当的模型进行数据建模和分析;模型的评价阶段:与模型分析的目标相结合评价是否达到了分析的目的以及效果如何;模型的实施应用阶段。,可分为时域分析和频域分析两类,具体有:简单回归分析法适合序列间结构分析和较的预测;趋势外推法适用于精度要求不很高的中长期趋势预测;自回归移动平均(ARMA)模型常用于对随机性波动较频繁序列的短期预测,对于非平稳的序列可用ARIMA模型;谱分析方法适用于那些高频波动数据。,6.1.3 时间序列分析的特点,S

7、PSS的时间序列分析是分散在Data、Transform、Analyze、Graph四个功能菜单当中。在Data和Transform中实现对时间序列数据的定义和必要处理,以适应各种分析方法的要求;,在分析预测中主要提供了几种时间序列的分析方法,包括指数平滑法、ARIMA模型和季节调整方法;在分析预测中提供了时间序列分析的图形工具,包括序列图(Sequence)、自相关函数和偏自相关函数图等。另外,也可利用分析预测频谱分析模块进行简单的谱分析。,6.2 数据准备,SPSS的数据准备包括数据文件的建立、时间定义和数据期间的指定。其中数据文件的建立与一般SPSS数据文件的建立方法相同,每一个变量将对

8、应一个时间序列数据,且不必建立标志时间的变量。具体操作这里不再赘述,仅重点讨论时间定义的操作步骤。,SPSS的时间定义功能用来将数据编辑窗口中的一个或多个变量指定为时间序列变量,并给它们赋予相应的时间标志,具体操作步骤是:1)选择菜单:DataDefine Dates,出现窗口:,2)个案为(Cases Are)框提供了多种时间形式,可根据数据的实际情况选择与其匹配的时间格式和参数。并在第一个个案为框中输入起初日期。至此,完成了SPSS的时间定义操作。SPSS将在当前数据编辑窗口中自动生成标志时间的变量。同时,在输出窗口中将输出一个简要的日志,说明时间标志变量及其格式和包含的周期等。数据期间的

9、选取可通过SPSS的数据选择个案(Select Cases)功能实现。,6.3 时间序列的图形化观察及检验,6.3.1 图形化观察及检验目的6.3.2 图形化观察工具6.3.3 时间序列的检验方法6.3.4 图形化观察和检验的基本操作6.3.5 图形化观察的应用举例,6.4.1 图形化及检验目的,时间序列分析的第一步是对其发展变化的特征有一个初步的总体把握。通过图形化观察和检验能够把握时间序列的诸多特征,如时间序列的发展趋势是上升还是下降,还是没有规律的上下波动;时间序列的变化的周期性特点;时间序列波动幅度的变化规律;时间序列中是否存在异常点,时间序列不同时间点上数据的关系等。,通过图形化观察

10、和检验应把握以下几点:时间序列的正态性,考察数据是否符合正态分布;时间序列的平稳性,是要了解时间序列数据适合于什么样的模型,能否直接用来建立模型等;时间序列的周期性,是指随着时间的推移序列呈现出有规律的周期性波动;时间序列的其他特性,如异常值、簇集性等。,6.3.2 图形化观察工具,序列图(Sequence)一个平稳的时间序列在水平方向平稳发展,在垂直方向的波动性保持稳定,非平稳性的表现形式多种多样,主要特征有:趋势性、异方差性、波动性、周期性、季节性、以及这些特征的交错混杂等。,序列图还可用于对序列异常值的探索,以及体现序列的“簇集性”。异常值是那些由于外界因素的干扰而导致的与序列的正常数值

11、范围偏差巨大的数据点。“簇集性”是指数据在一段时间内具有相似的水平,在不同的水平间跳跃性变化,而非平缓性变化。,直方图(Histogram)直方图是体现序列数据分布特征的一种图形,通过直方图可以了解序列的平稳性、正态性等特征。自相关函数图和偏自相关函数图(ACFPACF)所谓自相关是指序列与其自身经过某些阶数滞后形成的序列之间存在某种程度的相关性。对自相关的测度往往采用自协方差函数和自相关函数。偏自相关函数是在其他序列给定情况下的两序列条件相关性的度量函数。,自相关函数图和偏自相关函数图对识别时间序列的各种非平稳性和确定时序模型中的参数有非常重要的作用。各种时间序列的自相关函数图和偏自相关函数

12、图通常有一定的特征和规律:1)白噪声序列的各阶自相关函数和偏自相关函数值在理论上均为0。但实际当中序列多少会有一些相关性,但一般会落在置信区间内,同时没有明显的变化规律。,2)具有趋势性的非平稳时间序列,序列的各阶自相关函数值显著不为零,同时随着阶数的增大,函数值呈缓慢下降的趋势;偏自相关函数值则呈明显的下降趋势,很快落入置信区间。3)异方差的非平稳时间序列,其各阶自相关函数显著不为零,且呈现出正负交错,缓慢下降的趋势;偏自相关函数值也呈正负交错的形式,且下降趋势明显。,4)具有周期性的非平稳时间序列,其自相关函数呈明显的周期性波动,且以周期长度及其整数倍数为阶数的自相关和偏自相关函数值均显著

13、不为零。5)非周期的波动性时间序列,自相关函数值会在一定的阶数之后较快的趋于零,而偏自相关函数则会很快的落入到置信区间内。,谱密度图(Spectral)谱密度图用于序列周期性的检验,它是时间序列频域分析中识别序列隐含周期性的有效方法。谱分析法重在对序列当中的周期成分进行识别,从而达到对序列进行认识和分解的目的。互相关图(Cross correlations)对两个互相对应的时间序列进行相关性分析的实用图形工具。互相关图是依据互相关函数绘制出来的。是不同时间序列间不同时期滞后序列的相关性。,6.3.3 时间序列的检验方法,通常序列的非平稳性可通过序列图、自相关函数图和偏自相关函数图大致分辨出来。

14、但有时还需要一些定量的检验方法。参数检验法。基本思路是,将序列分成若干子序列,并分别计算子序列的均值、方差、相关函数。根据平稳性假设,当子序列中数据足够多时,各统计量在不同序列之间不应有显著差异。如果差值大于检验值,则认为序列具有非平稳性。,游程检验法。游程检验是一个非参数检验方法,其基本思路是,将序列的数值按一定规则重新分组形成两类。游程则为时间序列中同类数据连在一起的子序列个数。一般认为,平稳性的或随机性的序列中不应出现许多同类数据连续出现的情况,也不应出现两类数据反复交替出现的情形。也就是说游程不能太多,也不能太少。关于游程检验的详细内容可参见本书有关非参数检验的章节。,6.3.4 图形

15、化观察和检验的基本操作,1.绘制序列图的基本操作1)分析预测序列图。,2)将需绘图的序列变量选入变量Variables框。3)在时间轴标签Time Axis Labels框中指定横轴(时间轴)标志变量。该标志变量默认的是日期型变量。4)在转换Transform框中指定对变量进行怎样的变化处理。其中Natural log transform表示对数据取自然对数,Difference表示对数据进行n阶(默认1阶)差分,Seasonally difference表示对数据进行季节差分。,5)单击时间线Time Lines 按钮定义序列图中需要特别标注的时间点,给出了无参考线(No reference

16、 Lines)、每一个更改的线(Line at each change of)、在日期上的线(Line at date)三项供选择。6)单击格式Format 按钮定义图形的格式,可选择横向或纵向序列图;对于单变量序列图,可选择绘制线图或面积图,还可选择在图中绘制序列的均值线;对多变量的序列图,可选择将不同变量在同一时间点上的点用直线连接起来.,2.绘制自相关函数图和偏自相关函数图的操作1)分析预测自相关。,2)将需绘制的序列变量选入变量Variables框。3)在输出Display框选择绘制哪种图形,其中Autocorrelations表示绘制自相关函数图;Partial autocorrel

17、ations表示绘制偏自相关函数图。一般可同时绘制两种图形。4)单击选项Options按钮定义相关参数,其中Maximum Number of Lags表示相关函数值包含的最大滞后期,即时间间隔h。一般情况下可选择两个最大周期以上的数据。在Standard Error Method框中指定计算相关系数标准差的方法,它将影响到相关函数图形中的置信区间。,目 其中Independence model表示假设序 列是白噪声的过程;Bartletts approximation表示,根据Bartlett 给出的估计自相关系数和偏自相关系数方差的近似式计算方差。该方法适合当序列是一个k-1阶的移动平均过

18、程,且标准差随阶数的增大而增大的情况。5)选中Display autocorrelation at periodic lags表示只显示时间序列周期整数倍处的相关函数值。一般如果只考虑序列中的周期因素可选中该项,否则该步可略去。,3.绘制互相关图的基本操作1)分析预测互相关图。2)把需绘图的序列变量选到Variables框中。要求两个序列均具有平稳性。,6.3.5 图形化观察应用举例,1、利用模拟序列数据:1)以各种序列绘制序列图;2)以各种序列绘制自相关函数图和偏自相关函数图。2、利用海关总出口额数据,绘制出口总额和外汇储备的一阶逐期差分后的序列互相关图。,时间序列分析(模拟序列数据).sa

19、v,1)以各种序列绘制序列图,操作过程,输出图形1,平稳序列的序列图示例,输出图形2,具有上升趋势的非平稳序列,输出图形3,具有异方差性的非平稳序列,输出图形4,具有波动性的非平稳序列,输出图形5,具有周期性的非平稳序列,时间序列分析(模拟序列数据).sav,非平稳序列差分处理后变为平稳序列,输出图形,操作过程,时间序列分析(模拟序列数据).sav,2)以各种序列绘制自相关函数和偏自相关函数图,正态白噪声的自相关函数和偏自相关函数的输出数据表,输出结果中的数据表举例,输出图形1,正态白噪声的自相关函数和偏自相关函数图,输出图形2,一个上升趋势序列的自相关函数和偏自相关函数图,输出图形3,一个异

20、方差序列的自相关函数和偏自相关函数图,输出图形4,一个周期性序列的自相关函数和偏自相关函数图,输出图形5,一个非周期的波动性序列的自相关函数和偏自相关函数图,时间序列分析(总出口额).sav,2.绘制互相关图的操作举例,互相关图,输出图形,输出数据,6.4 时间序列的预处理,6.4.1 预处理的目的和主要方法6.4.2 预处理的基本操作6.4.3 预处理的应用举例,6.4.1 预处理的目的和主要方法,通过数据的观察和检验阶段实现对序列变化特征的把握后,就可根据数据的特点和分析的需要对数据进行必要的变换处理。预处理的目的可大致归纳为两个方面:第一,使序列的特征体现得更加明显,利于分析模型的选择;

21、第二,使数据满足于某些特定模型的要求。,序列的预处理主要包括以下几个方面:序列缺失数据的处理序列数据的变换处理数据变换主要包括序列的平稳化处理和序列的平滑处理等。序列的平衡化处理目的是使处理后的序列成为平稳序列。均值平稳化一般采用差分(Difference)处理,方差平稳化一般用Box-Cox变换处理。,1)差分是一种通过逐项相减消除前后期数据相关性的方法,可大致剔除序列中的趋势性,使数据在水平方向基本平稳。差分不一定是相邻项之间的运算,也可以在有一定跨度的时间点之间进行。季节差分(Seasonal difference)就是一个典型的代表。对于既有趋势性又有季节性的序列,可同时进行差分和季节

22、差分处理。,2)时间序列的平滑处理目的是为了消除序列中随机波动性影响。常用的平滑处理的方式有:中心移动平均法(Centered moving average)计算以当前为中心的时间跨度k范围内数据的移动平均数。向前移动平均法(Prior moving average)若指定时间跨度为k,则用当前值前面k个数据(注意:不包括当前值)的平均值代替当前值。移动中位数(Runing medians)它以当前时间点为中心,根据指定的时间跨度k计算中位数。,另外,还可以通过序列取对数以及对序列进行标准化、中心化、归一化处理等方法进行数据变换。它们可使偏态分布的序列变成对称的分布,可消除序列中的异方差性,可

23、使变量间的非线性变换关系转换成为线性关系,在时间序列数量级很大的时候会起到显著改善计算精度的作用。,6.4.2 预处理的基本操作,序列缺失数据处理的基本操作转换替换缺失值;把需处理的变量选择到新变量框中,在名称和方法框中,在名称后输入处理新生成的变量名,在方法中选择处理缺失值的替代方法,并单击更改按钮。注意,若序列中第一个或最后一个数据为缺失值,只能用序列均值和线性趋势法处理。,时间序列分析(模拟序列数据).sav,缺失值处理的操作过程,输出结果,变量集新增一列,2.序列数据变换的基本操作SPSS提供了专门进行时间序列数据变换的模块,其中包含:差分和季节差分等平稳化方法,移动平均和移动中位数等

24、平滑方法,以及生成新序列的变换方法。基本操作步骤如下:转换创建时间序列;把需处理的变量选择到新变量框中,在名称和函数框中,在名称后输入处理新生成的变量名,在函数中选择转换处理方法,在顺序后输入相应的阶数,并单击更改按钮。,其中的方法除前面介绍的几种外,还包括:累加求和:即对当前值和当前值之间的所有数据进行求和,生成原序列的累计值序列。滞后:即对指定的阶数k,用从当前值向前数到第k个数值来代替当前值。这样形成的新序列将损失前k个数据。提前:与数据滞后正好相反,即指定的阶数k,从当前值向后数以第k个数值来代替当前值。这样形成的新序列将损失后k个数据。,时间序列分析(模拟序列数据).sav,用平滑法

25、进行数据转换的操作,变量集新增一列,输出结果,6.5 简单回归法和趋势外推法,6.5.1 概述6.5.2 应用举例,简单回归方法认为时间序列yt的变化大体上可由其他与其对应的时间序列xt来决定,并以此出发找出序列与其他序列间的大体上的数量关系。趋势外推法认为事物的内在发展规律是与时间本身的推移相关联的,可以建立序列与时间t的函数关系来反映事物发展的规律,并用于对未来的预测。,6.5.1概述,两种方法都是基于回归分析原理的。所要研究的时间序列被当做回归模型的被解释变量,其他变量被称为回归模型的解释变量。简单回归分析法中,解释变量与被解释变量都是有实际意义的时间序列。,趋势外推法中,模型中的解释变

26、量往往是一些表示时间顺序的序列,可以没有实际意义。人们根据事物的发展规律归纳出了可概括各种发展规律的数学曲线形式,多项式是其中应用最为广泛的一种,其一般模型为,趋势外推法主要用于较长期的预测分析,由于模型的选择存在较强的主观性,模型选择上的差异会导致对同批数据的不同分析结论。,6.5.2 应用举例,书上P428(薛薇),根据煤炭和成品油出口量月度数据,研究:煤炭出口量在较长一段时间内的发展变化趋势;煤炭出口量与成品油出口量之间的数量关系。,时间序列分析(煤炭及成品油出口).sav,先绘制煤炭出口量的序列图,时间序列分析(煤炭及成品油出口).sav,1.趋势外推模型,图25,趋势外推模型-操作,

27、趋势外推模型输出结果,图26,表3,时间序列分析(煤炭及成品油出口).sav,2.简单回归模型,图形旧对话框散点/点状简单分布,先绘制两者间的散点图,图27,简单回归模型-操作,简单回归模型输出结果,图28,表4,两者表现为一种正比例对应关系1:0.744,6.6 指数平滑法,6.6.1 指数平滑法的基本思想6.6.2 指数平滑法的模型6.6.3 指数平滑法的基本操作6.6.4 指数平滑法的应用举例,6.6.1 指数平滑法的基本思想,研究时间序列的一个重要目的是预测。移动平均是利用已知值的某种平均值进行预测的方法。移动平均包括简单移动平均法和加权移动平均法,而权数的确定较为繁琐。指数平滑法通过

28、对权数的改进,使其在处理时简单易行,其基本思想也是用序列过去值的加权平均数来预测未来的值,且通过权数的大小体现事物发展中不同时期间与现实联系的紧密程度。它的目标是使预测值和观测值之间的均方误差(MSE)达到最小。,适用于比较平衡的序列,6.6.2 指数平滑法的模型,1)一次指数平滑法(简单指数平滑法),随着时间向过去的推移,各期实际值对预测值的影响按指数规律递减,这是该方法冠以指数平滑的原因。在SPSS中可根据模型对数据的拟合按情况,自动选择误差最小时的平滑常数值(01)。,与ARIMA(0,1,1)模型类似,第t+1期的预测值,为待估参数,2)二次指数平滑法(线性指数平滑法),包括Brown

29、线性趋势模型和Holt线性趋势模型。,适用于有线性趋势的时间序列,与ARIMA(0,2,2)模型类似,第t+m期的预测值,为待估参数,适用于有线性趋势的时间序列,Holt线性趋势模型,与ARIMA(0,2,2)模型类似,第t+m期的预测值,、为待估参数,3)三次(三重)指数平滑法,包括布朗三次指数平滑,适用于有非线性趋势的时间序列,第t+m期的预测值,为待估参数,和Winters可加性模型,适用于同时有趋势性和季节性的时间序列的短期预测,与SARIMA(0,1,0)(0,1,1)s模型类似,、为待估参数,还有其它几个常用模型:阻尼趋势模型:适用于处理具有一个逐渐消失的线性趋势成分,但不含季节成

30、分的时间序列数据。它与ARIMA(1,1,2)模型类似。简单季节模型:适用于处理含有不随时间变化的季节成分,但不含趋势成分的时间序列数据,它与SARIMA(0,1,1)(0,1,1)s模型类似。Winters相乘性模型:适用于处理包含线性趋势成分,且包含一个依赖序列水平的季节成分的时间序列数据。,6.6.2 指数平滑法的基本操作,由于指数平滑法要求数据中不能存在缺失值,因此在用SPSS进行指数平滑法分析前,应对数据序列进行缺失值填补。SPSS指数平滑法的基本操作步骤如下:1)选择菜单分析预测创建模型在弹出窗口中方法中选择指数平滑。,时间序列分析(彩电出口).sav,把待分析的变量选择到因变量框

31、中。点击条件按钮中选择合适的模型。包括非季节的简单指数平滑模型、霍特模型、温特线性模型及多种季节性模型。,4)在统计量、图表等子对话框中,选择需要输出的统计量和图表。,6.6.3 指数平滑法的应用举例,利用1992年初2002年底共11年彩电出口量(单位:“台”)的月度数据,建立几种指数平滑模型,对彩电出口量的变化趋势进行分析和预测。1.首先绘制和观察彩电出口量的序列图2.模型一:简单指数平滑模型3.模型二:Brown线性趋势模型4.模型三:Winters可加性模型,时间序列分析(彩电出口).sav,图31 彩电出口量序列图,1.绘制序列图,简单指数平滑模型输出的统计量,参数估计值,均方根误差,2.简单指数平滑模型,具体操作见上一节,简单指数平滑模型输出的残差自相关函数和偏自相关函数图,图32 简单指数平滑法拟合效果图,2.Brown线性趋势模型,均方根误差,比简单指数平滑模型的小些,参数估计值,输出的统计量,残差自相关函数和偏自相关函数图,具有明显的季节性,逐个输出便可,Brown线性趋势模型拟合效果图,3.Winters可加性模型,具体操作,预测设定,均方根误差,比前面两个模型的更小,参数估计值,输出的统计量,残差自相关函数和偏自相关函数图,季节性趋势已消除,Winters可加性模型拟合效果图,更佳,预测值,可进一步用其它平滑模型对其进行拟合。,Thank you,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号