《计量经济学第六章.ppt》由会员分享,可在线阅读,更多相关《计量经济学第六章.ppt(56页珍藏版)》请在三一办公上搜索。
1、1,第六章 传统时间序列分析,第一节 时间序列的分解第二节 趋势模型与分析第三节 季节模型第四节 指数平滑法,2,第一节 时间序列的分解,基本概念时间序列的构成要素时间序列的分解模型,3,基本概念,时间序列(times series)同一现象在不同时间上的相继观察值排列而成的序列时间序列的分类平稳序列(stationary series)非平稳序列(non-stationary series),4,时间序列的构成要素,构成要素趋势(T)季节性或季节变动(S)周期性或循环波动(C)随机性或不规则波动(I),5,时间序列的分解模型,模型乘法模型 加法模型 基本假设四个因素对时序具有相互影响时乘法模
2、型四个因素对序列的影响相互独立时加法模型,6,第二节 趋势模型与分析,趋势模型模型的选择模型的参数估计模型的评价与预测,7,趋势模型,确定型时序分析根据时间序列自身发展变化的基本规律和特点即趋势,选取适当趋势模型进行分析和预测趋势模型一般形式 常用的趋势模型,8,模型的选择,定性分析在选模型之前,弄清楚模型的条件和预测对象性质、特点例如:指数曲线和Logistic曲线模型定量分析根据资料把握现象的特点需要多种初等分析方法计算样本的逐期增长率绘制曲线图,直观判断现象大体符合哪种模型对数据进行预处理数据不仅包含趋势,还存在季节波动和较强的随机变动,造成趋势识别的困难主要方法:数据的平滑和季节调整,
3、9,模型的选择(续),例6-1我国汽车保有量资料如下根据数据绘制时间序列曲线图由图可知,实际值序列y近似一条光滑的上升曲线,可选择适当的曲线模型描述该趋势考虑选择指数曲线模型,10,模型的参数估计,参数的最小二乘估计常用的各类趋势模型参数估计仍常用OLS其中,自变量为时间t参数的三和值法(第五章)若选用有增长上限的曲线趋势模型,当增长上限事先不能确定时,可采用三和值法基本思想若模型有三个未知数,将数据三等分,分别求出每部分的和,代入方程,得到三个方程,解方程组可获得三个参数的估计值,11,模型的参数估计(续1),参数的非线性最小二乘估计(第五章)非线性模型可利用NLS进行参数的精确估计首先,用
4、param命令对参数赋初值其次,输入方程,对模型进行估计,12,模型的参数估计(续2),例6-2我国自行车销售量预测绘制曲线图由图可知,序列的增长在近期变缓,考虑建立Logistic模型由于增长上限事先无法确定,参数用三和值法估计,13,模型的参数估计(续3),将数据等分成三段本例全部数据为14个,则需舍弃部分数据从预测角度看,舍弃最早的数据(1978和1979)将剩余的12个数据等分成三段第一段1980-1983年,第二段1984-1987年,第三段1988-1991年每一段含4个数据对原序列y取倒数,生成新序列cy分别计算序列cy各段数据的均值,由此可计算三段数据的和值,14,模型的参数估
5、计(续4),本例计算结果根据第五章Logistic模型参数的三和值法估计的计算公式可得L=3646.067128a=2.026802528b=0.531299085,15,模型的参数估计(续5),例6-3续例6-2,我国自行车销售量预测参数考虑用NLS,得到参数的精确估计用param 命令为参数赋初值,初值取前面算出的L、a和bc(1)=3646.067128c(2)=2.026802528c(3)=0.531299085输入方程进行估计,16,模型的参数估计(续6),模型估计结果如下由上表可知,精确估计与三和值估计结果相差不大,CoefficientStd.Errort-StatisticP
6、rob.C(1)3787.307163.398523.178340.0000C(2)8.7976223.3143842.6543760.0224C(3)0.5226170.0949755.5026970.0002,17,模型的评价与预测,预测趋势模型的预测与回归模型的预测方法一样评价趋势模型的不足将现象的趋势模式化、固定化无法随着现象的变化而变化通过对近期数据的分析来评价模型近期数据即离预测期较近的样本数据若模型生成的序列能与近期样本数据相吻合,模型在未来与序列实际变化一致的可能性较大,18,第三节 季节模型,季节因子与季节调整季节模型预测应用,19,季节因子与季节调整,季节因子反映序列随时间
7、变化过程中,受季节因素影响的程度季节指数当时序数据不包含循环变动适宜采用乘法模型时,季节因子亦称为季节指数某期实际季节指数(SI)=该期实际值(Y)/该期趋势值(T)季节变动的一般规律,可由同月(季)实际季节指数的平均值描述季节指数im=同月(季)实际季节指数合计/计算年数其中,m指第i个月份(或季)季节增量若适宜采用加法模型,则季节因子是季节增量某时期实际季节增量(SI)=YT,20,季节因子与季节调整(续1),季节调整将季节变动从原序列中去除基本思路乘法模型:Y/S=TSI/S=TI加法模型:Y-S=TI季节变动程度根据各季节指数与其平均数(100%)的偏差程度来测定步骤计算移动平均值计算
8、移动平均值的比值,即季节比率季节指数调整,21,季节因子与季节调整(续2),例6-6我国民航客运量数据的季节调整原序列y时序图如下从图中易看出,序列存在季节变动,22,季节因子与季节调整(续3),对序列进行季节调整选择移动平均季节乘法(Ratio to moving average-Multiplicative)调整模型季节指数生成新序列ysa,Scaling Factors:1 0.870724 2 0.868800 3 0.958243 4 1.015363 5 1.070167 6 0.956283 7 1.061334 8 1.162563 9 1.043652 10 1.132652
9、 11 1.024219 12 0.888690,23,季节因子与季节调整(续4),结论由季节指数可知4-5月,7-11月季节指数大于1,则为我国民航客运旺季由经过季节调整的序列ysa的时序图可知调整后的序列已不包含季节变动比原序列表现出更加明显的非线性趋势,24,季节模型预测应用,预测模型若序列既有趋势变动又有季节变动,且趋势与季节为乘积形式,则预测模型为 其中,表示序列的趋势;是季节指数,25,季节模型预测应用(续1),例6-7续例6-6,对我国民航客运量进行预测经过季节调整的序列ysa已不包含季节变动由ysa的时序图可知,序列具有明显的非线性上升趋势考虑选择二次曲线和对数曲线作为趋势模型
10、,26,季节模型预测应用(续2),趋势方程 预测值序列为ysaf1模型的MAPE为3.15 预测值序列为ysaf2模型的MAPE为4.78,27,季节模型预测应用(续3),趋势模型的选择由序列ysa、ysaf1和ysaf2的时序图,结合两个模型的MAPE来看二次曲线趋势模型的误差小于对数曲线趋势模型则最终选择二次曲线趋势模型作为趋势方程,28,季节模型预测应用(续4),预测对1998年4月的民航客运量进行预测 即1998年4月不包含季节变动的预测值为451万人 即1998年4月包含季节变动的预测值为458万人,29,第四节 指数平滑法,一次指数平滑二次指数平滑多参数指数实例,30,一次指数平滑
11、,一次指数平滑又称单指数平滑(Single Exponential Smoothing)模型 其中 是实际值序列,是平滑值序列(Smoothed Series),是上期平滑值 是平滑系数(Smoothing Parameter),也称为衰减因子(Damping Factor)取值范围:,31,一次指数平滑(续1),展开(1)式 是实际序列(yt)历史数据的加权平均数权数 是一指数衰减数列则该方法被称为指数平滑法,32,一次指数平滑(续2),预测 其中,T是样本末期(最后一期)特点一次指数平滑的预测值,是实际值序列的加权平均,适用于较平稳的序列预测值主要倚重近期样本数据,远期数据对其影响较小(甚
12、至没有影响,这取决于平滑系数的取值)权数呈指数衰减,越早的数据被赋予的权数值越小,33,一次指数平滑(续3),特点优点方法简单能够追踪数据的变化,预测值总是反映最新的数据结构局限性预测值不能反映趋势变动、季节波动等有规律的变动,适用于平稳序列短期预测较灵敏,但不适合中长期预测由于预测值是历史数据的均值,则与实际序列的变化相比有滞后现象,34,一次指数平滑(续4),平滑系数的选取自动给定系统按照预测误差平方和最小原则自动确定最佳系数值如果系数值接近于1,说明该序列近似纯随机序列,则最新的观察值就是最理想的预测值用户自定序列变化较为平缓,宜取小些,如小于0.1序列变化较为剧烈,可取大些,如若取大于
13、0.5才能跟上序列变化,表明序列有很强的趋势,不能采用一次指数平滑法,35,二次指数平滑,二次指数平滑(double smoothed)又称双重指数平滑(double exponential smoothing)计算公式 其中,St 是一次指数平滑序列,Dt 是二次指数平滑序列,是平滑系数则二次指数平滑序列是在一次指数平滑的基础上对数据进一步进行平滑所生成的,36,二次指数平滑(续),预测公式 其中,T为样本末期该公式称为Brown单参数指数平滑线性预测公式所产生的预测值是截距为2St-Dt、斜率为(St-Dt)/(1-)的线性趋势当数据存在线性趋势时,采用二次指数平滑预测方法较好但这种趋势预
14、测实质上是一种“局部”趋势预测即该模型所反映的趋势总是最新数据的趋势,37,多参数指数,Holter-Winter非季节模型(Holter-Winter no seasonal)该模型有两个平滑系数和(0,1)预测模型 若t=T(最后一期),预测模型为 其中,at是截距,bt是斜率它们都是通过平滑值计算得到主要用于线性趋势预测,适于短期预测,38,多参数指数(续1),Holter-Winter季节乘积模型(Holter-Winter Multiplicative)模型有三个平滑系数预测模型 s是季节周期长度,月度数据,s=12;季度数据,s=4,39,多参数指数(续2),Holter-Wint
15、er季节乘积模型(Holter-Winter Multiplicative)(续)若t=T(最后一期),预测公式为 其中,at是截距,bt是斜率,ct是季节因子(季节指数)它们都是通过平滑值计算得到特点增加了季节项适合既有趋势,又有季节波动的数据主要反映近期数据的变化,适于短期预测,40,实例,例6-9上海股市连续1252天的日综合指数数据(序列名称y)如下,试用指数平滑法对其进行分析和预测选择二次指数平滑,平滑系数和序列名由系统自动确定本例共有1252期数据,选择1000-1247期进行平滑预测期为1248-1258期,41,实例(续1),平滑结果如下 ysm序列在1000-1247期(样本
16、数据范围)的取值是一步预测值(k=1),1248-1258期(预测期)是多步预测(k=1,2,3,),预测期内使用的预测公式 其中,T1247(样本末期),Parameters:Alpha0.5600Sum of Squared Residuals131147.0Root Mean Squared Error22.99605End of Period Levels:Mean1493.650 Trend-7.407554,42,实例(续2),预测效果如下图所示二次指数平滑法预测的趋势与趋势线显示的趋势完全不同前者更像数据序列的自然延伸二次指数平滑线性趋势代表短期趋势(局部的趋势变动,趋势线代表长
17、期趋势),43,实例(续3),例6-10续例6-6,研究民航客运量数据由序列y的时序图可看出,序列存在明显的趋势和季节变动,宜采用Holter-Winter季节乘积模型由于是月度数据,则s=12本例的数据范围是,预测期是,44,实例(续4),平滑结果如下,Parameters:Alpha 0.2799 Beta 0.1800 Gamma 0.0000Sum of Squared Residuals18645.32Root Mean Squared Error18.58181End of Period Levels:Mean 463.1769 Trend-1.124726 Seasonals:1
18、997:04 1.016967 1997:05 1.071791 1997:06 0.956262 1997:07 1.060333 1997:08 1.160151 1997:09 1.040053 1997:10 1.136984 1997:11 0.995506 1997:12 0.878413 1998:01 0.852556 1998:02 0.856651 1998:03 0.974331,45,实例(续5),预测效果如下图所示由图直观的可看出预测效果不错,46,时间序列的分类,平稳时序基本上不存在趋势的序列观察值基本上在某个固定的水平上随机波动虽然不同时段波动的程度不同但并不存在
19、某种规律非平稳时序包括趋势性、季节性或周期性的序列分类有趋势的序列复合型序列,47,时间序列的分类(续),48,构成要素,49,构成要素(续1),趋势(trend)时序在长时间内呈现出某种持续向上或持续下降的状态或规律由于某种固定性的因素作用于序列而形成分类:线形和非线性季节性(seasonal fluctuation)时序在一年内重复出现的周期性波动季节:广义,指任何一种周期性的变化,50,构成要素(续2),周期性(cyclical fluctuation)时序中呈现出的围绕长期趋势的一种波浪形或振荡式变动通常是由于商业和经济活动而引起即经济环境的变化引起特点不是朝着单一方向的持续运动,而是
20、涨落相间的交替波动(与趋势变动的区别)无固定规律,变动周期多在一年以上,且周期长短不一(与季节变动的区别),51,构成要素(续3),随机性(random)或不规则波动(irregular variations)时序中除去趋势、周期性和季节性之后的偶然性波动,52,常用的趋势模型,直线模型:指数曲线:幂函数曲线:对数曲线:,53,常用的趋势模型(续1),多项式:修正指数曲线:双曲线:Gompertz曲线:Logistic曲线:,54,常用的趋势模型(续2),上述模型之间可能产生进一步的组合指数曲线:Logistic曲线:其中,55,定性分析,指数曲线模型成立条件后一期与前一期之比为常数,即发展速度为常数实际现象的逐期增长率不可能严格等于某一常数,但常会围绕某一常数上下波动若分析对象具有上述特点,可以考虑采用指数模型,否则不适宜采用,56,定性分析(续),Logistic曲线最初用于研究生物种群发展规律假定种群的发展取决于两个因素,即种群的现有规模和环境(生存空间、光照、水、食物等)其中,环境是限制性因素在有限的环境中,种群不可能无限的增长,而是存在增长极限L用该曲线研究某一现象,则应弄清该现象是否在发展到一定规模后增长速度会逐步下降该现象是否存在增长极限等,