《第六章 时间序列分析模.doc》由会员分享,可在线阅读,更多相关《第六章 时间序列分析模.doc(71页珍藏版)》请在三一办公上搜索。
1、第六章 时间序列分析模型学习目标:熟悉随机过程及时间序列的概念与分类掌握ARIMA(p,d,q)(P,D,Q)S模型的识别、参数估计、诊断与预测方法掌握如何识别时间序列的单整、协整检验以及误差修正模型的建立掌握基于VAR模型分析的因果检验、脉冲响应分析、方差分解、协整检验与误差修正模型的建立第一节 ARMA模型中的基本概念一、随机过程与时间序列(一) 随机过程随机过程是以时间为标号的一组随机变量,其中为样本空间,而表示时间指标集合。显然对于固定的,就是一个随机变量,对于固定的,是时间的函数,称为样本的函数或实现,所有可能的实现构成了时间序列。实际上,由于时间的不可逆性,在实践中,一般只能得到一
2、个样本,我们就是在适当的假设下,利用这个样本进行分析,也就是进行时间序列分析。随机过程可以按照其两个维度是离散还是连续进行分类,如果时间是连续的,则称为连续型随机过程,如果取整数集合,则随机过程为离散型的。如果的取值是连续的,则随机过程是连续的,若的取值是离散的,则随机过程是离散型的。本章主要讨论为离散型的随机过程,同时把随机过程简记为或者。随机过程的概率结构通常被其联合分布所决定,称为维联合分布,定义其均值函数、方差函数和协方差函数如下:显然,这几个矩都是时间的函数,因而是未知的,如果不加以限制,则这样的参数就非常多,然而对每个固定时刻,我们只能得到一个实现值,因此必须对随机过程进行某种限制
3、,例如假设其为平稳的随机过程或者为近似独立过程等。(二) 平稳随机过程 一个随机过程被称为严平稳过程,如果其联合分布满足:由于严平稳采用了联合分布来定义,在实践中很难进行验证。另一种是从矩角度定义的弱平稳(宽平稳)过程,若均值函数、方差函数和协方差函数满足:即期望和方差与时间无关,而协方差只与时间间隔有关,弱平稳过程也称为二阶矩平稳过程。显然严平稳与弱平稳过程既有区别也有联系,如果严平稳过程具备上述矩条件,则也为宽平稳过程,而宽平稳过程一般不是严平稳过程弱。如果该过程的服从高斯分布时,严平稳过程与宽平稳过程等价。例6-1 白噪声过程(white noise),若随机过程满足:,该过程称为白噪声
4、过程,记为。显然该过程是零均值等方差且不相关的过程。如果进一步假设有,则为独立白噪声过程。特别地,如果假设,则该过程不但为宽平稳过程也是严平稳过程。例6-2 随机游走过程(random walk),若随机过程满足:其中为白噪声过程。显然我们有:,显然,随机游走过程不满足弱平稳条件,因此是非宽平稳过程。在接下来的分析中,我们只对弱平稳过程进行分析。二、理论自协方差、自相关函数与偏自相关函数(一)自协方差与自相关函数对于一个平稳过程来说,由于其协方差满足条件:由于是随机变量与其自身滞后期的协方差,因此也称为自协方差。同时该自协方差是时间间隔的函数,因此也称为自协方差函数。定义自相关函数为:显然有,
5、从而有,。因此我们通常只给出对应的自协方差函数和自相关函数即可。在以后的分析中,我们通常将自协方差或自相关函数排成一个矩阵形式,例如以自相关函数为例有:该矩阵为对称半正定的。(二)偏自相关函数上述的是度量随机变量与之间的相关程度,这种相关度量可能并不是“纯净的”,因为它可能受到随机变量的影响,我们需要消除这些随机变量的影响,由此计算的相关系数称为随机变量之间的偏自相关函数,记为。不失一般性,假设平稳过程的期望为0,可以证明,即为下列回归模型:中的回归系数。为了得到该回归系数,两边同乘以并取期望,然后再除以得到: (6.1.1)称此方程组为Yule-Walker方程,利用克莱姆法则有:例6-3
6、求白噪声过程的自协方差函数、自相关函数与偏自相关函数。 根据白噪声的构成,显然有,因此有,从而有。三、样本自协方差、自相关函数与偏自相关函数(一)样本自协方差、自相关函数上述的自协方差、自相关函数以及偏自相关函数一般是未知的,需要通过样本来估计,假设我们有一个样本为,为此定义如下几个估计量:样本均值: (6.1.2)样本自协方差函数: (6.1.3)或者 (6.1.4)样本自相关函数: (6.1.5)在后面的模型诊断中,我们经常需要检验理论自相关函数是否在某个阶如以后是否为零,或者检验拟合后的残差是否为白噪声过程,也就是要检验理论自相关函数是否为零,这需要通过样本自相关函数来进行,Bartle
7、tt(1964)证明,当样本容量较大时,近似服从,若认为理论自相关函数在阶以后有,则有,其中,实际计算中需要使用各个理论自相关函数的样本对应值进行替代。特别地,当检验序列是否为白噪声过程,则样本自相关函数的近似为正态分布,因此样本自相关函数落在之内,则我们认为理论自相关函数为零,对应的序列为白噪声过程。(二)样本偏自相关函数当我们获得样本自相关函数以后以后,根据Yule-Walker方程式(6.1.1)可以得到样本偏自相关函数。Quenouille(1949)指出,在原过程为白噪声时,样本偏自相关系数也近似服从,从而如果样本偏自相关系数落在之内,则我们认为理论自相关函数为零。在以后的模型识别中
8、,我们将利用这个结论识别模型的种类。四、ARMA模型(一)滞后算子与差分算子为了书写方便,我们先介绍两种算子,它们分别是滞后算子和差分算子,它们在差分运算中有着广泛的应用。称符号满足为滞后算子,而称符号满足为差分算子,显然一次差分运算有。例如进行二次差分有:有时我们需要进行高阶差分,特别是在季节性数据分析中,例如一个阶差分可以表示为滞后算子运算有下列性质:1.滞后算子作用于常数后仍为常数本身,即;2.滞后算子的运算满足分配律,即有;3. 滞后算子的运算满足结合律,即有;4.滞后算子的零次幂为1,即;5. 滞后算子的负整数次幂表示前移算子,即;6. 当时,(二)AR(p)模型如果随机过程的生成满
9、足: (6.1.6)其中,表示白噪声序列,称为阶自回归过程,简记为AR(p)。用滞后算子表示可以得到: 记,则AR(p)可以表示为。如果该过程是平稳的,则有:从而得到,从而有,重新带入上述表达式有:令,则,且有: (6.1.7)因此只要对进行中心化处理,就可以使用不带常数项的过程来表示,以后我们就用这种表达式。(三)MA(q)模型如果随机过程的生成表达式满足: (6.1.8)其中,表示白噪声序列,称为阶移动平均过程,简记为MA(q)。用滞后算子表示可以得到:记,则MA(q)可以表示为。一般来说,平稳过程都可以由上述移动平均过程来加以表示,这就是Wold定理所阐述的内容,该定理表明:任何协方差平
10、稳过程,都可以被表示为: (6.1.9)其中表示的期望。表示的线性确定性成分,如周期性成分、时间t的多项式和指数形式等。(四)ARMA模型更为一般的模型是把上述两种模型合并在一起,即随机过程的生成表达式满足: (6.1.10)其中、,表示白噪声序列,称为自回归移动平均过程,简记为ARMA(p,q)。用滞后算子表示为,其中和同上,且没有公因子。五 、差分方程解的理论与稳定性 (一)差分方程为了便于后续章节的分析,需要简单介绍差分方程的基本理论,我们只介绍常系数齐次线性差分方程解的理论与稳定性问题。称下列差分方程: (6.1.11)为常系数非齐次线性差分方程,如果,称为常系数齐次线性差分方程。(二
11、)常系数齐次线性差分方程解的理论 对应齐次差分方程的特征方程为: (6.1.12)这是个次线性方程,因此有个根,记为。根据这些根取值的不同,其解也有不同的形式,主要有:1. 为互异的实根:这时齐次差分方程的解可以表示为,其中为任意常数,通常需要通过一些初始条件来确定。2. 有相同的实根:不失一般性,假设为个相同的根,而为互不相同的根,则齐次差分的解可以表示为。3. 有复根:根据解的理论,一旦有复根出现,必定是以共轭形式成对出现,不妨假设:其中。假设为互不相同的实根,则齐次差分方程的解可以表示为。例6-4 设二阶齐次差分方程为,且有,求其解。根据该方程的形式得到特征方程为,得到特征根为,从而得到
12、通解为,带入两个初始条件得到最终解为。例6-5 设二阶齐次差分方程,求其解。该方程的特征方程为,容易判断出其有复根,两个特征根分别为,其模为,从而得到,因此该齐次差分方程的解为。例6-6 设二阶齐次差分方程,求其解。该方程的特征方程为,特征根为,因此该齐次差分方程的解为。(三)常系数齐次线性差分方程解的稳定性理论齐次线性差分方程解的稳定性要求差分方程对应的特征方程得到的特征根落在单位圆之内,即,如果是实根,则表示取绝对值,如果为复根,则表示取模运算。第二节 平稳ARMA模型的识别、参数估计、诊断与预测一、AR(p)模型的识别与偏自相关系数(一)AR(p)模型的格林函数与平稳性设平稳且均值为0的
13、AR(p)模型的表达式为 (6.2.1)或者记为。如果该模型可以表示成Wold形式,则一定是平稳的,则有:如果的根都在单位圆以外,则AR(p)模型可以表示为: (6.2.2)其中为格林(Green)函数,为的根的倒数,位于单位圆内。我们可以比较两边的系数而通过下列等式来求得格林函数: (6.2.3)从而可以得到:由此可得到初始的。当时有: (6.2.4)这显然是一个p阶差分方程,也可以利用滞后多项式表示为,因此根据差分方程解的理论,不失一般性,设差分方程有个互异的实根,则,由于各个根位于单位圆之内,因此当有。这样我们就把AR(p)模型表示为: (6.2.5)我们称这种表示为时间序列的传递表示形
14、式。(二)AR(p)模型的自相关函数式(6.2.1)两边同乘以,取期望并除以得到: (6.2.6)通过克莱姆法则可以求得初始的,当时有 (6.2.7)写成差分方程形式有,或者有。同样有,通过克莱姆法则得到的个初始值可以求得未知系数,从而可以得到所有自相关函数的通解。当为平稳模型时,所有的根都单位圆以内,从而自相关函数呈指数衰减方式(实根)或者是正弦衰减方式(复根)或者两者的叠加衰减方式(实根和复根),即当有。我们称其自相关函数具有拖尾性。例6-7 求AR(1) 模型的自相关函数。两边分别乘以、取期望并除以得到、。类似得到。因此AR(1) 模型的平稳性要求,如果,则自相关函数始终正向衰减到0,如
15、果,则自相关函数正负交错衰减到0,且越接近0衰减越快。例6-8 求AR(2) 模型的自相关函数。类似AR(p)模型的操作有得到。对于超过2阶的自相关函数可以使用差分方程理论得到,其结果为: (6.2.8)其中、可以由和来确定。 另外根据平稳性要求,容易得到AR(2) 模型平稳时系数应该满足的充要条件为: (6.2.9)(三)AR(p)模型的偏自相关函数先考察AR(1)模型的偏自相关函数,根据式(6.1.1)有: (6.2.10)从而得到,类似有。接下来考察AR(2) 过程 的偏自相关函数,根据式(6.2.10)经过计算有:,类似有。 不难发现,对于AR(1)模型来说,在计算时,发现其分子行列式
16、中第二列是第一列的倍数,因而为0。对于AR(2)模型来说,在计算时,发现其分子行列式中第三列是第一列和第二列的线性组合,因而为0。它们的偏自相关函数分别在1阶和2阶以后为0,称之为偏自相关函数的截尾性。对于一般的AR(p)模型而言,其偏自相关函数具有p步截尾性,实际上,根据偏自相关函数的定义,如果计算,则它是在扣除影响之后与的相关系数。显然当扣除之后为,显然与不相关,所以偏自相关函数自然为0。(四)AR(p)模型的识别根据以上分析,我们得到,平稳AR(p)模型的理论自相关函数呈现衰减形式靠近0,但始终不为0,呈现拖尾特征,而其理论偏自相关函数在p步以后为0,呈现截尾特征,这就是识别AR(p)模
17、型的理论依据所在。当然在实际识别时,我们通常依据样本偏自相关函数来进行,其样本偏自相关函数不会呈现出明显的截尾特征,因此需要使用前面介绍的理论检验在p步以后的偏自相关函数是否为0的检验。二、MA(q)模型的识别与自相关系数(一)MA(q)模型的自相关函数对于MA(q)模型而言,两边同乘以,并取期望得到: (6.2.11)另外有,因此对于MA(q)模型来说,始终满足平稳性要求,这点也可以从Wold定理得到。再根据自相关函数的定义有: (6.2.12)根据该公式,容易得到MA(1)模型的自相关函数为: (6.2.13)类似得到MA(2)模型的自相关函数为: (6.2.14)因此可以得到,对于MA(
18、q)模型来说,其自相关函数在q步以后为0,称为截尾性。(二)MA(q)模型的可逆性与偏自相关函数与AR(p)模型平稳性相对应的是MA(q)模型的可逆性。所谓MA(q)模型的可逆性是指能够将MA(q)模型表示成AR()形式,为了看清楚这个问题,我们首先看MA(1)模型的可逆性条件。 (6.2.15)上式成立的条件是,或者说的根在单位圆之外。称为逆函数。类似地得到MA(q)模型的可逆性条件是的根在单位圆之外,记这些根的倒数分别为,则有: (6.2.16)其中。我们也可以通过比较及其滞后期的系数来得到: (6.2.17)从而有:因此可以得到初始的。当时有: (6.2.18)这显然时一个q阶差分方程,
19、因此有。这样我们也可以把时间序列MA(q)模型表示为: (6.2.19)我们称这种表示方式为时间序列的逆转形式。既然一个可逆的MA(q)模型可以表示为AR()形式,因此根据AR(p)模型偏自相关函数的特点,MA(q)模型的偏自相关函数是拖尾的。例如计算表明MA(1)的偏自相关函数为: (6.2.20)(三)MA(q)模型的识别由上介绍可知,MA(q)模型的理论自相关函数在q步以后呈现截尾性质,而理论偏自相关函数呈现拖尾性质,因此可以根据这点来识别序列是否是MA(q)模型。当然在利用样本资料进行识别时,还需要利用前面的理论对样本自相关函数是否在某步以后截尾进行检验。三、ARMA(p,q)模型的识
20、别与拓展自相关函数(ESACF)(一)ARMA(p,q)模型的拓展样本自相关函数对于平稳且可逆的ARMA(p,q)模型来说,可以表示为: 或 (6.2.21)前者表明其自相关函数是拖尾的,而后者表明其偏自相关函数也是拖尾的,虽然可以利用这点来区分AR(p)模型和MA(q)模型,但对于其阶数p、q却难以确定,有鉴于此,Tsay和Tiao(1984)提出了一般的迭代回归方法,并使用扩展样本自相关函数(ESACFExtended Sample Autocorrelation Function)来估计模型的阶数。该方法认为,如果时间序列是ARMA(p,q)模型,那么用AR(p)模型来拟合,则由此得到自
21、回归系数的估计量是不一致的,为此必须将回归得到的残差作为一个解释变量引入到模型中,这个过程一直进行下去,直到进行第q次,估计模型为: (6.2.22)此时的估计量将是一致估计量。基于这个思想,设,令是使用AR(m)模型第j次迭代自回归系数的估计值,则定义为下列模型的样本自相关函数:这就是所谓的扩展样本自相关函数。Tsay和Tiao(1984)证明表明,对于ARMA(p,q)模型,有下面的概率收敛关系:利用ESACF来确定模型的阶数方法为,将m从0开始依次递增1按行排列,将j从0开始依次递增1按列排列,它们分别对应模型的自回归阶数和移动平均项阶数,例如ARMA(1,1)模型的理论ESCAF可以表
22、示为表6-1。其中X表示非零数。该ESACF的分布特点是以(1,1)位置为顶点所有的0构成了一个三角形,因此对于一般的ARMA(p,q)而言,其0构成的顶点位置位于(p,q),这就是该方法识别模型阶数的规律。当然实际上样本的计算结果必须进行显著性检验,有的软件如SAS9.1在利用该方法时输出两张表,一个是ESACF的估计表,另一个是对应的显著性检验概率表。表 6-1 ARMA(1,1)模型的理论ESCAF MAAR0123.0XXXX.1X000.2XX00.3XXX0.(二)ARMA(p,q)模型的识别根据上述分析,ARMA(p,q)模型具有的特点是自相关函数和偏自相关函数都是拖尾的,而其扩
23、展样本自相关函数将以其阶数(p,q) 为顶点所有的0构成了一个三角形。当使用样本数据进行计算时,还需要进行适当的检验,以确定其零点所在位置。四、ARMA(p,q)模型的参数估计 ARMA(p,q)模型的参数估计有多种方法,本节主要介绍矩估计、条件极大似然估计和精确极大似然估计三种方法。(一)矩估计 矩估计的原理比较简单,利用样本矩替代总体矩建立等式,从而得到参数的估计。1AR(p)模型的矩估计对于AR(p)模型,在方程两边同乘以有: (6.2.23)在方程两边利用样本数据得到样本自相关函数,根据克莱姆法则,从而可以得到 (6.2.24)另外还有。例如AR(1)模型中的参数估计为,。2MA(q)
24、模型的矩估计 在前面的分析中,我们已经得到了MA(q)模型的样本自协方差函数,利用样本资料得到其估计,从而有: (6.2.25)由q+1个等式可以解出q+1个未知参数以及,由于为非线性方程组,故一般可用迭代法求解。但对于低阶的模型可以直接求解,例如MA(1)模型参数的矩估计为: (6.2.26)由于有两个估计值,一般取满足可逆性的估计结果。3ARMA(p,q)模型的矩估计在ARMA(p,q)模型中共有个p+q+1待估参数;,各估计量计算步骤及公式如下:(1)估计:计算公式为: (6.2.27)其中,是由样本观测数据所计算出的自相关函数估计值,即样本自相关系数。(2)改写模型,求;的估计值:将模
25、型改写为:令则上式化为: (6.2.28)构成一个MA(q)模型,参数;为待估参数。则可按照上述MA(q)模型的参数估计方法进行估计。例如对于ARMA(1,1)模型,参数的矩估计计算公式为:, (6.2.29)矩估计比较通俗易懂,但其精度不够高,往往作为其他方法如极大似然估计的初始值来进行迭代使用。(二)极大似然估计1AR(p) 条件极大似然函数对于一般的AR(p)过程:假设,此时所要估计的总体参数向量记为。设我们获得了个来自过程的样本,假设前个样本表示为:可以将这个向量当作维Gauss向量的一个样本。这个向量的均值表示为,它的每个分量都是:假设是的协方差矩阵,则有:对于一阶自回归过程而言()
26、,上述矩阵是一个标量;对于阶自回归而言:这里是过程的第个自协方差,可以按照以前的介绍公式计算。由于自回归过程的条件相依性具有截断性质,因此我们将样本分为p个一组,样本中前个观测值的联合概率分布为,密度函数为:对于剩余的样本,我们可以使用条件分布来进行计算,当时有:因此整个样本的似然函数为:则对数似然函数形式为:例如对过程而言有:可以计算行列式值为:并且有:因此,对于具有正态分布条件下的过程,精确的对数似然函数为:其中。2MA(q)模型的精确似然函数与过程不同的是,MA(q)模型中以白噪声及其滞后为解释变量,假设中的白噪声服从独立的正态分布,并且已有样本,记,则似然函数为:其中,进一步的计算需要
27、使用卡尔曼滤波方法或者协方差矩阵的三角分解方法,读者可以参考相关文献,这里不作介绍。3ARMA(p,q)模型的精确似然函数ARMA(p,q)模型的精确似然函数的构造非常麻烦,需要使用回测方法,Box、Jenkins 和Reinsel(1994)建议使用下列的对数似然函数:其中是无条件平方和函数,计算公式为:(三)条件极大似然估计与条件最小二乘法1AR(p) 条件极大似然估计与条件最小二乘法由于精确极大似然估计函数形式比较复杂,因此对过程的精确极大化必须使用数值算法。与此对应,以前个样本为条件的对数似然函数具有下述简单形式:注意到,极大化上式的参数与极小化下式的参数选择是一致的:因此这些参数的条
28、件极大似然估计是基于常数和自身滞后值的普通最小二乘回归估计,的条件极大似然估计是这个回归方程平方残差的平均值: (6.2.30)显然上述条件似然函数与确切似然函数相比,缺少了初始样本的母体分布,这样就降低了样本发生的似然性,这就是条件似然函数与确切似然函数的差异。2MA(q)模型的条件极大似然估计与条件最小二乘法假设以为初始条件,利用这些初始值,我们对时刻,利用下式进行迭代:令,则条件对数似然函数为:对的估计仍然等价于求最小,即为条件最小二乘法,但与AR(p)模型不同的是,这里需要采用迭代方法来求解。3ARMA(p,q)模型的条件极大似然估计与条件最小二乘法对于ARMA(p,q)模型其初始条件
29、不但涉及到自回归部分,也要涉及到移动平均部分,令,以此为条件,则误差序列可以通过,利用下式迭代获得:因此条件似然函数是:一种选择是将和的初值设定为它们的期望值,即:,然后对,进行上述的迭代计算。另外,Box and Jenkins (1976) 建议设定为零,但将设定为它们的真实数值。因此,对上式的迭代可以从时点开始,将选取为真实的样本观测值,选取初值,则对数条件似然函数可以计算为:通过迭代方法可以求解。五、模型诊断(一)残差白噪声检验当我们完成模型识别定阶和参数估计以后,需要对模型拟合的结果进行必要的检验。第一个检验就是残差是否为白噪声检验,这是由于在ARMA模型中假定是白噪声序列,如果模型
30、拟合充分,则残差表现出类似白噪声的特点,如不相关等,如果一旦拟合不充分,则残差必然含有待提取的信息,表现为存在一定程度的自相关。检验的原假设是直到滞后期不存在自相关,即原假设和备择假设分别为:检验统计量是由Ljung-Box给出的LB统计量,其公式为: (6.2.31)如果拒绝原假设,表明残差中还含有待提取信息,应该重新拟合模型,否则认为该模型拟合充分,作为候选模型进入下一轮检验。(二)模型参数显著性检验 参数显著性检验,就是检验模型中每一个未知参数是否显著非零,通过剔除一些不显著的参数,从而使得模型变得更为简洁。在较大样本和白噪声服从正态分布假设下,对各个参数是否为0的检验可以用通常的t检验
31、来进行,这里不再赘述。(三)模型的定阶 在建立模型时,有时候会遇到这样的情况,有好几个模型都通过上述的检验,那么我们究竟采用哪个作为最终的模型呢?这时需要采用信息量准则来确定模型的最优阶数,可以使用的信息量准则有Akaike(1973)提出的AIC指标,该指标基于极大似然估计和模型中含有估计参数的个数两个角度来度量,计算公式为: (6.2.32)其中如果模型中不含有均值项,如果含有均值项则有。该指标有一个缺陷在于对参数个数的惩罚和样本容量没有关系。为了弥补这个不足,Akaike(1976)年提出的BIC指标,Schwartz于1978年基于Bayes理论也得到了同样的准则,也称为SBC准则,计
32、算公式为: (6.2.33)的含义同指标中的解释相同。利用上述标准时,我们总是选择一个最小指标对应的模型作为我们最终的候选模型。六、模型预测(一)预测的一般公式与区间估计通过前面的分析,我们建立了合适的模型,然而建立模型的最终目标是为了预测,所谓预测就是利用时间序列现有的观测值来预测未来的值,包括点估计与区间估计。由于未来的不确定性,预测必然会产生误差,这就需要在一定的标准下给出预测公式,这个标准就是最小均方差预测准则(MSE)。假设我们现在有直到时刻的信息,即有,则在时刻向前预测步的结果记为,而其真实值为,预测误差记为,则由数理统计知识得到,在最小均方差预测准则下有: (6.2.34)因此,
33、当一个平稳模型可以表示为如下传递形式时:则有: (6.2.35) (6.2.36)当一个平稳模型可以表示为如下逆转形式时:则有: (6.2.37) (6.2.38)如果进一步假设时,则有: (6.2.39)从而得到区间预测估计公式为: (6.2.40)需要指出的时,无论对于哪种模型,预测的误差以及区间估计公式都可以采用公式(6.2.36)、(6.2.39)和(6.2.40)进行计算。(二)三种模型的点预测与区间估计1.AR(p)模型的预测假设AR(p)模型为,则有: (6.2.41)其中 (6.2.42)例6-9 假设某个超市的月销售额服从AR(2)模型(单位:万元/月):,再假设第一季度三个
34、月的销售量为101万元、96万元、97.2万元,试根据这些信息估计第二季度三个月销售量的点估计与95%的置信区间。根据题意,目前时刻为,且,需要预测,则根据预测公式有:为了得到区间估计结果,需要计算格林函数,根据式(6.2.3)和式(6.2.4)有:根据式(6.2.39)有:把上述结果带入区间估计公式得到第二季度三个月份销售额95%的区间估计结果分别为:2.MA (q)模型的预测假设MA(q)模型为,则有: (6.2.43)从而当预测步长时,预测值始终为期望,预测误差的方差都相同。例6-10 假设某个地区的常住人口近似服从MA(3)模型(单位:万人):,已知最近三年人口的实际人数和预测人数见表
35、6-2,试根据该资料预测最近5年的常住人口95%的区间估计。表6-2 人口数据 年份 实际值 预测值 2008年 104 110 2009年 108 100 2010年 105 109记2008年、2009年和2010年分别对应,则预测的时期对应,首先需要计算出如下:因此有:根据式(6.2.39)有:根据区间估计公式得到最近5年的常住人口预测数据如表6-3所示:表6-3 人口预测结果 年份 点估计值 预测下限 预测上限2011 109.2 99 1192012 96 83 1092013 100.8 87 1152014 100 86 1142015 100 86 1143.ARMA (p,q
36、)模型的预测 假设ARMA (p,q)模型为:则该模型有两个部分构成,预测公式为:, , 其中例6-11 已知ARMA(1,1)模型为:, 假设有,试预测未来3期的95%区间估计结果。根据区间估计公式有:为了得到区间估计公式,首先计算格林函数,根据定义有:再根据式(6.2.39)有:最后根据区间估计公式得到95%的置信区间如表6-4所示:表6-4 预测结果 时期 点估计值 预测下限 预测上限6 0.234 0.136 0.3327 0.1872 0.087 0.2878 0.14976 -0.049 0.251第三节 模型 在前面的分析中,我们都假设所分析的时间序列是平稳的,并在此基础上完成模
37、型的识别、参数估计、诊断检验以及预测,但现实中许多时间序列数据经常表现为具有某种趋势,如线性趋势和曲线趋势,趋势的出现使得时间序列不再平稳,因此有必要对时间序列进行适当的处理,使之变为平稳。另外,有的以月度、季度、年为度量周期的时间序列数据往往表现出某种季节变动形式,这种季节变动形式也可能导致时间序列非平稳,同时在建立模型时也需要考虑反映这种变动模式的结构,这就是更为一般的模型,其中为实现序列平稳而需要进行的普通差分次数,为需要进行季节差分的次数, 、分别是非季节性的自回归和移动平均模型阶数, 、为刻画季节因素对应的自回归和移动平均模型阶数,为季节成分的周期,一般为季度数据为4,年度数据为12
38、。一、非平稳模型的识别与处理(一)非平稳模型的识别由于受到现象内在规律性或季节因素的影响,时间序列经常呈现出某种趋势,从而不满足平稳性建模要求。识别平稳性的方法有多种,第一种是作出序列的随时间发展变动的趋势图,如果时序图围绕某个数上下做等幅波动,则可以初步判断该序列是平稳的,反之,如果表现出明显的趋势,则一定是非平稳的。第二种方法是根据样本自相关函数和样本偏自相关函数来判断,根据前面分析的结论知道,平稳时间序列的样本自相关函数以较快的速度衰减到零,如果某个序列的样本自相关函数呈现缓慢衰减趋势,而且样本偏自相关函数在1步以后表现出明显的截尾特征,则说明该序列是非平稳的,需要进行差分处理。第三种方
39、法进行单位根检验,这将在第四节介绍。下面图6-1是某棉纺厂1974到2009年的纺纱产量的时序图,从图形看,该序列明显呈图6-1 某棉纺厂1974-2009年纺纱产量时序图图6-2 纺纱产量的样本自相关函数与偏自相关函数现出向上发展的趋势,因此是非平稳序列。接下来计算其自相关函数和偏自相关函数结果见图6-2所示,显然该序列样本自相关函数(AC)呈缓慢衰减趋势,特别地样本偏自相关函数(PAC)在滞后1期以后具有明显的截尾特征,因此也符合非平稳的要求。(二)非平稳模型的平稳化与建模如果某个时间序列一旦被判定为非平稳的,接下来的工作就要采取措施使其平稳化,差分是一种常用的方法。一般而言,当一个序列呈
40、现出线性趋势时,一次一阶普通差分就可以实现非平稳序列平稳化;当一个序列呈现出二次趋势时,二次一阶普通差分就可以实现平稳化。实践中的时间序列一般平稳化的差分次数很少超过2次。当经过适当差分后,序列满足平稳条件,以前介绍的关于平稳模型的一系列操作即可应用到差分后的序列中,因此我们可以建立如下较为一般的ARIMA(p,d,q)模型: (6.3.1)或简记为: (6.3.2)其中,。如果令: (6.3.4)则现在的模型就是: (6.3.5)所有对平稳模型进行的操作也可以直接应用到这里,下面仅介绍ARIMA(p,d,q)模型的预测公式。记ARIMA(p,d,q)的传递形式为: (6.3.6)从而通过比较
41、的系数得到等式: (6.3.7)令,展开上述等式有:其中。在MSE预测标准下预测公式为: (6.3.8)预测误差为: (6.3.9)在白噪声时,预测误差的方差为: (6.3.10)因此可以应用以前的区间估计公式进行估计。例6-12 已知ARIMA(1,1,1)模型为,且,求的95%的置信区间估计。首先将原模型展开成如下的等价形式:则预测结果为:根据得到格林函数,从而有:最终得到的95%的置信区间估计为(1.63,9.75)。例6-13 试建立上述纺纱产量合适的ARIMA(p,d,q)模型。首先对该序列进行一次差分,并计算差分后的样本自相关函数与偏自相关函数如图6-3图6-3 纺纱产量一阶差分后
42、的自相关函数与偏自相关函数所示。显然,样本自相关函数已经迅速收尾,表明一次差分后的序列为平稳序列。另外差分后序列的白噪声检验表明,Prob对应的概率都大于显著性水平0.05,说明该序列是一个白噪声序列,因此没有必要对差分后的序列的随机部分建立ARMA模型,考虑到差分后序列的均值非零,可以考虑估计差分后的均值,为此在Eviews命令框中输入以下命令:LS D(X) C ,可以得到均值估计为13.4286,因此最终模型为:例6-14 下图是某地区1972-2008年农业实际国民收入指数的时序图,试建立合适的模型。图6-4 某地区农业实际国民收入指数的时序图从图形上来看,该序列显然具有向上发展的趋势,因此是非平稳的,样本自相关函数图和偏自相关图(省略)也显示了这点。为此对其进行一阶普通差分,差分后的样本自相关函数图和偏自相关图如图6-5所示。图6-5 一阶差分后的样本自相关和偏自相关函数图显然该图表明,一阶普通差分后的序列的样本自相关函数迅速收尾,因而是平稳的,但白噪声检验表明,差分后的序列存在自相关,需要建立合适的模型。由于自相关函数具有1步截尾性,而偏自相关函数具有拖尾性(相对),所以可以考虑建立MA(1)模型,在命令窗口输入:LS D(X) C MA(1)得到估计结果见图6-6。图6-6 一阶差分后的参数估计结果其中。因此适合某地区农业