《[论文]随机线性模型建模——历油价预测模型.doc》由会员分享,可在线阅读,更多相关《[论文]随机线性模型建模——历油价预测模型.doc(10页珍藏版)》请在三一办公上搜索。
1、 课程设计(论文)课程名称: 应用随机过程 设计题目: 建 模 院 系: 电子与信息工程学院 班 级: 通信一班 设 计 者: 学 号: 指导教师: 设计时间: 2009-9至2009-12 课程设计任务书 姓 名: 吴华明 院 (系):电子与信息技术研究院 专 业: 信息与通信工程 班 号:09硕通信一班 任务起至日期: 2009 年 9 月 11 日至 2009 年 12 月 20 日 课程设计题目: 随机线性模型建模历年油价预测模型 历年油价预测模型 已知技术参数和设计要求: 已知一段时间内全球的原油价格,建立油价的随机线性模型,并对未来时刻的全球油价进行预测。 工作量:1. 查找相应的
2、资料,对随机线性模型的建模过程进行熟悉。2. 查找相关的历年油价的数据,并对数据进行预处理。3. 由已知的样本函数,计算随机线性模型的参数。4. 对随机线性模型的阶数进行判定。5. 建立预测方程,并对未来时刻的全球油价进行预测。 工作计划安排:1. 2009-92009-10:对随机线性模型建模的方法进行学习2. 2009-102009-11:查找相关的资料,确定建模的数据3. 2009-12:建立随机线性模型,并进行预测 同组设计者及分工:无 指导教师签字_ 年 月 日 教研室主任意见: 教研室主任签字_ 年 月 日*注:此任务书由课程设计指导教师填写。随机线性模型建模-历年油价预测模型摘要
3、:本文主要就序列进行了综合分析,并根据实测的95个数据,通过模型判别和参数估计等手段建立了AR预测模型,并利用该模型对序列下一时刻的值进行了预报。关键词:随机过程 线性模型 自相关函数 偏相关函数 预测一线性模型的建立:确定平稳时间序列线性模型的步骤可归纳为五个步骤,以下结合本文的数据具体介绍建模的过程:1.数据选择本次建模,本人采用的数据是历年油价(见表1,共有95个数据)。本文将利用表中的数据建立油价的随机线性模型,并对t=96100时段的油价进行预测。表1 历年油价时间序列(单位:美元/桶)tYttYttYttYttYt119.59002115.54004121.31006113.000
4、08116.8700214.91002221.94004218.84006211.90008216.1300315.74002323.11004324.84006311.79008315.7600415.40002418.64004415.67006412.55008415.6600513.06002514.94004515.57006511.84008515.5400619.07002616.90004612.73006611.25008615.3000715.28002715.46004713.56006711.15008715.0500815.82002811.15004815.5400
5、6810.99008814.6900912.77002913.13004917.22006911.70008914.39001012.05003012.48005012.14007014.01009014.18001111.69003112.95005111.07007117.51009113.70001213.85003212.59005212.02007217.27009213.66001313.85003310.58005311.55007316.90009313.27001410.07003410.5800546.92007415.79009413.5600159.17003512.3
6、9005510.33007515.45009513.14001610.79003615.5300568.3800766.240096-1713.44003713.06005712.11007716.710097-1821.17003810.22005811.46007816.770098-1918.64003916.33005912.75007916.640099-2013.21004019.72006013.32008017.8000100 -表2 经过差分运算的时间序列Zt和均值为零的时间序列ttZtttZtttZtt15.51005.4642331.81001.7642650.49000
7、.44422-1.1700-1.2158341.33001.284266-0.0600-0.10583-2.0000-2.045835-5.6100-5.6558670.87000.824248.35008.304236-0.3700-0.4158681.60001.55425-9.8000-9.8458378.95008.9042691.19001.144264.33004.284238-2.7200-2.765870-3.7400-3.78587-3.5900-3.635839-1.8000-1.845871-0.1300-0.175882.33002.284240-4.0600-4.10
8、5872-0.7400-0.785890.36000.3142418.47008.4242730.77000.7242102.52002.474242-15.1700-15.215874-8.8700-8.915811-2.1600-2.2058439.07009.02427519.680019.634212-3.7800-3.825844-2.7400-2.785876-10.4100-10.4558132.88002.8342453.67003.624277-0.1900-0.2358142.52002.4742461.15001.1042781.29001.2442151.03000.9
9、84247-0.3000-0.345879-2.0900-2.1358165.08005.034248-6.7600-6.8058800.19000.144217-10.2600-10.3058494.01003.9642810.37000.324218-2.9000-2.9458502.02001.9742820.27000.2242197.76007.714251-1.4200-1.465883-0.0200-0.0658204.07004.024252-4.1600-4.205884-0.1200-0.165821-5.2300-5.2758538.04007.994285-0.0100
10、-0.055822-5.6400-5.685854-5.3600-5.405886-0.1100-0.1558230.77000.7242555.68005.6342870.06000.0142245.66005.614256-4.3800-4.4258880.09000.044225-3.4000-3.4458571.94001.894289-0.2700-0.315826-2.8700-2.915858-0.7200-0.7658900.44000.3942276.29006.244259-0.8900-0.935891-0.3500-0.395828-2.6300-2.675860-0.
11、7800-0.8258920.68000.6342291.12001.0742610.99000.944293-0.7100-0.755830-0.8300-0.8758620.87000.824294-31-1.6500-1.695863-1.4700-1.515895-322.01001.9642640.12000.074296-2.数据预先处理:该原始时间序列具有不平稳性,采用进行两次差分运算的方法消除趋势性,Zt=(Yt+2- Yt+1)-(Yt+1- Yt),得到新的时间序列Zt,如表2所示,并画出处理前后的图形,如图1所示,可见基本符合平稳随机序列的特征。图1两次差分运算后和原数据
12、的对比图为了方便数据的处理和分析,期望得到均值为零的时间序列的样本序列,利用已知的样本值来计算样本的均值,并做变换= Zt , t = 1,2,3,93,得n个数据,n=93。其中:=0.0458新样本 , t=1,2, 3,93如表2中栏所示。其图像如图2所示,可见处理后的序列取值在0上下波动。图2均值为零的时间序列的波形3.样本自协方差函数、自相关函数、偏相关函数的计算:在计算样本自协方差函数,样本自相关函数,偏相关函数时,一般取。在本文中取。l 样本自协方差: 其中 n=93, K=20。从而得到的相应数值,如下表所示:表3 和的数值kkk022.09371.00007-1.4630-0
13、.0662143.00380.13601-11.9023-0.538780.27940.012615-4.1173-0.186421.15990.05259-0.3239-0.0147161.03610.04693-2.2656-0.1025102.48630.1125170.13180.006043.37710.152911-4.2622-0.1929182.18430.09895-2.2179-0.1004122.86230.129619-2.3601-0.106861.93830.087713-1.1400-0.0516201.17900.0534l 样本自相关函数:将求得的自协方差函数
14、带入式子:,k=0,1,2,中,得到与相对应的的数值同样见表3,并绘出相应的样本自相关函数的曲线如图3所示。图3 样本自相关函数l 样本偏相关函数:为求出样本的偏相关函数,需要求解如下的Yule-Walker方程: 得,当k分别取1,2,3,K时,求出如表4所示(设=1)。表4 样本偏相关函数的值kkkk01.00006-0.110912-0.0567180.02811-0.53877-0.084813-0.076719-0.00422-0.33498-0.0967140.1172200.03433-0.38919-0.1000150.03374-0.2087100.082116-0.0755
15、5-0.228811-0.102217-0.0793为了便于分析与比较,同样画出的曲线,见图4.图4 样本偏相关函数图4.模型识别:由图3、4或表3、4可以看出样本自相关函数与偏相关函数的取值具有如下特点:l 样本自相关函数拖尾:根据样本自相关函数的点图(图3)可见,当逐渐增大时,越变越小,故可判断具有拖尾性。l 样本偏相关函数截尾:当时,平均个中至多有一个使,则认为截尾在k=p=5处。综上,可以判断本模型为AR(5)模型。5.参数估计:对于AR(5)模型计算参数估计值,采用矩估计的方法,具体公式如下: 其中p=5。将表3中的已知数据值带入上式可得:从而可得AR(5)模型为:,取t=k+l。在
16、上式两边分别取估计值并带入具体数值,整理得此AR(5)模型的预报公式为: ,当k+l-in时,有。二模型预测 由前面得到的AR(5)模型的预报公式可对以后几个时段的该地地震等级的值进行预测。利用Z89, Z90, Z91, Z92, Z93可得下几个时段油价的预测值:=0.4294=-0.0602=0.1945=-0.1160= 0.1636又因为Zt是由Yt经过两次差分得到的,即Zt=(Yt+2- Yt+1)-(Yt+1- Yt)得Yt=Zt-2+2Yt-1- Yt-2,所以Y96=0.4294+2*13.1400-13.5600=13.1494 Y97=-0.0602+2*13.1494-
17、13.1400=13.0986 Y98=0.1945+2*13.0986-13.1494=13.2423 Y99=-0.1160+2*13.2423-13.0986=13.2700Y100= 0.1636+2*13.2700-13.2423=13.4613三.模型评价本文运用了随机过程的相关知识,通过建立了历年油价的随机线性模型,较好地实践了随机线性模型的建立以及预报这一数学过程。当然,由于掌握的资料广度和本人的知识水平的限制,只能根据本文的数据进行分析,模型还比较粗糙,该模型还可以通过其它的估计方法进行进一步的完善四非线性模型分析在现实生活中更多的模型并不能很好的符合线性模型,这就需要引入非
18、线性模型的概念。比如金融时间序列通常经历夹杂着动荡突发的漫长平静期,这种形式的相关性自然地导致了对能够拟合这种波动性的非线性随机过程的考虑。但由于非线性问题的复杂性,非线性估计难度较大,传统的估计方法存在着一定的缺陷。非线性估计领域的经典方法是 EKF(Extended Kalman Filtering),但EKF本质上是一种粗糙的方法,计算复杂、滤波不稳定。自EKF提出的近三十年间,众多学者尝试各种方法对非线性估计问题进行了深入的研究,提出了不少新方法、新思路。建立非线性模型常采用的方法是:在以提出的非线性模型中挑选进行拟合,如果拟合效果好,则采用。就其实质而言,非线性估计的核心在于近似,当
19、今各种非线性估计方法的不同在于其做近似处理的思想和实现手段的差异上。近似的本质就是对难以计算的非线性模型施加某种数学变换,变换成线性模型,然后用Bayes估计原理进行估计。这就是非线性估计理论的基本思想。参考文献1田波平等;应用随机过程讲义;数学系;20052George E. P. Box, Gwilym M. Jenkins, Gregory C. Reinsel;顾岚等译;时间序列分析预测与控制;中国统计出版社;19993 安鸿志;时间序列分析;华东师范大学出版社;19924谢衷洁;时间序列分析;北京大学出版社;19905杨位钦,顾岚; 时间序列分析与动态数据建模;北京理工大学出版社;1988