《关于沪深300指数的波动趋势研究数学建模论文.doc》由会员分享,可在线阅读,更多相关《关于沪深300指数的波动趋势研究数学建模论文.doc(21页珍藏版)》请在三一办公上搜索。
1、2011高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名
2、号的话): 所属学校(请填写完整的全名): 广东金融学院 参赛队员 (打印并签名) :1. 曾彬 2. 曾庆达 3. 陈佳玲 指导教师或指导教师组负责人 (打印并签名): 日期: 2013 年 8 月 19日赛区评阅编号(由赛区组委会评阅前进行编号):2013高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):关于沪深300指数的波动趋势研究摘 要 本文从沪深300指数2011.8.1-2013.8.2每日每时刻的指数
3、数据出发,针对每日指数波动方式、未来趋势预测、交易模型、模型评价,分别利用聚类分析、灰色系统理论模型、动量交易模型做出建模分析。 首先,本文用EXCEL对原始数据进行整理,整理出每日指数随时刻波动的矩阵数据;再用matlab的cluster函数对其进行聚类分析。得出结果表明两年每日的波动方式大致可分为平缓、微小波动、剧烈波动三种指数波动方式,并且将其用于指导第二题指数未来趋势分析 其次,为了减少随机事件对沪深300指数的影响,本文建立了GM(1,1)灰色预测模型,运用线性最小二乘法对其进行拟合,对2012全年月份均值进行拟合,对2013一月到八月份的月均值进行预测,同时还用2012年度月均值以
4、及2013前八个月的月均值进行误差检验。结果表明,此模型的精度较高,适合做中长期预测。 然后,从行为金融学的视觉出发,结合动量效应,建立期货交易数学模型。并对所建立的数学模型进行验证,发现运用此模型在两年交易中获得了较 高的收益率,实际价值高。最后,从平均收益率,平均亏损率、综合风险指数三个指标建立综合评价指标体系,并对问题三所建的模型进行评价,指出问题三所建模型的长处及缺陷,并就改进提出意见。 关键词: 聚类分析 灰色预测模型 动量交易模型 行为金融学 一、问题重述1.1问题背景 随着我国金融市场的进一步开发,股指期货(亦称期指)这一金融衍生工具也于2010年4月进入了交易市场.期指是一种以
5、股价指数为标的物的标准化期货合约,具有价格发现、风险管理、杠杆投资等多种功能,是一种高风险、高利润率的金融创新工具.在期指投资中,由于存在保证金制度和逐日结算制度,因而风险控制是尤为重要的.如果能有效预测其标的指数的变动,便可根据其涨跌趋势建仓,有效规避风险的同时获取尽可能多的利润.1.2问题提出请根据数据分析以下问题:(1) 通过数据分析,对沪深300指数的波动方式进行简单的分类,你的分类应该有利于后续问题的解答。波动方式可以是日内短期波动规律,也可以是以天为单位的波动规律,可自由设定;(2) 根据前面已有的历史数据,对指数后期的走势做出预测,并和实际数据相比较确定你的预测方法的优劣。这里既
6、可以是短期的日内预测,也可以是长期走势的预测。例如:你可以根据2012年7月24日10点55分以前的数据,对当日10点55分至11点20分的走势做出预测;(3)设沪深300指数每点是300元,交易手续费是交易额的万分之一(双向收取),保证金为交易额的10%,初始资金为20万。请利用前面已经得到的相关结果,建立交易模型,使在二年内的收益最大。注意:不能使用未来数据,如你在2012年7月24日10点55分是进行“买入指数”还是“卖出指数”或者是不交易的决策时,你不能利用2012年7月24日10点55分以后的任何数据;(4) 试分析确定合理的评价指标体系,用以评价你的交易模型的优劣。二、基本假设2.
7、1所有的数据都是真是可靠的;2.2市场高度有效;2.3经济人理性 2.4假设初始资金一直为20万,且当保证金低于20万及时补足。三、符号说明及名词解释3.1基本符号avg开盘价与.0收盘价的算术平均值(k)第k个月指数均值(2012年起,设一月对应K=1)的一阶累加,其中,=的紧邻均值,=-a参数,灰色模型发展系数b参数,灰色作用量残差相对误差S1方差,S2误差方差,C均方差比,p(k)滑准性指标,表1四、问题分析4.1问题一问题一要求我们通过对沪深300指数2011.8.1-2013.8.2接近2年的数据进行分析,对其波动方式进行简单分类。因为每个样本都是某日某时刻的指数数据,如果以日为单位
8、必定需要求出其一日的均值,再分析其变化,但这样构造的均值累积起来就会掩盖每日的波动。基于此理由,我们选择从日内分析的角度的角度,把每日48个时刻点指数的变化、进行分类。运用MATLAB 函数cluster对2年每日的指数变化进行聚类。至于数据的选择,因为每时刻有4个指标,为了概括开盘价、最高价、最低价、收盘价四个这指标的状况,我们用最高价与最低价的平均值来作为代表指标。这样取值比起求出每日的均值,更接近样本的实际面貌。4.2问题二问题二要求我们运用已有的历史数据对指数的后期进行预测,并与实际值比较评价模型的优劣。传统上的金融时间序列方法可以用于股票指数、金融资产价格之类的经济数据例如ARMA模
9、型、改善的ARMA模型。但股指期货作为一种新上市的金融产品,至今交易3年左右的时间。而我们得到的样本前后不过400余个交易日 ,难以采用ARMA模型等建立在传统参数统计方法上的分析手段,因为后者所要求的是大样本,以及充足且符合一定分布特征的数据,通过研究影响序列的各种扰动因素来计算预测值. 鉴于沪深300指数上市时间尚短,已有交易数据并不充分相关信息难以深度挖掘,本文采用适用于以“信息不充分”为对象的灰色系统理论进行预测。首先我们选取2012年全年每日48时刻的数据作为原始数据,求出每月开盘价均值、收盘价均值、开盘价与收盘价的均值的均值,用于灰色模型进行模拟,用模拟出来的2012年每月平均值来
10、与原来月均值对比,评价模型的可行性。再尝试预测2013年前8个月的指数趋势,并与实际历史数据对比。4.3问题三本节从行为金融学的视角,探讨了动量效应在趋势交易技术中的应用。对在未使用未来数据的情况下,建立交易模型,使其在两年内的收益最大。 Barberis、Shleiffer、Vishny(1998)认为保守性偏差导致投资者对新信息的反应不足,使得股价在短期表现出惯性,但以偏概全倾向导致投资者对新信息的反应过度,结果导致股价出现反转。根据前人的总结,惯性周期一般表现为68期。在本文中选择了8期进行分析。 为了简化模型,我们用开盘价作为参考涨跌幅的标准,8期内的涨幅超过17点即认为大幅上涨,8期
11、内的跌幅超过17点即认为大幅下跌。操作所有的资金都是一次投完,一次收取。4.4问题四 在研究股市期货市场上,较多用到平均收益率、平均亏损率、综合风险指数三个指标构建评价指标体系,所以本节从这方面着手,试图去构建一个优度评价体系。然后尝试用此评价体系去评价问题三的交易模型,看其优度值大小。希望通过此优度值的评价发现问题三所建模型的缺陷。 五、模型建立与模型求解5.1问题一5.1.1数据的整理首先在EXCEL上计算出每日每时刻的AVG,再将其汇总再转置成如下表格的形式:09:3509“4015:02011.8.12011.8.22013.8.2 表25.1.2在MATLAB中导入上述表格,用clu
12、ster函数进行聚类分析 分为一下几种:平缓类: 图1微小波动: 图2 图3剧烈波动型: 图4 图5据此我们得出结论:在2011.8.1-2013.8.2时间内,绝大多部分呈现平稳状态。此方法的不足在于无法对数据源进行分类,只能从图像上观察其形状,做出定性结论。若要进行定量分析还必须采用其他更合适的方法进行分析。5.2问题二1.1首先分析其2012年整体趋势。通过观察沪深300指数2012年一月至十二月月度平均值,可以看出:该指数在2012年上半年总体处于上升的趋势中,5月份月均值全年最高2634.665;而下半年指数开始进入下降通道,直至 11月份月均值达到全年最低值,进入12月后则又开始反
13、弹上升. 图6 2.1模型的建立建立灰色系统理论的GM(1,1)模型:1)定义为非负序列,=(,) (其中=0, k=1,2,n.)2)为的1-AGO(1阶累加)序列,=(,)3)为的紧邻均值生成序列 =() 4)设=为参数列且Y=, B=则GM(1,1)模型参数列的最小二乘估计满足=称为GM(1,1)模型的白化方程,也叫影子方程而白化方程的解也称时间响应函数为6)GM(1,1)模型的时间响应序列为7)还原值为2.2模型求解1)采用计算出来的2012年全年所有交易日的沪深300指数数据材料(见附录表格),作为原始数据序列=(2401.745 2545.765 2598.989 2566.35
14、2634.665 2536.808 2409.5412316.596 2250.24 2296.136 2211.159 2322.033)2.)依次求出紧邻均值、滑准性指标、准指数指标 表3对作准光滑性检验。由 因为当k3时,p(i)0.5,准光滑条件满足。再检验是否具有准指数规律。由 由表可知准指数均大于1,所以均满足准指数规律,因此可以建立GM模型3)按照扇面的模型,可以利用matlab求出的模拟值:(2402 4948 7547 10113 12748 15284 17694 20011 22261 24557 26768 29090)再还原求出的模拟值。由 得 的模拟值(2402 2
15、546 2579 2586 2635 2536 2410 2317 2250 2296 2211 2322)与实际值对比 图7系列一为实际值,系列二为模拟值,可见相当吻合对其进行误差分析date实际值模拟值残差相对误差12401.8252402-0.17467.26964E-0522545.7652546-0.234839.22429E-0532598.989257919.989490.00769125642566.352586-19.65040.00765694352634.6652635-0.334510.00012696662536.80825360.8076780.0003183837
16、2409.5412410-0.459130.00019054582316.5962317-0.403610.00017422792250.2422500.2398670.000106596102296.13622960.1360415.92478E-05112211.15922110.1586927.17686E-05122322.03323220.0329181.41764E-05平均相对误差=0.19%容易从表中数据直观看出,该模型对各个月份的指数均值拟合得相当准确,无论是绝对误差还是相对误差都非常之小。综上,模型拟合精度优良,可以用原时间响应式预测=(2401.825-(b/a))*ex
17、p(-a*k)+b/a,(其中参数由上式得估计值:a=0.0056 b=8172.3)4)预测,令k=12,18,用matlab求解给出2013年前8个月8个预测值。与原数据资料中的2013年数据比较: 表4画出图形: 图85)误差分析monthReal predit绝对误差相对误差12581.0992634.1253.0210.02054222687.5992590.42697.17350.03615632576.7082547.45629.25220.01135342476.6022505.19928.59690.01154752561.7452463.64398.10210.038295
18、62301.8152422.776120.96120.0525572230.8342382.588151.75350.06802582242.8962343.065100.16940.044661平均相对误差=3.53915% 表52.3.结果分析计算出S1=246.9858,S2=8.0308,C=S2/S1=0.0325-0.3时,所建GM(1,1)模型可用于中长期预测。但是由于沪深300指数的趋势特点并不能保证很长时间预测的准确性,比如对50年后的沪深300指数的趋势就无法预测了。5.3问题三5.3.1模型的建立本节中操作如例。若决定是否在2011年8月01日10:30建仓,则对比它8期
19、前的2011年8月01日9:50分的指数,此时开盘价差额为17.596,超过了17,证明此段时间沪深300指数大幅上涨,预计下个8期内指数会大幅回落,即做空,然后7个周期以后平仓。若涨幅低于-17,则预计下个8周期会上涨,则做多,然后在7周期平仓。在-17和17之间,则不买也不卖。 建立数学模型: 若要对沪深300指数进行操作,则依据此模型,其中1代表做空,0代表不操作,-1代表做多。X(t)为t时期的开盘价,x(t-8)为t前八期的开盘价。 5.3.2模型的求解 先把所有时刻的开盘价减去前第八个交易期的开盘价,筛出大于17和小于-17的值。若大于17则可认为此刻位于极大值附近,小于-17则认
20、为位于极小值附近。 依据本模型,在两年内分别进行了910次交易,其中468次为看跌,累计赚取了1668.346点。442次看涨,累计赚取了2104.901点。 图9 图10若其交易手续费是交易额的万分之一(双向收取),保证金为交易额的10%,初始资金为20万(为简化运算,假设每次只用20万做初始资金)。假设初始资金一直为20万,并且期间保证金不亏损至0,且当保证金低于20万及时补足。因此利用股指期货交易的杠杆原理,在保证金为交易额的10%的情况下,将20万作为保证金投入期货市场。保证金=20万交易额=200万每次可投资点数平均2500点每次可投资手数2手每点价格300元交易次数910次交易手续
21、费占比万分之一看跌赚取的点数和3120.406点交易次数303次看跌亏损的点数和1452.06点交易次数164次看涨赚取的点数和3255.943点交易次数296次看涨亏损的点数和1151.042点交易次数147次 表6两年内总收益=两年内总亏损=两年内净收益=两年内总亏损=2263721.81元两年内净收益率=杠杆下的两年内收益率=1031.86%5.4问题四5.4.1建立评价指标体系我们结合实际,从平均收益率、平均亏损率、综合风险指数三个指标去构建交易模型的指标体系。 平均收益率=,X(i)为第i次交易的收益,y(i)为第i次交易的交易额,n为进行了n次交易。对于模型的评价,如表所示。平均收
22、益率低于1%1%-2%2%-5%5%-10%高于10%评价低较低中等较高高 表7平均亏损率= ,e(i)为第i次交易的亏损,g(i)为第i次交易的交易额,m为进行m次交易。对于模型的评价,如表所示。平均亏损率低于1%1%-2%2%-5%5%-10%高于10%评价低较低中等较高高 表8V(t)=Vit=P1itS1it+P2itS2it+ PnitSnit+Eit(i=0,1,n 假设各风险因素发生的概率P和敏感系数S是可知的)V(t)t时间内的综合风险指数;Pnitt时间内第i个项目的第n个风险因素发生的概率;Snitt时间内第i个项目的第n个风险因素的变化对预期收益率的敏感系数;E随机误差项
23、;i投资的次数;t时间。 按照三个指标,对其进行加权得出一个模型优度的指标。其中平均收益率占的权重比为30%,平均亏损率占得权重比为30%,综合风险指数为40%。 模型优度=30%*平均收益率-30%*平均亏损率-40%*综合风险指数 所得结果参照下表模型优度低于0.1%0.1%-0.2%0.2%-0.5%0.5%-1%高于1%评价极差差中良优 表95.4.2对所建模型进行评价本文所建的模型实际操作中,平均收益率为3%,平均亏损率为0.07%,综合风险指数为1%,模型优度为0.479%,给予中的评价。模型优处:本文所建的模型从行为金融学的角度出发,具有深厚的理论基础,并且对实际数据进行了虚拟操
24、作,所得结果收益率较高。模型缺陷:(1)只运用了简单的数学推理,只考虑了开盘价的数值,简化了模型。(2)忽略了影响指数变动的诸多因素,只考虑当前指数值受前期指数值的影响,实际影响沪深300指数变动的包括国家政策、国际事件、物价变动、认的主观因素等。(3)只考虑了当前指数受前面8期的影响,未对8期之前的数值进行考虑。(4)只对2011年到2013年的沪深300指数值进行虚拟操作,未对其他时间段进行虚拟操作。(5)数据来源于沪深股指,所以模型是否能运用于其他指数或者股票市场中,还有待考究。5.4.3结论: 评价此模型的实际价值到底有多高,应该把此模型运用于真实的操作中,再对模型进行综合评价。如果要
25、提高此模型的精度,应该用实际数据对此模型进行多次修改。 六、模型评价6.1传统的观点是,对于证券市场的精确预测是不可能的,因为证券市场是一个高度复杂、瞬息万变并且能够集中反映一个经济体内部各类运动变化信息的对象,种种因素的叠加导致其变动趋势呈现高度的随机性.而指数、交易价格、成交量等数据提供信息量相对证券市场本身的巨大复杂度而言很难达到充分的程度.所以,对证券市场建立的模型无论多么复杂、精密,亦或运用了多么精巧的数学工具,往往也只能做到精确地拟合过去数据,而无法准确预测未来的数据.换言之,证券市场是一个不确定性的、反决定论的复杂系统. 然而,一个无法精确预测的对象并不等于一个无法研究的对象,证
26、券市场必然有其内部的运动变化规律即使过于复杂而无法被完全认知.灰色系统理论正是研究不确定性系统的有力工具。问题2基于灰色预测理论,研究了基本灰色GM(1.1)预测模型,模型的误差小,精度高,适用于股指的中长期预测.但是本模型没有考虑宏观经济因素,只是结合现有数据作出的预测,没有结合中国经济与股市的特点。 总之,灰色模型的缺点在于:其只能研究单调的情形,只是对数据进行单纯处理,没有考虑事物内部因素,不能进行长期预测七、参考文献 8.1吴天威 基于灰色系统模型对沪深300指数走势的分析预测 重庆工商大学 2005.28.2唐丽芳 贾冬清 孟庆鹏 用MATLAB实现灰色预测GM(1,1)模型 沧州师
27、范专科学校学报 2008.68.3姜启源 谢金星 数学模型(第三版) 【M】北京,高等教育出版社,2004年4月8.4杨体昆 刘娟娟 沪深300指数动量交易模型 经济论坛 ,2013年,4月 第04期附录:1. 聚类分析程序:corrDist =pdist(data(:,1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48),corr);clusterTree = linkage(
28、corrDist,average);clusters = cluster(clusterTree,maxclust,16);figurefor c = 1:16 subplot(4,4,c); plot(data(clusters = c),1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48); axis tightendsuptitle(Hierarchical Cluster
29、ing of Profiles);2 灰色模型程序:1) 模拟程序:x0= 2401.825 2545.765 2598.989 2566.35 2634.65 2536.808 2409.541 2316.596 2250.24 2296.136 2211.159 2322.033;n=length(x0);lamda=x0(1:n-1)./x0(2:n)range=minmax(lamda)x1=cumsum(x0)for i=2:n z(i)=0.5*(x1(i)+x1(i-1);end B=-z(2:n),ones(n-1,1); Y=x0(2:n); u=BY x=dsolve(Dx
30、+a*x=b,x(0)=x0); x=subs(x,a,b,x0,u(1),u(2),x1(1); yuce1=subs(x,t,0:n-1);2)预测程序:format long g x0=load(E:b.txt)x1=sum=0for i=1:18288 x1(i)=x0(i)+sum sum=x1(i)endx1=x1z=for j=1:18288 z(j)=-0.5*(x1(j+1)+x1(j)endz=zfor k=1:18288 B(k,1)=z(k),B(k,2)=1endy=for l=1:18288 y(l,1)=x0(l+1)endU=(B*B)(-1)*B*ya=U(1,1)u=U(2,1)for k=1:18287 x2(k)=(x1(1)-u./a).*exp(-a.*k)+u./aendx2=x2x3(1)=x2(1)-x1(1)for m=1:10 x3(m+1)=x2(m+1)-x2(m)endx3=x3