《上证指数日收盘价的关联维数.doc》由会员分享,可在线阅读,更多相关《上证指数日收盘价的关联维数.doc(8页珍藏版)》请在三一办公上搜索。
1、精品论文上证指数日收盘价的关联维数陈楠 辽宁工程技术大学工商管理学院,辽宁葫芦岛 (125105) E-mail:namcoch摘要:关联维数(correlation dimension)是定量描述非线性时间序列的一个重要参数,近来 在脑电、心电等生物医学信号的特征描述方面得到了广泛的应用。现在不仅实验物理学家, 而且某些生理学家和经济学家也已经掌握了这一方法,用来处理数据和解决问题。相对于Hausdorff 维数和相似维数,在统计分形方面,显然关联维数的计算更为简便。然而,关联维数的计算涉及到诸如延迟时间、嵌入维数等多个参数的选择,同时需要确定 lnC(r)ln(r) 的线性拟和的尺度区间。
2、本文以 1990 年 12 月 19 日至 2008 年 11 月 22 日上海证券市场上证 指数日收盘价的数据,采用 G-P 算法,应用 Excel2003 找出了上证指数日收盘价的关联维数为 2.267,即证券市场运行系统的混沌吸引子的维数。关键词:关联维数;时间序列;上证指数;Excel20031.引 言自从美国著名控制论专家扎德1(L.A.Zadeh)教授于 1965 年发表模糊集合论文并建立 模糊集合论以来,模糊数学这门学科迅速地发展起来,几十年来,模糊数学以及由此衍生的 模糊逻辑、神经网络、遗传算法、分形几何和混沌理论等等软计算方法得到了飞跃的发展, 并且已经在人工智能、信息处理、
3、数理统计、预测决策、社会学、经济学、心理学、管理学、 教育学、运筹学等众多领域得到了广泛的应用。分形几何的发展是 20 世纪数学领域最伟大的发现之一。近来分形研究也广泛地应用于 经济学。王卫宁 1、汪秉宏 1、史晓平 2 根据对上证指数数据的分析1,证明我国股价指数波 动表现出明显的混沌性质而并不是完全随机的行为。本文以 1990 年 12 月 19 日至 2008 年11 月 22 日上海证券市场上证指数日收盘价的数据,应用 Excel2003 找出了上证指数日收盘 价的关联维数为 2.267,即证券市场运行系统的混沌吸引子的维数。2.影响股指波动的因素2.1 国家经济政策和政治方针国家的经
4、济政策和政治方针无疑对上证指数有着很大的影响力。例如 2007 年的 5 月 30日,国家将证券交易印花税从 1提高到 3。政策出台后,市场出现急速下挫,两市连续4 日触及跌停板个股高达 700 多家,500 多只个股跌幅超过 30%,基金净值也由此遭受重大 损失。4 天内单位净值跌幅超过 10%的基金个数高达 120 只,损失之惨重历史罕见。又如, 从图 1 可以看出,上证指数在 06 年以前表现平平,06 年之后开始大幅上涨,究其原因,主 要是国家经济形式运行良好,国家实行了股权分置改革(股改)形成的结果,加之当时很多 股票价值低估,改革过程中,国家给了很多的优惠,于是大量机构就开始购买,
5、接着大量普 通老百姓开始进入股市,各种资金介入热情高涨,一时间股市能挣钱成为预期。当时甚至有 人夸张地称“抢钱不如去炒股”。但是好景不常,08 年的全球经济出现拐点,美国次级贷款1 卢菲特扎德(Lotfi Asker Zadeh,1921 年 2 月 4 日生于巴库,阿塞拜疆语为 Lotfi Aliaskerzadeh),于 1965 年建立了模糊集合和模糊逻辑,主要研究模糊逻辑的应用。1991 年又引进软计算的概念。1996 年提出用词 汇计算(Computing with Words)。近期的研究重点是软计算在自然语言处理的应用何语言的语义计算。- 8 -危机成为股市下跌的导火索,现在大盘
6、指数表现又重新回到股改之前的水平。2.2 上市公司的表现通常情况下,一家有良好利润的公司很大程度上吸引股票投资人,因为股价从根本上来 说是靠公司良好的经营状况来支撑的。利润不好、表现不佳的上市公司关注的投资者就会相 对少,而投资者资金少了股价就不容易持续升高。另外,上市公司的各种行为甚至产品的质 量,价位,优劣都会影响到该上市公司的股票指数。例如臭名昭著的美国第一破产案安然丑 闻败露后,安然公司的股票价格从最高峰时的每股 90 多美元一路下跌至 2001 年 11 月 30 日的每股 0.26 美元,可见其波动是如何惨烈。2.3 投资者的心理预期证券市场中,每一个投资者都是基于自己所拥有的信息
7、做出主观的决策。每个投资者都 会充分利用自己所拥有的信息去做出理性预期。一般情况下,当某一事件使市场上大多数人 对某只股票持观望态度或悲观态度时。该股票就可能一蹶不振甚至大幅下挫。例如前不久发 生的 “三聚氰胺”事件,直接影响到了国内乳品制造企业,这些企业的的股价昨日纷纷下挫, 并且在全球范围内形成普跌态势。而令人啼笑皆非的是,某些豆浆机制造企业和豆奶制造企 业的股价却是逆市而动,一路大涨。当然,影响股市波动的因素往往是多方面的,不同时期的同一因素也能对股市波动造成 不同的影响。所以研究上市公司的股价表现要全方位多层次考虑。3.上证指数日收盘价时间序列的关联维数3.1 数据分析分形维数是定量刻
8、画混沌吸引子“奇异”程度的一个重要参数。一般来说,系统的不确定 性越大,关联维数越大;系统的确定性越大,关联维数越小。因此,关联维数可用于定量描 述非线性系统的运动特征。有研究表明,数据点在 500 点至 2 000 点之间,数据点与维数呈 现不规则变化,到 2000 点以后,点与维数基本呈现稳定 2。本文采集了 1990 年 12 月 19 日 至 2008 年 11 月 22 日上海证券市场上证指数日收盘价的数据,共 4397 个数据点。首先将原 始数据制成折线图(如图 1 所示),即我们将要分析的时间序列。上 6,000.00证指数 5,000.004,000.003,000.002,0
9、00.001,000.000.001990-12-191994-8-311998-9-18日期2003-11-252007-12-28图1 1990年12月19日至2008年11月22日上证指数时间序列图3.2 重构空间矢量根据已经采集到的数据,可以得到一组数据序列为X1 , X 2 , X 3 ,K, X 4397其中 X i 是第 i 时刻采集到的上证指数日收盘价。这组数据序列即为将要分析的时间序列。 由于不知道实际的相空间的维数,可以先将这些数据嵌入一个 m 维的相空间。例如当 m=5 时,令y1 = X1 , X 2 , X 3 , X 4 , X 5作为 5 维空间的第一个矢量 y1
10、 ,然后将 X1 , X 2 , X 3 , X 4 , X 5 右移一个数据,令y2 = X 2 , X 3 , X 4 , X 5 , X 6作为 5 维空间的第二个矢量 y2 ,以此类推。于是我们可以够造出矢量 y1 , y2 ,K yn 。令rij =yi yj(1)即为矢量 yi 与 y j 端点间的距离。Grassberger 和 Procaccia 证明了当嵌入维数大于分形维时,所求的分形维不因嵌入维数 的增加而增加,也就是说,当嵌入维数很大时,所求出的分形维数应该是不变的。在实际中 我们并不知道所求的系统的混沌吸引子的维数是多少。对于大盘指数来说,决定日收盘价变 化的主要因素有
11、国家的宏观经济状况、大盘中权重股的表现、投资者的投资行为和心理预期 以及国际环境等。因此,在实际操作中嵌入维数可选取在 5 到 10 之间。3.3 计算矢量间距离接下我们就要计算任两个矢量之间的距离。任给定一个实数 r,把 rij r 的数目记为 N2(r),总的点对数目记为 N (r)= N1(r)+ N2(r)。把距离 rij 小于 r 的所有点 对在所有点对中所占比例记为 C(r),即 C(r)= N1(r)/N (r)。由于yi yj =y j yi ,且当 i=j 时, rij =yi yj =0,为减少计算量,在实际操作中可只取矩阵 r11Kr1n MOM r n1Lrnn 沿对角
12、线的上半部分或者下半部分进行运算。对于本例来说,由于当 m=10 维时,n=4397-(m-1)=4388,共需 (1+2+4387)=9625078 次不重复运算,故可以通过计算机来完 成。借助数理统计软件,我们可以轻松地完成对这些数据的分析,比较著名的数理统计软件 有 MATLAB,SPSS,还有经济学统计软件 Eviews,这些软件的功能非常强大,不过对英语 和计算机水平要求较高,特别是 MATLAB,要懂一些计算机语言和编程。虽然这点计算量 对于计算机来说算不了什么,但是对于不懂这些软件的人来说却很难。这里介绍一种基于 Excel2003 的距离计算方法,在数据量不大的情况下,这种方法
13、不失为一种简单且行之有效 的方法。3.3.1 录入数据这一步是最为简单的一步,实际上就是把采集到的数据点复制到 Excel 工作表中。这样, 我们就得到了从 A1 到 A4397 单元格的一列数据。下面所有的运算都是基于这一列数据进行 的。3.3.2 编写公式与数据处理用 Excel 的一点好处就是,借助单元格右下方的可拖动柄,我们可以迅速地填写所需要 的公式。例如当 m=10 维时,B1 单元格的公式为 (即 r12 ):=SQRT(A2-A1)2+(A3-A2)2+(A4-A3)2+(A5-A4)2+(A6-A5)2+(A7-A6)2+(A8-A7)2+(A9-A8)2+(A10-A9)2
14、+(A11-A10)2)(2)相应的,B2 单元格公式为 (即 r23 ):=SQRT(A3-A2)2+(A4-A3)2+(A5-A4)2+(A6-A5)2+(A7-A6)2+(A8-A7)2+(A9-A8)2+(A10-A9)2+(A11-A10)2+(A12-A11)2)(3)我们先将 B1 单元格的公式加上绝对引用,即=SQRT(A2-$A$1)2+(A3-$A$2)2+(A4-$A$3)2+(A5-$A$4)2+(A6-$A$5)2+(A7-$A$6)2+ (A8-$A$7)2+(A9-$A$8)2+(A10-$A$9)2+(A11-$A$10)2)(4)以便产生公式。然后双击拖动柄,
15、很快,我们就得到了 B1 到 B4397 单元格的一列数据,即 由公式自动计算的数据,我们的目的是先找出公式,而不是数据,所以可以按“Ctrl+”以显 示公式。接着,我们把 B1 到公式复制到记事本里,再将“$”全部替换为空。这样,我们就得 到了所有的公式。实际上,当 B1 单元格公式为式(1)时: 双击拖动柄得到的一列数据即是矩阵 r11Kr1,4388 MOMr4388,1Lr4388,4388 中的沿对角线的一列数据 r12 , r23 , r34 ,K,K r4387 ,4388 。同样地,将 C1 单元格定义为(即 r13 ):=SQRT(A3-A1)2+(A4-A2)2+(A5-A
16、3)2+(A6-A4)2+(A7-A5)2+(A8-A6)2+(A9-A7)2+(A10-A8)2+(A11-A9)2+(A12-A10)2)(5)D1 单元格定义为(即 r14 ):=SQRT(A4-A1)2+(A5-A2)2+(A6-A3)2+(A7-A4)2+(A8-A5)2+(A9-A6)2+(A10-A7)2+( A11-A8)2+(A12-A9)2+(A13-A10)2)(6) 以此类推。然后我们通过双击拖动柄就实现了 rij 的运算。需要注意的是,Excel 的一张工作表是 65535 行,256 列,所以当 m=5 时,我们无法将所有公式都放入到一张表中。所以我把这 4397
17、个数据点大概分成每张工作表 220 列数据, 分别放入 20 个工作表中。这样,我们就完成了 rij 的全部计算。由于计算机的性能不同,计 算时间也不同,笔者的计算机采用 Pentium(R)4 2.80GHz 的 CPU,256M 内存,运算时间 大约为 20 分钟。3.3.3 数据裁剪在上述过程中由于 Excel 在计算公式时会引用到空的单元格,所以必须裁剪去无效的数 据,比较人性化的是,Excel 在引用公式出错时会在该单元格的左上方显示一个绿色小三角 形,我们需要做的就是删除这些带绿色三角形的单元格内的无效数据。由于无效数据呈三角 区域分布,而 Excel 只能拖动出矩形框,所以我们需
18、要裁剪这些数据。这里也可以编写宏命 令来快速实现。3.3.4 得出结论在完成了上述计算之后,我们得到的就是 rij 的距离矩阵: r11Kr1,4388 MOM 沿对角线的上半部分或者下半部分。r4388,1Lr4388,4388 现在要做的就是任给定一个实数 r,把 rij r 的数目记为 N2(r),总的点对数目记为 N (r)= N1(r)+ N2(r)。我们可以运用 Excel 中的 countif(range,criteria)公式来 实现。不过我们得把这个矩阵“变瘦”,因为 Excel 一张工作表只有 256 列。把距离 rij 小于 r 的所有点对在所有点对中所占比例记为 C(r
19、),即 C(r)= N1(r)/N (r)。对 于 m=10 维来说,N (r)= 4 388 2 =19254544。之后我们分别对 r,C(r)取对数,就得到了一堆 点 (r1 , C (r1 ), (r2 , C (r2 ), (r3 , C (r3 ),L需要注意的是,计算结果与 r 的取值有关。如果 r 取值太大,那么一切 rij 都不会超过 r,这时 N1(r)=N (r),C(r)=1,取对数后 ln C(r)=0,这样的 r 无法反映系统的内部性质,没有意 义;如果 r 取值太小,那么所有的 rij 都大于 r,此时 N1(r)=0,C(r)=0,也没有意义。适当地调整 r 的
20、范围,可能在一段范围里有C (r) = r v其中指数 v 是一种维数,关联维数即为(7)式中 C (r) 通常有如下形式:D= limx0ln C(r)ln(r )(8)C (r) = 1NN (r y y1)=NN (r r )(9)N2 ijijN2 ijij式中 ( x) 是 Heaviside 函数,且有1,当 ( r rij ) 0 时ij (r rij ) = 0 ,当 ( r r) 0 时 (10)3.4 线性回归分析最后我们只需在 lnC(r)-ln(r)曲线上求出直线段部分的斜率即可(如图 2 ,图 3)。适当地 调整 r 的大小使之出现无标度区,即点集近似在一条直线上。l
21、nC(r)-3.0000000-4.0000000-5.0000000-6.0000000-7.0000000-8.00000003.50000004.00000004.5000000ln(r)5.0000000图2 m=10维时关联维数的计算 (D=2.267)m=10 时的双对数图如图 2。进行线性回归,回归方程为:y = 2.267 x 14.884R2 = 0.998其中 2.267 即为所求的关联维数。lnC(r)-3.0000000-4.0000000-5.0000000-6.00000003.50000003.75000004.00000004.25000004.50000004
22、.7500000ln(r)图3 m=5维时关联维数的计算 (D=1.987)最后嵌入维数和关联维数的结果如表 1 所示。表 1 嵌入维数和关联维数的运算结果嵌入维数(m)关联维数(D)51.98762.14272.22382.28692.231102.2674.结论本文采用 G-P 算法,应用 Excel2003 找出了 1990 年 12 月 19 日至 2008 年 11 月 22 日上 海证券市场上证指数日收盘价关联维数为 2.267,即证券市场运行系统的混沌吸引子的维数。 这说明虽然股票市场运行千变万化,但并不是某些人所谓毫无规律可言。虽然决定市场的因 素非常多,但是本质因素却只有 2
23、 个,只要 2 个因素就能决定整个系统的趋势。虽然我国股 票市场虽然不成熟,各种控制机制有待健全,但是总体上来说股市具有稳定性结构,只不过 在表现上呈现出混沌规律。参考文献1 王卫宁、汪秉宏、史晓平股票价波动的混沌行为分析J数量经济技术经济研究:141-147,2004 年第 4 期2 于青关联维数计算的分析研究J天津理工学院学报:60-62,2004 年 12 月第 20 卷第四期3 高红兵、潘瑾、陈宏民深圳成分股指数收益率序列的分形维J预测:50-51,2000 年第 6期4 郭嗣琮、陈刚信息科学中的软计算方法M东北大学出版社,2001 年 11 月The Correlation Dime
24、nsion of the Shanghai Stock ExchangeComposite IndexChen NanCollege of Business Administration, Liaoning Technical University, Huludao, Liaoning (125105)AbstractCorrelation dimension is an important parameter of describing non-linear time series quantitatively andis recently widely used in character-
25、description of bio-medical aspects, such as EEG, ECG signals. Now not only experimental physicist and physiologist, but also some economists have mastered this method to process data and solve problems. Compared to Hausdorff dimension and similar dimension, it is clear that the correlation dimension
26、 can be calculated simplify, especially in the field of fractal statistics. However, such as the delay time, embedding dimension and choice of many other parameters get involved in the calculation of correlation dimension. At the same time, we need to confirm the linear fitting scale of the lnC (r)
27、ln (r). Based on the Shanghai Stock Exchange Composite Index data from December 19, 1990 to November 22, 2008, using G-P algorithm and under the application Excel2003, this paper found that 2.267 is the correlation dimension of the Shanghai Stock Exchange Composite Index, that is, the dimension of the systems chaotic attractor of the Shanghai Stock Exchange.Keywords: correlation dimension; time series; the Shanghai Stock Exchange Composite Index; Excel2003