《基于EMD重构信号的趋势跟踪策略:量化择时之模式识别-2012-09-04.ppt》由会员分享,可在线阅读,更多相关《基于EMD重构信号的趋势跟踪策略:量化择时之模式识别-2012-09-04.ppt(20页珍藏版)》请在三一办公上搜索。
1、,3300,3100,2900,2500,罗业华,证券研究报告|金融工程,量化投资2012 年 8 月 31 日计算包络线图例,基于EMD重构信号的趋势跟踪策略量化择时之模式识别近年来,如何对数据去噪并从中提取出富有价值的信息一直是学术界和投资界,3500,原序列,上包络线,下包络线,包络线均值,普遍较为关注的研究方向。本文提出一种新颖的数据分解技术经验模态分,解(EMD:Empirical Mode Decomposition),并将其应用于指数,作为我们在该领域的初探,希望对感兴趣的投资者有所帮助。,2700,反身性理论:中国股市属于新兴市场,影响市场的多种周期性因素叠加后必然导致我国市场
2、呈现两方面特点:一方面市场局部噪声较大,短期波动,2300,1,51,101,151,201,剧烈;此外从中长期来看,市场必然呈现出周期性波峰波谷交替出现的现,资料来源:招商证券,天软科技,象。索罗斯的反身理论正是对市场趋势周期性更迭的一种解释。,IF1009 合约模拟收益走势IF1009(左)LSRCut最大回撤(右)LSR(左)25%20%15%10%5%0%,LSRCut(左)0%-1%-2%-3%-4%-5%,经验模态分解技术:EMD 方法是一种数据逐步分解技术,也是对非平稳数据平稳化的过程我们形象的称之为“筛”(Sifting)的过程。此过程可以将原信号中不同尺度的波动或趋势分解出来
3、,产生一系列分量,每一个分量称之为本征模函数(IMF)。此外该技术可以完美地把原序列分解为多个分量,并且没有出现信号和能量的损失。,-5%-10%-15%资料来源:招商证券,天软科技,-6%-7%-8%,IMF 分量特征分析:结合拟相关系数可以发现,高频部分 IMF1IMF3 与HS300 的相关性较低,其绝对值在 5%以内,同时方差比 STDR 也不足 5%。低频部分 IMF4IMF6 与 HS300 的拟相关系数有所提高,特别是趋势项,Trend,其拟相关系数更是高达 99%。从平均周期来看,IMF1IMF3 平均,相关报告1量化择时之反身性理论的应用如何量化天时、地利、人和2011/11
4、/112量化择时之市场情绪短期看变化,长期看区域2010/12/73量化择时之市场估值股债市场估值水平在择时中的应用2010/12/30,周期比较稳定,分别为 3、6 以及 13 左右,且平均周期标准差较小。样本内策略构建:对 HS300 滚动最近 10 个交易日的 10 分钟高频价格序列进行 EMD 分解,并将高频白噪声序列从原数据中剔除,以剩余序列代表市场趋势,构建基于 EMD 重构信号的趋势跟踪策略。回测显示该策略可实现较为稳定的收益,特别是经过静态止损后,其波动性明显降低。策略 RCut累计收益 487%、RSCut 收益为 118%、RLSCut 更是高达 1293%;从月度收益来看
5、,回测的 78 个月中有 55 个月实现正收益,胜率高达 70.5%。样本外策略检验:在 8 个合约样本检验的七个月中除合约 IF1106 和 IF1112以外,其余合约基本都能获取正收益,胜率为 75%,且收益基本在 10%以,上。特别是合约 IF1009 和 IF1203,经止损后收益接近 20%。0755-S1090511040010研究助理徐静陈军华敬请阅读末页的重要说明,量化投资正文目录一、概述.41、研究意义.42、反身性理论.43、道氏理论.5二、经验模态分解技术.61、EMD 原理.62、其他相关技术.8三、IMF 分量实证分析.9四、基于 EMD 重构信号的趋势跟踪策略.15
6、1、HS300 样本内回测.152、期指样本外检验.17五、总结和展望.19图表目录图 1:计算包络线图例之一.7图 2:计算包络线图例之二.7图 3:EMD 算法流程图.7图 4:HS300 及其各 IMF 分量.9图 5:HS300 及其各 IMF 分量箱线图.10图 6:2006 年沪深 300 各 IMF 分量重构.12图 7:2007 年沪深 300 各 IMF 分量重构.12图 8:2008 年沪深 300 各 IMF 分量重构.12图 9:2009 年沪深 300 各 IMF 分量重构.13图 10:2010 年沪深 300 各 IMF 分量重构.13图 11:2011 年沪深
7、300 各 IMF 分量重构.13图 12:基于 EMD 重构信号的趋势跟踪策略流程图.15图 13:基于 EMD 重构信号的趋势跟踪策略累计收益.16图 14:基于 EMD 重构信号的趋势跟踪策略月度收益.16图 15:IF1009 合约模拟收益走势.17图 16:IF1012 合约模拟收益走势.17图 17:IF1103 合约模拟收益走势.17图 18:IF1106 合约模拟收益走势.17图 19:IF1109 合约模拟收益走势.18图 20:IF1112 合约模拟收益走势.18图 21:IF1203 合约模拟收益走势.18图 22:IF1206 合约模拟收益走势.18表 1:各 IMF
8、分量间的相关系数.10,敬请阅读末页的重要说明,Page 2,量化投资表 2:2006 年沪深 300 各 IMF 分量统计分析.12表 3:2007 年沪深 300 各 IMF 分量统计分析.12表 4:2008 年沪深 300 各 IMF 分量统计分析.12表 5:2009 年沪深 300 各 IMF 分量统计分析.13表 6:2010 年沪深 300 各 IMF 分量统计分析.13表 7:2011 年沪深 300 各 IMF 分量统计分析.13表 8:各重构分量与 HS300 的相关系数.14,敬请阅读末页的重要说明,Page 3,量化投资众所周知,金融市场充斥着各方面多维度信息,而此类
9、信息对市场又产生着不同程度的影响,这种随机因素多、噪信比大的特点直接导致从市场中获取的数据免不了受到噪声的干扰,进而会对我们下一步研究的展开带来较大困难和阻力。近年来,如何对数据去噪并从中提取出富有价值的信息一直是学术界和投资界普遍较为关注的研究方向。本文提出一种新颖的数据分解技术经验模态分解(EMD:Empirical Mode Decomposition),并将其应用于指数,作为我们在该领域的初探,希望对感兴趣的投资者有所帮助。一、概述1、研究意义金融市场是充满一个神秘色彩的世界,正是这种神秘性,吸引着无数学者前仆后继的加入到这片沃土。股票是一种高风险、高收益的证券,对于投资者而言,也正是
10、由于股市的收益性,这才构成众多机构和个人投资者参与股市交易的内在动力来源。如何减小投资股票的风险或获取更大的收益就成为投资者关心和研究的问题,国内外众多学者在此领域已有突出的学术成果。指数能够反映股票市场的整体运行情况,若能对其不同尺度的周期加以提取、对其影响因素进行合理判断,并依据分析结果制定投资策略和手段,能为投资者制定投资决策提供参考。这即是本文的出发点以及最终想达到的归宿。2、反身性理论中国股市属于新兴市场,发展历史较短且存在较为剧烈的波动,同时市场还存在多种周期性因素(如:国家宏观经济周期、政府货币政策、上市公司信息披露等)影响着自身运行。上述因素叠加后必然导致中国市场呈现两方面特点
11、:一方面市场局部噪声较大,短期波动剧烈,此外再加上众多散户投资者追涨杀跌的心理,更是不断放大噪声加剧了这种局部波动;另一方面从中长期来看,市场必然呈现出周期性波峰波谷交替出现的现象。索罗斯的反身理论正是对市场趋势周期性更迭的一种解释,按照该理论,一波上涨市往往经历以下三个阶段:第一阶段:市场众多投资者没有认识到原来空头趋势的逆转,尽管空头的势力已经耗尽,但是市场在小幅上行后反复震荡回调,影响投资者判断,以为原来的趋势还会持续。然而这种不断上涨的趋势本身形成一种反身的力量,造成原空头趋势的反转;第二阶段:市场通过反身理论的思维加强了上涨的趋势,几乎所有投资者都采取顺势而为的操作,大涨便随之而来;
12、第三阶段:在上行趋势的末端,多数投资者还按固有的趋势思维,忽略了市场中已经介入的不利因素,往往在这时就是趋势逆转阶段。随后市场将按照上述三个阶段步入一波下跌市。,敬请阅读末页的重要说明,Page 4,量化投资3、道氏理论道氏理论是所有市场技术研究的鼻祖。该理论认为股票会随着市场趋势同向变化以反映市场状况,而这种变化主要表现为以下三种趋势:1、长期趋势;2、中期趋势;3、短期趋势。本文主要通过数学方法对金融时间序列数据进行处理和分析,从中提取市场不同频率的趋势,在此基础上研究市场不同趋势的周期性,试图以此对市场特征予以解读。有助于投资者深入了解中国股市的各种周期特征,把握市场周期性波动规律。,敬
13、请阅读末页的重要说明,Page 5,X(t)的上下包络线U(t)和D(t);,H1(t)=X(t)M(t);,4、判断H1(t)是否满足 IMF 的两个基本条件:,求出H2(t)=H1(t)MH 1(t),,重新计算H1(t)上下包络线的均值MH 1(t),,反之,,本征模函数;,量化投资二、经验模态分解技术1、EMD 原理近年来,随着我国金融市场的不断开拓创新、各种衍生工具的推出以及预期证监会对基金公司可参与投资标的的放松,数量化投资策略越来越受到投资者的广泛关注,市场对这方面的研究也日渐成熟。另一方面值得一提的是,一些创造性的将传统数学、物理方法应用到数量化领域的策略也屡见不鲜。这时刻提醒
14、着研究人员,对数量化技术的创新容不得半点松懈,不进则退。本文所提到的经验模态分解(下文简称 EMD)技术正是一种数学方法,最早是由 Huang等人在 1998 年提出,用于对海浪的研究。随后,其他学者将该技术应用到图像识别、工程质量检测、信号去噪以及语音识别等工程领域,并取得不错效果。2003 年 Huang将 EMD 技术应用于金融数据分析。从本质上讲,该方法是一种数据逐步分解技术,也是对非平稳数据平稳化的过程我们形象的称之为“筛”(Sifting)的过程。在“筛”的过程中,该技术可以将原信号中不同尺度(或频率)的波动或趋势分解出来,产生一系列不同尺度(或频率)的分量,每一个分量称之为本征模
15、函数(IMF:IntrinsicMode Function)。IMF 必须满足如下两个特点:1、极大值和极小值个数目与过 0 点的数目相等或最多相差一个;2、在任意时刻,其上、下包络线的均值为 0。EMD 算法详细处理过程如下所述:1、找出序列X(t)所有局部极大值和极小值点;2、通过三次样条插值函数分别根据步骤 1 所得到的局部极大值和极小值点求出3、求出U(t)和D(t)的均值M(t),并计算原序列X(t)与上下包络线均值的M(t)差,即若H1(t)满足上述条件,则IMF1(t)=H1(t)即为得到的第一个本征模函数;并不断进行迭代,直到Hk(t)满足上述条件,则IMF1(t)=Hk(t)
16、即为得到的第一个,敬请阅读末页的重要说明,Page 6,IMF3(t)IMFK(t)等多个本征模函数,直到最后一个差值序列RN(t)小于预先设,=,的均值或者趋势项。,否,是,量化投资,图 1:计算包络线图例之一,图 2:计算包络线图例之二,3500,原序列,上包络线,下包络线,包络线均值,200,差值,330031002900,150100500,2700,-50,1,51,101,151,201,25002300,-100-150,1,51,101,151,201,-200,资料来源:天软科技、招商证券,资料来源:天软科技、招商证券5、令 R1(t)X(t)IMF1(t),对 R1(t)分
17、 别 重 复 上 述 四 个 步 骤 即 可 得 到 IMF2(t)、定的值或着是单调函数无法继续分解时终止,则RN(t)是剩余分量,表示原序列,图 1 和图 2 以 2011 年 HS300 指数日收盘价数据为例(注:为了在图中较为清晰的展示其上下包络线,已将较高频 IMF 分量从原数据中剔除),展示对原数据求其上下包络线的过程。图 3:EMD 算法流程图,寻找原数据X(t)局部极值点,剩余趋势项RN(t)=Ri+1(t)是,用三次样条插值函数求其上下包络线,计算其上下包络线均值M(t),令X(t)=R i+1(t),判断R i+1(t)是否满足终止条件,令H i(t)=X(t)-M(t),
18、令Hi+1(t)=Hi(t)-M Hi(t),判断H i(t)是否满足IMF两个条件,令IMF i(t)=H i(t),令Ri+1(t)=X(t)-IMF i(t),否计算H i(t)上下包络线均值MHi(t)资料来源:招商证券图 3 展示了 EMD 算法的详细计算流程。,敬请阅读末页的重要说明,Page 7,经过上述五步迭代计算,,K,析和傅里叶变换等其他数据处理方法的优点。,量化投资细心推导计算过程就会发现:可以将原始X(t)序列分解为 K 个 IMF 分量和一个剩余分量RN(t)。X(t)=k=1 IMFk(t)+R N(t)上式满足恒等关系,即 EMD 技术可以完美地把原序列分解为多个
19、分量,并且在此过程中没有出现信号和能量的损失,保留了原序列X(t)的所有信息,这也是该技术较小波分运用计量经济学模型对金融时间序列数据进行建模时,首先要面临的问题就是检验原数据的平稳性,并对非平稳数据做平稳化处理,这一步极其关键,会显著影响计量模型的最终结果。对金融时间序列数据进行 EMD 分解的本质是将非平稳序列逐步平稳化的过程,也就是将序列按不同尺度(或频率)的波动或趋势分解出来,并产生多个低相关性、具有不同频率和周期的本征模函数。该技术也提供了一种可供参考的数据平稳化处理方法。2、其他相关技术目前,常用的信号处理方法还有傅里叶分析和小波分析:傅里叶分析利用三角函数的线性组合对原信号进行拟
20、合,因此该技术需要附加谐波成分用于拟合变形的波轮廓,当原信号的形式偏离了正弦或余弦函数,傅里叶频谱将包含伪谐波,从而形成有误的频谱分布。对于小波分析而言,当基小波的频率范围确定之后,它的时间尺度也就确定了。然而当要分析频率更高的信号时,就必须采用更小的时间尺度;而对一个低频信号进行分析时,由于时间尺度已经既定,因此也必须对它的高频段进行分析。另一方面小波分析不具备自适应性,基小波一旦确定就必须用它来处理所有的数据。简单移动平均也可以对数据进行平滑(去噪)处理,但不可避免要引入滞后项,即在原数据中引入其他信息,而 EMD 仅使用原信号本身。此外滞后项个数不同也会对模型结果带来较大影响。综上所述,
21、以上这些方法的不足导致在实际应用中会受到限制。此外还有其他数据分解或去噪方法,由于文章篇幅限制,这里不再做过多陈述。,敬请阅读末页的重要说明,Page 8,HS300,IMF1,IMF2,IMF3,IMF4,IMF5,IMF6,IMF7,IMF8,IMF9,Trend,量化投资三、IMF 分量实证分析为说明经验模态分级技术的优越性合适应性,本部分以 2006 年 1 月 4 日至 2011 年 12月 30 日 HS300 日收盘价序列为例,具体分析其各 IMF 分量的特点,共计 1459 个样本点。从图 4 可以看出,原序列经分解后得到 9 个 IMF 分量和一个剩余趋势项,并且个 IMF分
22、量呈现出频率由高到低逐渐递减趋势。本文后续会分年度对各 IMF 分量的特征进行详细分析。图 4:HS300 及其各 IMF 分量1000005000-50010000-10005000-50010000-100010000-100050000-500050000-50005000-5001040003000200010000资料来源:招商证券,天软科技,敬请阅读末页的重要说明,Page 9,量化投资此处我们画出各 IMF 分量的箱线图,便于深入细致地分析各 IMF 分量的统计特征。首先对箱线图的含义做简单描述:图 5:HS300 及其各 IMF 分量箱线图6000,50004000300020
23、0010000-1000-2000,3002001000-100-200-300,HS300 IMF1,IMF2,IMF3,IMF4,IMF5,IMF6,IMF7,IMF8,IMF9,Trend,IMF1,IMF2,IMF3,IMF4,IMF5,IMF8,IMF9,资料来源:招商证券,天软科技如图 5 所示,箱线图中蓝色矩形区域的上下两端分别表示原序列上下四分位数(Q3 和Q1);矩形内红色横线表示其中位数;矩形外上下两侧 Q3+1.5IQR 和 Q1-1.5IQR 处画两条水平短横线(其中 IQR 表示四份位距 Q3-Q1),这两条横线为异常值截断点,其外侧红色“+”号表示异常值。从图 5
24、中还可以看出,用 EMD 技术对原序列分解得到的各分量,除剩余趋势项 Trend以外,其余各 IMF 的中位数和均值都在 0 附近,并且上下异常值截断点相对于 0 点呈对称分布,显示各分量分布不具有偏态性。此外最高频分量 IMF1 在上下异常值截断点外出现较多“+”,显示该数据具有厚尾的特点,正好说明 IMF1 是白噪声序列,波动较为剧烈。表 1:各 IMF 分量间的相关系数,IMF1,IMF2,IMF3,IMF4,IMF5,IMF6,IMF7,IMF8,IMF9,Trend,IMF1,1.0000,IMF2,0.0323,1.0000,IMF3,-0.0280,0.0956,1.0000,I
25、MF4,-0.0008,0.0505,0.1192,1.0000,IMF5,0.0191,0.0058,-0.0434,-0.0820,1.0000,IMF6,0.0268,0.0129,0.0007,0.0145,-0.0686,1.0000,IMF7,0.0038,0.0108,0.0235,-0.0310,0.0572,-0.0067,1.0000,IMF8,-0.0025-0.0090,-0.0294,0.0460,-0.1651,0.0733,-0.2231,1.0000,IMF9,0.0095,0.0032,-0.0144,0.0413,-0.0210,-0.0676,0.3801
26、,0.0000,1.0000,Trend,0.0088,0.0024,-0.0168,0.0406,-0.0370,-0.0664,0.3997,0.1147,0.9905,1.0000,资料来源:招商证券,天软科技从各 IMF 分量间的相关系数来看(表格 1),除低频分量 IMF9 与剩余趋势项 Trend 高度相关,其相关系数达 99.05%以外,其余各分量间的相关系数都相对较低,特别是白噪声序列 IMF1,它与其他分量的相关系数都在 3%以下,完全不相关。这正印证经验模态分解技术的优点:可以将高噪信比金融时间序列不同频率的本征模函数从原序列 X,敬请阅读末页的重要说明,Page 10,I
27、MFi X T,其中|X|表示原序列 X 的模,,Ei,EMR i=ETotal,N N,CMin=NMin,CMax=NMax,i模,Ri 表示各 IMF|IMFi 与原序列的相,n N,N 为原序列 X,量化投资中分解出来,有助于我们“去伪存真”,规避噪声干扰,从原数据中提取更为有价值的信息用于研究。由于 EMD 有很好的自适应能力,分解得到 IMF 分量是对原信号本身的反映和刻画,与信号外的其他点无关,并且在分解过程中没有信号和能量的损失,可称之为完美分解。各 IMF 分量按照从高频到低频的顺序从原序列中分解出来,每个 IMF 代表不同意义。因此,通过对不同频率的 IMF 分析,可以得到
28、每个 IMF 自身的现实含义,从而可抽象出原序列隐含的现实意义。这对投资者识别市场当前状态、所处周期阶段以及对实际投资都有非常重要的帮助。为更进一步挖掘各 IMF 分量蕴含的经济学含义,我们引入以下几个指标:1、拟相关系数:R i=|X|IMFi|即为IMFi 的拟相关系数,分量与原序列的正交程度。其值越大,当前|表示本征模函数IMFi 的关性越大。2、能量比:其中Ei=j=1(IMFij)2n,ETotal=i=1 Ei,N 为 IMF 分量的个数,n 为原序列 X 样本个数。3、方差比:由于各个 IMF 分量间的相关性较低,我们可以将各个 IMF 的方差加总,并计算其占比STDR,以此衡量
29、各分量对原序列 X 的贡献程度。4、平均周期:5、平均周期标准差样本个数,NMin 为极小值个数,NMax 为极大值个数。以 CSTD 表示各 IMF 分量周期的标准差,用以衡量其周期长度的稳定性。通过以上五个指标搭建的评价体系,我们从 2006 年至 2011 年分年度对各本征模函数的特征进行分析。,敬请阅读末页的重要说明,Page 11,0,量化投资,表 2:2006 年沪深 300 各 IMF 分量统计分析,图 6:2006 年沪深 300 各 IMF 分量重构,R,EMR,STDR,C,CSTD,2500,HS300,趋势项,高频(右轴),低频(右轴),250200,IMF1 0.72
30、42%0.0067%2.5022%IMF2-2.9592%0.0045%2.0380%,2.815.77,1.211.75,20001500,15010050,IMF3 2.7127%0.0069%2.5424%12.76IMF4 6.4205%0.0174%4.0293%33.38IMF5-13.9875%0.0908%9.0962%75.60IMF6 12.5727%0.3249%17.1444%Trend 99.6689%99.5489%62.6476%资料来源:天软科技、招商证券表 3:2007 年沪深 300 各 IMF 分量统计分析,2.928.4227.00,10005000资料
31、来源:天软科技、招商证券图 7:2007 年沪深 300 各 IMF 分量重构,0-50-100-150-200,IMF1,R EMR STDR1.4160%0.0153%3.1822%,C2.88,CSTD1.22,700060005000,HS300,趋势项,高频(右轴),低频(右轴),800600400,IMF2 3.6162%0.0088%2.4214%5.85IMF3 2.9113%0.0216%3.7811%12.59IMF4-1.1234%0.0472%5.5903%26.93,2.143.5911.95,4000300020001000,2000-200-400-600,IMF
32、5,2.4514%0.4040%16.3523%90.40,18.73,-800,IMF6 31.4444%0.0627%6.4215%Trend 99.6360%99.4404%62.2511%,资料来源:天软科技、招商证券表 4:2008 年沪深 300 各 IMF 分量统计分析,资料来源:天软科技、招商证券图 8:2008 年沪深 300 各 IMF 分量重构,R EMR STDRIMF1 4.6702%0.0246%3.4467%IMF2-0.9708%0.0164%2.8188%,C2.906.18,CSTD1.242.66,7000600050004000,HS300,趋势项,高频
33、(右轴),低频(右轴),500400300200100,IMF3 8.1685%0.0405%4.4253%13.53IMF4 4.4568%0.0641%5.5698%28.25IMF5 15.8498%0.1110%7.3206%48.57IMF6 24.2981%0.0555%5.1393%Trend 99.7644%99.6880%71.2795%,3.9412.7510.18,3000200010000,0-100-200-300-400,资料来源:天软科技、招商证券敬请阅读末页的重要说明,资料来源:天软科技、招商证券,Page 12,量化投资,表 5:2009 年沪深 300 各
34、IMF 分量统计分析,图 9:2009 年沪深 300 各 IMF 分量重构,R EMR STDRIMF1 1.6759%0.0091%3.8297%IMF2 2.7432%0.0093%3.8770%,C2.806.75,CSTD1.242.17,40003500300025002000,HS300,趋势项,高频(右轴),低频(右轴),600500400300200100,IMF3-2.5002%0.0202%5.7084%13.59IMF4 15.3273%0.0506%9.0083%33.86IMF5-2.8951%0.2718%20.6860%79.00IMF6 4.1712%0.03
35、57%7.5927%Trend 99.7259%99.6033%49.2980%资料来源:天软科技、招商证券表 6:2010 年沪深 300 各 IMF 分量统计分析,4.7714.3729.23,150010005000资料来源:天软科技、招商证券图 10:2010 年沪深 300 各 IMF 分量重构,0-100-200-300-400,R EMR STDRIMF1 2.3282%0.0051%4.3637%,C2.89,CSTD1.22,400035003000,HS300,趋势项,高频(右轴),低频(右轴),600500400300,IMF2 1.9262%0.0036%3.6749%
36、6.33IMF3 8.6443%0.0104%6.2268%14.19IMF4 2.8198%0.0462%13.1278%33.29IMF5 13.5316%0.1299%21.9219%72.00IMF6-17.6364%0.0991%18.6676%Trend 99.7757%99.7057%32.0173%资料来源:天软科技、招商证券表 7:2011 年沪深 300 各 IMF 分量统计分析,1.964.048.6925.34,25002000150010005000资料来源:天软科技、招商证券图 11:2011 年沪深 300 各 IMF 分量重构,2001000-100-200-3
37、00-400-500,R,EMR,STDR,C,CSTD,40003500,HS300,趋势项,高频(右轴),低频(右轴),250200,IMF1 0.8249%0.0037%4.2468%2.80IMF2 0.7751%0.0035%4.0866%6.54IMF3 0.0059%0.0062%5.4677%13.94IMF4-6.5743%0.0227%10.4044%37.50IMF5-1.8383%0.0415%14.1242%84.00IMF6 27.8826%0.0108%7.0506%Trend 99.9362%99.9116%54.6196%,1.142.034.9112.681
38、7.61,300025002000150010005000,150100500-50-100-150-200,资料来源:天软科技、招商证券敬请阅读末页的重要说明,资料来源:天软科技、招商证券,Page 13,量化投资从上述表 2 至 7 可以看出,通过对各年度 HS300 日数据进行 EMD 分解可以得到 IMF1IMF6 共六个本征模函数和一个剩余趋势项 Trend。结合拟相关系数可以发现,高频部分 IMF1IMF3 与 HS300 的相关性较低,其绝对值基本在 5%以内,同时方差比 STDR也不足 5%。低频部分 IMF4IMF6 与 HS300 的拟相关系数已有所提高,特别是趋势项 Tr
39、end,其拟相关系数更是高达 99%以上。而能量比方面,除剩余趋势项 Trend,其余各分量能量占比都在 0.1%以下。从平均周期来看,2006 至 2011 年各年度高频分量 IMF1IMF3 的平均周期比较稳定,分别稳定在 3、6 以及 13 左右,且平均周期标准差较小。这一方面对研究市场周期波动特点会有帮助,但本文由于篇幅限制,没有就此进行过多展开。通过前文分析可以发现 IMF 分量低频和高频部分的特征有较大差异。基于这种差异,本文提出一种方法对原各 IMF 分量进行重构。重构实际上是滤波的过程,可以从 HS300指数中滤除与研究无关的 IMF,保障每进行一次滤波都可以得到一个与原数据具
40、有较高相关性的时间序列,以避免市场噪声干扰。表 8:各重构分量与 HS300 的相关系数,2006,2007,2008,2009,2010,2011,高频项低频项趋势项,8.76%22.26%91.94%,9.47%43.26%94.80%,11.09%38.85%98.01%,14.97%80.71%93.22%,24.94%75.93%62.21%,20.75%53.68%92.75%,资料来源:招商证券,天软科技本文具体重构做法如下:高频项:IMF1+IMF2+IMF3,表示市场噪声干扰;低频项:IMF4+IMF5+IMF6,表示市场中期周期性波动;趋势向:Trend,表示市场长期趋势。
41、图 6 至 11 为重构后的时间序列,从图中可以清晰的看出,蓝色序列呈现出高频波动特性,表现为近似随机游走的白噪声序列;深红色序列展示了索罗斯反身性理论中提到的市场趋势周期性更迭的现象;而绿色序列可以很好的拟合市场长期趋势。因此通过这种IMF 分量重构方法,可以将市场短期噪声、中期周期性的波动以及长期趋势有效区分开,给研究工作带来巨大帮助。此外,我们还计算各重构项与 HS300 的相关系数。如表 8 所示除 2010 年以外,高频项的相关系数都在 20%以内,相关性较低;而趋势项都有着较高的相关性,相关系数高达 90%以上。,敬请阅读末页的重要说明,Page 14,量化投资四、基于 EMD 重
42、构信号的趋势跟踪策略1、HS300 样本内回测前文提到理论认为股票会随着市场趋势同向变化以反映市场状况,本节在对重构分量统计指标分析的基础上,提出一个简单有效的趋势跟踪策略,试图识别并把握市场短期趋势。具体市场趋势信号的来源为:对 HS300 最近滚动 10 个交易日的 10 分钟高频价格序列进行 EMD 分解,并将高频白噪声序列从原数据中剔除,以剩余序列代表市场趋势。策略详细流程图如图 12 所示:图 12:基于 EMD 重构信号的趋势跟踪策略流程图对最近240个,开始,HS300价格做EMD分解,i=i+1,剔除较高频噪声,将低频分量重构为IMFL,判断当前仓位,满仓,判断是否触发止损,是
43、,R(i)=(R(i-1)+1)*(1-fee)-1,空仓,否,是,判断IMFL下期、上期信号是否相同否Fee=fee,判断IMFL下期、上期信号是否相同否Fee=2*fee,是,Fee=0,R(i)=R(i-1),R(i)=(R(i-1)+1)*(HS300(i+1)/HS300(i)-Fee)-1,判断下期信号,R(i)=(LastR+1)*(2-HS300(i+1)/LastHS300-Fee)-1,资料来源:招商证券本节以 HS300 从 2006 年 1 月 4 日至 2012 年 6 月 29 日共六年半时间作为样本区间,对基于 EMD 重构信号的多空策略进行模拟,考虑单边万分之
44、1.5 的税费,同时设置阈值为 1%的止损线,即:信号发出后,若出现 1%亏损,则表示模型对未来趋势判断错误,及时进行止损。此处需要说明的是,我们测试多组不同水平的止损阈值,样本内模拟显示,1%的止损线能有效降低策略波动,同时降低最大回撤。,敬请阅读末页的重要说明,Page 15,量化投资详细策略表现如图 13 所示,其中 R 表示仅在重构信号给出做多提示的时候做多,否则空仓;RS 表示仅在重构信号给出做空提示的时候做空,否则空仓;RLS 表示在重构信号给出做多提示的时候做多,反之做空。此外 RCut、RSCut 以及 RLSCut 分别表示对应的止损策略。图 13 可以看出,各策略基本可实现
45、较为稳定的收益,特别是经过静态止损后,其波动性明显降低。策略 RCut 累计收益 487%、RSCut 收益为 118%、RLSCut 更是高达 1293%,而同期 HS300 收益仅为 166%。图 13:基于 EMD 重构信号的趋势跟踪策略累计收益,1800%,HS300,RLS,RLSCut,R,RCut,RS,RSCut,1600%1400%1200%1000%800%600%400%200%0%-200%资料来源:招商证券,天软科技图 14:基于 EMD 重构信号的趋势跟踪策略月度收益,40%30%20%,RLSCut累计最大回撤(右),单周收益(左),0%-5%-10%,10%,0
46、%-10%-20%,-15%-20%-25%,资料来源:招商证券,天软科技从月度收益来看如图 14,回测期间 78 个月中有 55 个月实现正收益,胜率高达 70.5%。从累计最大回撤方面,最多出现一次连续三个月亏损,累计最大回撤为 19%左右,出现在 2010 年 1 月份。尽管策略最大回撤较大,但持续时间较短,随后的三个月均出现,敬请阅读末页的重要说明,Page 16,图,量化投资正收益,可以较大程度弥补前期的浮亏。2、期指样本外检验在对 HS300 样本内 10 分钟高频数据回测的基础上,本节依据样本内得到的最优止损阈值 1%,股指期货 10 分钟数据进行检验。考虑到除季月合约以外的其他
47、合约交易时间较短,由于数据长度的限制,本节只选取季月合约进行检验。自 2010 年二季度股指期货上市交易以来,共有 8 个可验证的季月合约样本,各合约测试期间为从其上市交易后的第二个合约月开始直至到期交割。除合约 IF1009 以外,其余合约测试期间都包含 7 个合约月,140 个交易日。15 至 22 展示基于 EMD 重构信号的多空策略在各合约的表现。,图 15:IF1009 合约模拟收益走势,图 16:IF1012 合约模拟收益走势,25%,IF1009(左),RLSCut最大回撤(右),RLS(左),RLSCut(左)0%,40%,IF1012(左),RLSCut最大回撤(右),RLS
48、(左),RLSCut(左)0%,20%15%10%5%0%-5%-10%-15%资料来源:天软科技、招商证券,-1%-2%-3%-4%-5%-6%-7%-8%,35%30%25%20%15%10%5%0%-5%-10%-15%资料来源:天软科技、招商证券,-2%-4%-6%-8%-10%-12%-14%-16%-18%-20%,注:RLS 策略表示在重构信号给出做多提示的时候做多,反之做空;RLSCut 表示 RLS 对应的止损策略,下同。,图 17:IF1103 合约模拟收益走势,图 18:IF1106 合约模拟收益走势,30%,IF1103(左),RLSCut最大回撤(右),RLS(左),
49、RLSCut(左)0%,10%,IF1106(左),RLSCut最大回撤(右),RLS(左),RLSCut(左)0%,25%,20%15%10%5%0%-5%-10%-15%-20%-25%,-2%-4%-6%-8%-10%-12%,5%0%-5%-10%-15%-20%,-2%-4%-6%-8%-10%-12%,资料来源:天软科技、招商证券敬请阅读末页的重要说明,资料来源:天软科技、招商证券,Page 17,量化投资,图 19:IF1109 合约模拟收益走势,图 20:IF1112 合约模拟收益走势,10%,IF1109(左),RLSCut最大回撤(右),RLS(左),RLSCut(左)0%
50、,5%,IF1112(左),RLSCut最大回撤(右),RLS(左),RLSCut(左)0%,5%0%-5%-10%-15%-20%资料来源:天软科技、招商证券图 21:IF1203 合约模拟收益走势,-1%-2%-3%-4%-5%-6%-7%-8%-9%-10%,0%-5%-10%-15%-20%-25%-30%资料来源:天软科技、招商证券图 22:IF1206 合约模拟收益走势,-2%-4%-6%-8%-10%-12%-14%-16%-18%,40%,IF1203(左),RLSCut最大回撤(右),RLS(左),RLSCut(左)0%,25%,IF1206(左),RLSCut最大回撤(右)