《高频数据分析与市场微观结构.ppt》由会员分享,可在线阅读,更多相关《高频数据分析与市场微观结构.ppt(65页珍藏版)》请在三一办公上搜索。
1、文献综述,研究现状,金融高频数据统计特征的研究金融高频数据的“日历效应”研究对金融市场微观结构的研究基于金融高频数据的“已实现”波动的研究金融高频数据和超高频数据的建模研究,金融高频数据统计特征的研究,1997年,Andersen和Bollerslev发表文章Intraday periodicity and Volatility Persistence in Financial Market,文中采用高频数据对美国股票市场和外汇市场的日内波动性和长记忆性进行了研究,证明了在这些市场中存在着波动的长记忆性。,1998年,Andersen和Bollerslev在文章Answering the Cr
2、itics:Yes,ARCH Models Do Provide Good Volatility Forecasts中指出:高频收益数据具有非正态性。随着数据频率的增加,其数据的峰度也是随之增加的,到分钟数据,峰度就已经达到了100以上了。,2000年,Andersen,Bollerslev和cai发表文章Intraday and interday volatility in the Japanese stock market,文中利用高频数据对日本股票市场进行了研究,通过滤波的方法证明了波动长记忆性的存在,金融高频数据的“日历效应”研究,1985年,McInish和Wood发表文章Intra
3、day and overnight returns and day-of-the-week effect文中利用分钟数据发现日内波动具有“U”型模式。1988年,Admati和Pfleiderer发表文章A theory of intraday patterns:volume and price variability,1992年Brock和Kleidon发表文章Periodic market closure and trading volume分别给出了日内“U”型模式的理论解释。,1995年,Hedvall发表文章Trade concentration hypotheses:an Empi
4、rical test of information vs.demand models on the Helsinki Stock Exchange文章对日内“U”型模式的理论解释进行了比较。1997年,Andersen和Bollerslev发表文章Intraday periodicity and Volatility Persistence in Financial Market,在其研究“日历效应”与波动持续性之间的关系时,发现在对日内周期性的“U”型模式进行滤波处理之后,波动持续性大大的下降。,1998年,Andersen和Bollerslev发表文章DM-Dollar volatilit
5、y:Intraday Activity Patterns,Macroeconomic announcements,and Longer run dependencies,文章系统地分析了“日历效应”,并解释了它产生的原因,使用德国马克对美元的汇率数据将“日历效应”、重大事件公布效应以及波动持续性三者放在一起来研究,发现“日历效应”对准确计量波动性至关重要,2000年,Andersen,Bollerslev,Cai发表文章Intraday and interday volatility in the Japanese stock market,利用弹性傅立叶形式回归(Flexible Fouri
6、er Form Regression)对日本股票市场进行了分析,发现由于日本市场有不同于美国市场的午间休市的交易制度,日本股票市场波动呈现日内双“U”型模式。,2002年,Rah-man和Lee等发表文章Intraday return volatility process:evidence from Nasdaq stocks,文中利用个股交易数据对日内“U”型模式进行了实证研究,并发现交易量、买卖价差、交易频率也存在“U”型模式。2003年诺贝尔经济学奖得主Granger认为长记忆性很可能是由于外部事件所导致的结构变化而引起的,对金融市场微观结构的研究,2002年,孙培源、杨朝军发表文章流动
7、性、交易活动与买卖价差,文中利用日内交易的高频数据研究了流动性和交易活动之间的相关性和各自时间序列的性质。2002年,杨朝军、孙培源、施东晖发表文章微观结构、市场深度与非对称信息:对上海股市日内流动性模式的一个解释,文中利用日内交易的高频数据,根据证券市场微观结构理论,对上海股票市场的报价深度的日内特征进行了研究,同时对其影响因素进行回归分析,发现我国股市中除交易量、波动性和价格水平外,信息的非对称性是影响流动性水平的重要因素,基于金融高频数据的“已实现”波动的研究,1998年,Andersen和BollerslevAnswering the Critics:Yes,ARCH Models D
8、o Provide Good Volatility Forecasts,提出了一种叫“已实现”波动(realized volatility)的测量方法。2000年到2003年间Andersen和Bollerslev等发表一系列文章,如Exchange Rate Returns Standardized by Realized Volatility are(Nearly)Gaussian、The Distribution of Exchange Rate Volatility、The Distribution of Stock Return Volatility、Modelling and Fo
9、recasting Realized Volatility等通过对西方国家发达金融市场的高频金融时间序列的研究,提出“已实现”波动通常具有的性质,金融高频数据和超高频数据的建模研究,1993年,Drost和Nijman发表文章Temporal Aggregation of GarchProcesse,文章第一次提出弱GARCH模型。1997年,Mller和Dacorogna发表文章Volatilities Of Different Time Resolutions:Analyzing the Dynamics Of Market Component,提出HARCH模型的,该模型主要是针对高频数
10、据的两个基本特征:波动的长记忆性和波动的非对称性,1998年,Engle和Rusell发表文章Autoregressive Conditional Duration:A new model for irregularly-spaced transaction data,在原有的ARCH模型的框架下,用一个标值点过程(marked point process)去刻画随机的交易间隔,不同的标值点过程得到不同的ACD模型。Engle和Rusell利用ACD模型很好的完成了对交易频率的预测。,1998年,Ghysels和Jasiak发表文章Long-term dependence in trading
11、,文章为了刻画交易间隔的长记忆性,沿袭FIGARCH的建模思想,提出了FIACD模型(Fractionally Integrated ACD模型)。1998年,Ghysels和Jasiak发表文章GARCH for irregularly spaced financial data The ACD-GARCH models,为了刻画超高频金融数据的波动性,运用了GARCH过程的时间聚合思想,在ACD模型的框架下,引入了GARCH效应,提出了ACD-GARCH模型。,2000年,Bauwens和Goit发表文章The logarithmic ACD model An application to
12、 the bid-ask quote process of three NYSE stocks,文章针对基本的ACD模型需要对参数的取值范围加以限制,对参数估计带来不便这一缺陷,提出了LACD模型(logarithmic ACD模型)。2000年,Engle发表文章The Econometrics of Ultra-High Frequency Data,指出只需用交易间隔(duration)去调整超高频收益率,就可以在传统的GARCH模型的框架下对超高频数据建模,并且提出了UHF-GARCH模型(ultra-high-frequency GARCH model),2001年,Zhang,Ru
13、ssell和Tsay发表文章A nonlinear autoregressive conditional duration model with application to financial transaction data,把门限的思想引入到ACD模型框架,提出一种非线性的ACD模型,即TACD模型(Threshold ACD模型),使得交易间隔过程具有更富弹性的形式。2004年,Bauwens和Veredas发表文章The stochastic conditional duration model A latent factor model for the analysis of fi
14、nancial durations,提出的SCD模型,高频数据和ACD模型,高频数据分析,持续期模型(ACD),扩展的持续期模型,内容简介,一、高频数据分析,高频数据(Highfrequency Data)是指在细小的时间间隔上抽取的观测值。金融中常指以日或更小的时间间隔抽取的观测值。其中最极端的高频数据是证券市场中记录每一笔交易或贸易的数据,这里的时间通常是以秒为单位测量的。在大量交易期间,以秒为单位的时间长度可能还是太长。,我们称这样的数据为超高频数据(ultrahighfrequency data)。由于超高频数据记录了金融市场的实时交易信息,为理解金融市场微观结构提供了基础和可能,因而
15、超高频数据的研究成为近年来计量经济学领域的热点。高频金融数据在研究与交易过程和市场微观结构相关的大量问题中都是很重要的。,可以用来比较不同交易系统在价格发现(price discovery)方面的有效性,还可以用来研究某只特定股票买卖报价的动态性。在一个指令驱动的股票市场中,还可以用来研究指令动态,更有趣的是可以用来研究“是谁提供了市场的流动性”这样的问题。然而,高频数据还有一些低频数据中不会出现的独特特征。下面从三个部分来分析高频数据:非同步交易、买卖报价差、交易数据的经验特征。,1、非同步交易,股票交易并不是同步发生的,不同的股票有着不同的交易频率;即使是同一种股票,其交易强度也是一小时一
16、小时地、一天一天地变化的。然而我们经常对一个固定的时间间隔如一天、一周或者一个月来分析收益率序列。对于日序列,股价指的是其收盘价格,即该股票在一个交易日内最后一次交易的价格,而股票最后一次交易的实际时间也是一天天变化的。,这样,如果我们假定日收益率序列在24小时里是等间隔的往往是不正确的。实践证明,即使是在真实的收益率序列是前后独立的时候,这种假定可以导致股票收益率可预测性的错误的结论。对于股票日收益率,非同步交易可以导致a)股票收益率之间的1步延迟交叉相关 例如考虑股票A和B,假定这两只股票是独立的,并且股票A比股票B的交易频繁。,在某一天接近收盘的时刻出现了一个特定的影响市场的消息,由于股
17、票A的交易更频繁,因此股票A比股票B在同一天显示出这个消息的效应的可能性更高。虽然股票B的效应最终也会出现,但是可能会被延迟到下一个交易日。如果这种情况发生,则好像是股票A的收益率引导着股票B的收益率。因此,尽管这两只股票是独立的,但是它们的收益率序列可能会显示出显著的1步延迟交叉相关。,b)组合收益率的1步延迟序列相关 对于一个持有股票A和B的组合,前面的交叉相关将会变成一个显著的 1步延迟序列相关。c)某些情形下,单只股票收益率序列的负序列相关 这里我们采用Campbell,Lo和MacKinlay(1990)提出的模型的一个简化形式来研究这种现象。,令rt表示证券在t时刻的连续复合收益率
18、假定rt是一个独立同分布的随机变量序列 E(rt)=Var(rt)=2 对每个时间段,证券不交易的概率为,它是不随时间变化的,并且与rt独立。令rt0 表示观测到的收益率如果t时刻没有交易,则rt0=0,此时没有可利用的信息。,如果t时刻有一个交易,则定义rt0为从前一个交易开始的累积收益率。rt0=rt+rt-1+rt-kt kt是满足在t-kt,t-kt+1,t-1时刻没有交易发生的最大的非负整数。,rt与rt0的关系用数学式子表示如下:以概率 以概率(1-)2 以概率(1-)2rt0=以概率 2(1-)2(1.1)以概率 k(1-)2,这些概率很容易理解:例如,rt0=rt表示kt=0,
19、当且仅当t时刻与t-1时刻都有交易发生(有交易发生的概率为1-);rt0=rt+rt-1表示 kt=1,当且仅当t和t-2时刻都有交易发生,但t-1无交易发生。rt0=rt+rt-1+rt-2表示kt=2,当且仅当t和t-3时刻都有交易发生,但t-1、t-2都无交易发生。上述所有的概率之和为1。+(1-)21+2+=+(1-)2=1+-=1,接下来我们考虑观测的收益率序列 rt 的矩方程a)首先分析期望值E(rt0)=(1-)2E(rt)+(1-)2E(rt+rt-1)+=(1-)2+2(1-)2+32(1-)2+=(1-)21+2+32+=(1-)2=(1.2),b)分析方差Var(rt0)
20、=E(rt0)2-E(rt0)2 E(rt2)=Var(rt)+E(rt)2=2+2 因为rt是前后独立的,所以E()2=Var()+E()2=(k+1)2+(k+1)2 E(rt0)2=(1-)2 E(rt2)+(1-)2 E(rt+rt-1)2+=(1-)2(2+2)+(42+22)+=2+2-1(1.3),由1.2和1.3可得出Var(rt0)=2+2-1-2=2+,c)最后考虑rt0的1步延迟自协方差Cov(rt0,rt-10)=E(rt0rt-10)-E(rt0)E(rt-10)=E(rt0rt-10)-2这里转化为求E(rt0rt-10)的值,如果t时刻无交易,或者t-1时刻无交易
21、,或者t时刻与t-1时刻都无交易,则rt0rt-10=0,可得:,以概率 2-2 以概率(1-)3 以概率(1-)3rt0rt-10=(1.4)以概率 k-1(1-)3,rt0rt-10=rtrt-1表示当且仅当在时刻t-2,t-1和t有连续的交易利用1.4以及对j0,E(rtrt-j)=2 得出E(rt0rt-10)=(1-)3E(rtrt-1)+Ert(rt-1+rt-2)+=(1-)3 21+2+32+=(1-)2rt0的1步延迟自协方差为 Cov(rt0,rt-10)=-2假设 0,则非同步交易引起的rt0的负1步延迟自相关系数得出为=,同理可证明:Cov(rt0,rt-j0)=-2j
22、 j1 1步延迟的ACF的大小信赖于、的选择,并且可以是实实在在的不可忽视的。这样当0时,非同步交易就导致了观测到的证券收益率序列之间的负自相关性。,2、买卖报价差,每当公众有买卖的愿望时,做市商(market maker)随时准备好进行买或卖,提供了市场的流动性。市场流动性是指能快速地、匿名地、几乎没有价格影响地买卖相当数量证券的能力。作为提供流动性的回报,交易所赋予做市商对证券的买卖双方传递不同价格的专利权。,他们以标价Pb购买,以更高的叫价 Pa 卖出,买卖报价差一般比较小,也就是一两个最小升降档。对公众来说,Pb 是卖出价格,Pa是买入价格价格差 Pa-Pb 称为买卖报价差(bid-a
23、sk spread),这就是做市商获得报酬的主要来源。买卖报价弹性即买卖报价差引起的资产收益率的1步延迟负序列相关。,考虑Roll(1984)的简单模型,假定观测到的资产市场价格 Pt满足 Pt=Pt*+It S=Pa-Pb Pt*表示一个无摩擦市场中资产在t时刻的基本价值,It是一个独立的、服从等概率二项分布的随机变量序列,可以解释为一个指令型的变量。即 以概率0.5 表示买方发动的交易 以概率0.5 表示卖方发动的交易,模型可以写为 以概率0.5 表示买方发动的交易 以概率0.5 表示卖方发动的交易 如果Pt*不变,那么价格变化的观测过程为 E(It)=0 Var(It)=1 得出 E(P
24、t)=0 j1,因此,Pt的自相关函数为 若j=1 若j1 这样买卖报价差就导致观测到的价格变化序列的1步延迟负相关。这在金融文献中一般称为买卖报价弹性。,3、交易数据的经验特征,令ti表示资产的第i次交易产生的时刻,它是从午夜开始以秒为单位测量的日历时间。与交易相关的有几个变量:交易价格、交易量、盛行的买卖报价等等。ti 的集合与相关的度量一般称为交易数据,这些数据有几个重要的特征,这些特征是当观测值随时间加总不存在的。交易数据的特征有:,a)不等间隔的时间区间 交易一般不是在等间隔的时间区间上发生的,这样观测到的资产的交易价格并不形成一个等间隔的时间序列,从而交易间的时间持续期变得非常重要
25、,并且可能包含了关于市场微观结构(例如交易强度)的有用信息。b)离散取值的价格 资产从一个交易到另外一个交易的价格变化只在最小变动价位的倍数中发生。,c)日周期或者日模式的存在在正常交易条件下,交易活动能够展示周期模式。举例说,在NYSE(纽约股票交易所)中,开盘与收盘时刻的交易比较频繁,而中午时间交易比较少,导致了“U”型的交易强度。因此,交易之间的时间持续期亦呈现日循环模式。d)一秒钟的多重交易由于时间是以秒来测量的,多重交易甚至是具有不同价格的多重交易同时发生是可能的,但在大量交易期间,这种时间长度可能还是太长。,二、持续期模型,持续期模型主要考虑交易之间的时间间隔。较长的持续期预示着较
26、少的交易活动 利用类似于波动率的ARCH模型的概念,Engle和Russell(1998)提出了自回归条件持续期(ACD)模型来描述(大量交易的)股票时间持续期的演变。正如前面提到的,日内交易展示了一些日模式,因此我们集中讨论调整的时间持续期(2.1),f(ti)是一个确定的函数,由 的循环成分组成。显然 f(ti)依赖于标的资产(underlying asset)以及市场的系统行为。光滑插值是一个估计f(ti)常用方法,运用简单的二次函数与示性变量来处理日交易活动中确定的组成部分。详细内容见P152,1、ACD模型,标准ACD 模型是Engle 和Russell(1998)建立的两笔连续交易
27、之间持续期的计量模型。ACD模型是在过去事件基础上为分析研究交易持续期(duration)的条件分布而创建的,这个模型的优点在于把交易间的持续期(时间间隔)转化为一个随时间间隔变动的动态点过程。利用GARCH模型的思想来研究(2.1)中调整的时间持续期 的动态结构。定义 xi=,标准的ACD模型定义为 xi=(2.2)表示第i-1次交易到第i次交易的调整的时间持续期的条件期望。Fi-1为第i-1次交易时可以得到的信息集合。是独立同分布的非负随机变量序列 E()=1 在 Engle 和Russell(1998)中(2.3)这样的模型称为ACD(r,s)模型,与GARCH模型类似,过程i=xi-i
28、是一个鞅差序列(即),ACD(r,s)模型可以写为(2.4)正好是无高斯新息的ARMA过程的形式。在这里对于jr,rj=0;对于js,wj=0.这样的表示可以用来得到ACD模型弱平稳性的基本条件。对方程(2.4)两边取期望,假定弱平稳性,则有因为期望持续期E(Xi)0,所以假定0,1,下面来分析一下方程(2.4)另外一个应用1)当 服从一个标准指数分布时,(2.3)中的模型称为EACD(r,s)模型。一个EACD(1,1)模型可以写为(2.5)E(i)=1 Var(i)=1 E(i2)=Var(i)+E(i)2=2假定 xi 是弱平稳的(头两阶矩是不随时间变化的)a)E(xi)=EE(ii|F
29、i-1)=E(i)E(i)=(2.6),在弱平稳性下E(i)=E(i-1)令E(xi-1)=E(i-1)=E(i)=t 代入(2.6)中得出 t=+t*r1+t*i 求得t=即x E(xi)=E(i)=(2.7),b)E(xi2)=EE(i2i|Fi-1)=E(i2)E(i2)=2 E(i2)E(i2)=E(+1xi-1+1i-1)2(利用xi和i的弱平稳性)=x2*Var(xi)=E(xi2)-E(xi)2=2 E(i2)-x2=x2*为了得到不随时间变化的无条件方差,方程(2.5)中的EACD(1,1)必须满足:1,2)当 服从一个标准化的韦布尔分布,则(2.3)中的模型称为WACD(r,
30、s)模型 WACD(1,1)模型的方差也可以利用同样的方法及标准化韦布尔分布的前两阶矩得到 3)当 服从一个标准化的广义伽马(Gamma)分布,则(2.3)中的模型称为 GACD(r,s)模型,2、扩展的ACD模型,我们提到ACD 模型在研究市场微观结构中起到了很重要的作用,但是在验证市场微观结构假说的时候,持续期模型中不应该只有持续期的滞后项,还要有如:交易量、价差、收益的波动率等微观结构变量。在标准ACD(p,q)模型中,为了保证持续期的非负性,系数要有一定的限制,如果想在自回归模型中加入其它的市场微观结构的变量,可能存在变量的系数为负的情况,例如:在市场微观结构的理论中,大的交易量可能意
31、味着市场存在知情交易者,市场中出现新的信息,此时交易持续期通常很短,所以在持续期模型中加入交易量这个变量,其系数可能为负,这种情况下,模型中计算的久期(持续期)就有可能变为负值。,对数形式ACD 模型(Logarithm ic-ACD models)为了避免上述情况的出现,Bauwens和Giot(2000)引入logarithm ic-ACD或者Log-ACD(p,q)模型,其中条件久期在自回归等式中为对数形式,这样就可以保证久期是非负的,而且允许在久期式中加入其它的微观结构的变量,而不必再对系数施加其他约束,从而为研究市场微观结构变量与交易久期之间的相互作用提供了便利。Log-ACD(p,
32、q)模型有两种参数设定的形式,分别称为Log-ACD I 和Log-ACD II,i服从韦布尔分布,i=InE(xi|Ii-1)实际中经常使用的模型是第二个式子。,FIACD模型 长记忆现象已经在时间序列和波动率不论是理论上还是应用领域,有了很广泛的研究。为了解释交易久期存在的长记忆现象,Jasiak(1998)提出了分整ACD(FIACD)模型 FIACD(p,d,q)模型,AACD 模型(Augmented ACD)在Fernades 和Gramm ing(2006)文章中,提出了一族增广的ACD模型AACD模型,将ACD模型中条件持续期过程用Box-Cox转换,参数K0,条件久期的过程为
33、:AACD模型中的形状参数 1和 1决定Box-Cox转换的凹性或者凸性。,机制转换ACD 模型(Regime-switching ACD models)机制转换模型是基于在实际中发现的金融时间序列随时间表现出来的几种不同的非线性特征而提出来的,如:一个过程的上升和下降的过程是不对称的两种不同模式,时间序列的显著变化可视为时间序列的内在生成机制从一种机制向另外一种机制的转换。将这种思想引入到对交易久期的模型中,反映交易久期的不同变化模式,Zhang、Russell 和T say(2001)介绍了一种门限ACD 或者TACD(p,q)模型,一种k机制的ACD 模型形为:,门限ACD 模型假定在某
34、一特定的时点,交易持续期的动态过程从一种机制(regime)跳跃到了另一种机制,同时这种转换是离散的。门限ACD 模型允许机制变化是内生的,其中,变量决定了机制转换是可观测的,但是引起机制转换的门限却是不可直接观测的,导致阈值也是离散的。但在实际生活中,有些机制的转换却并不是离散跳跃的,而是一个连续的、逐渐变化的过程。如股市或汇市的价格反转不是一蹴而就的而是连续变化的,经济形势也不会从萧条期直接变化到经济繁荣期,也要经历经济从萧条复苏不断变化到繁荣期。针对TACD 模型中的不足,Meitz 和Terabsvirta(2006)提出了smooth transition ACD(STACD)模型,
35、模型的思想也是从GARCH 模型研究中得到的。,潜在变量模型(L atent factor-based models)Bauwens和Veredas(1999)提出了随机条件久期(SCD)模型,其中的条件持续期i用一个潜在的变量来建模,而不是在ACD模型中的那样是确定的。SCD 模型开始被提出时的形式为:其中,式(*)和ACD 模型是一样的,式(*)则是一个平稳的一阶AR(1)模型,为了保证久期的非负性,对参数进行了非负的约束。,SCD 模型的参数并不需要像ACD 模型那样需要对参数的取值范围加以限制。但是,由于在SCD 模型中,交易间隔是由一个不可观测的随机过程决定的,从而导致其似然函数难以
36、得到显式的形式,模型的估计非常困难。,1 耿克红,张世英.2008:Comparative Study of SCD and ACD Sodels.管理学报.(01).2 耿克红,张世英.2008:Review on Finance Market Durations Model Based on the UHF Data.中国管理科学.(04).3 耿克红,张世英.2007:金融市场超高频时间序列ACD-GARCH-V模型研究.统计与决策.(04).4 郭宝生,任若恩.2007:The Development of ACD Model and Its Application in Financ
37、e.系统工程.(10).5 韩铁,张世英.2008:Regime-switching fractionally integrated augmented ACD model on ultra-high-frequency data.系统工程学报.(01).6 戴丽娜.2008:An Research on the Nonparametric Additive ACD Model and the Application in the Stock Market of China.统计与信息论坛.(02).,参考文献:,7 戴丽娜.2008:An Research on the Nonparametric Additive ACD Model and the Application in the Stock Market of China.统计与信息论坛.(02).8 曾勇,王志刚,李平.2005:Review of Empirical Research on Financial Market Microstructure Based on High-frequency Data.系统工程.(03).,参考文献:,