《极值理论在风险价值度量中的应用.docx》由会员分享,可在线阅读,更多相关《极值理论在风险价值度量中的应用.docx(21页珍藏版)》请在三一办公上搜索。
1、极值理论在风险价值度量中的应用1、引言自20世纪70年代以来,金融市场的波动日益加剧,一些金融危机事件频繁发生,如1987年的“黑色周末”和亚洲金融危机,这使金融监管机构和广大的投资者对金融资产价值的暴跌变得尤为敏感。金融资产收益率的尖峰、厚尾现象也使传统的正态分布假定受到严重的质疑,因此如何有效地刻画金融资产收益率的尾部特征,给出其渐进分布形式,及各种风险度量模型的准确估计方法和置信区间,依此制定投资策略,确定国家监管制度,成为风险度量和管理所面临的巨大挑战。目前,对金融资产损失的估计方法主要包括历史模拟、参数方法和非参数方法。历史模拟是一种最简单的方法,它利用损失的经验分布来近似真实分布,
2、但是该方法不能对过去观察不到的数据进行外推,更不能捕获金融资产收益序列的波动率聚类现象,而受到大量的批评。参数方法假设收益符合某种特定的分布如:正态分布、t分布等,再通过分布与样本的均值、方差的匹配对参数进行估计,或者是假设收益符合某种特定的过程如:模型、模型,该方法可以在一定程度上解释尖峰后尾现象和波动率聚类问题,具有比较好的整体拟和效果。不过参数方法只能对已经到来的灾难信息给出准确的估计,对于即将到来的灾难信息无法给出准确的预测,因此对极端事件的估计缺乏准确性。非参数方法则主要包括极值理论(EVT),该理论不研究序列的整体分布情况,只关心序列的极值分布情况,利用广义帕累托分布(genera
3、lized Pareto distribution)或者广义极值分布(generalized extreme value distribution)来逼近损失的尾部分布情况。Danielsson and de Vries(1997)以7支美国股票构成的组合为样本比较各种模型的表现情况,发现EVT的表现比参数方法和历史模拟方法明显的好。Longin(2000)认为极值理论的优点在于它的没有假设特定的模型,而是让数据自己去选择,而GARCH模型作为估计风险的一种方法,它只能反映当时的波动率情况,对于没有预期到的变化缺乏准确性。不幸的是,Lee and Saltoglu(2003)把EVT模型应用到
4、5个亚洲股票市场指数上,发现表现令人非常不满意,而传统的方法尽管没有一个在各个市场表现都是绝对优于其它模型的,但都比EVT模型的表现好。本人认为EVT模型之所以在亚洲市场表现不好主要是因为亚洲金融市场的数据具有很强的序列相关和条件异方差现象,不能满足EVT模型要求的独立同分布假定。另外,Jondeau and Rockinger(1999),Rootzen and Kluppelberg(1999),Neftci(2000),Gilli and Kellezi(2003)和Christoffersen and Goncalves(2004)也分别采用极值原理和其他模型对金融数据的尾部特征进行了
5、分析和比较。本章在传统单纯采用极值理论(假设被分析数据是独立同分布的)描述金融资产收益尾部特征的基础上,把ARMA(Asymmetric)GARCH模型和极值理论有机的结合起来。首先利用ARMA(Asymmetric)GARCH模型捕获金融数据中的序列自相关(Correlation)和异方差(Heteroskedasticity)现象,利用GMM估计参数,获得近似独立同分布的残差序列,再采用传统的极值理论对经过ARMA(Asymmetric)GARCH模型筛选处理过的残差进行极值分析,在一定程度上克服了传统单纯采用极值理论时,由于金融数据序列自相关和波动率聚类现象不能满足极值理论假设所造成的估
6、计误差。另外,本章还采用Bootstrap的方法给出了采用极值理论估计出的VaR和ES在某一置信水平下的置信区间改进了采用似然比率法估计置信区间时,由于极值事件的小样本所造成的误差。最后,我们利用中国上证指数自1990年12月19到2004年9月30日的对数日收益率进行实证研究给出上证指数的VaR和ES值,及置信区间。2、VaR和ES的概念:VaR(ValueatRisk)是一种被广泛接受的风险度量工具,2001年的巴塞耳委员会指定VaR模型作为银行标准的风险度量工具。它可以定义为在一定的置信水平下,某一资产或投资组合在未来特定时间内的最大损失,或者说是资产组合收益损失分布函数的分位数点。假设
7、代表某一金融资产的收益,其密度函数为,则VaR可以表示为: (1) 当密度函数为连续函数是也可以写作:,其中称为分为数函数,它被定义为损失分布的反函数。该模型计算简单,在证券组合损失符合正态分布,组合中的证券数量不发生变化时,可以比较有效的控制组合的风险。但是VaR模型只关心超过VaR值的频率,而不关心超过VaR值的损失分布情况,且在处理损失符合非正态分布(如后尾现象)及投资组合发生改变时表现不稳定,会出现 (2)的现象,不满足Artzner(1999)提出了一致性风险度量模型的次可加性。(Expected shortfull)满足Artzner(1999)提出的次可加性、齐次性、单调性、平移
8、不变性条件,是一致性风险度量模型。它的定义如下:在给定的置信水平下,设是描述证券组合损失的随机变量,是其概率分布函数,令,则可以表示为: (3)在损失的密度函数是连续时,可以简单的表示为:。 本章将分别选用这两个模型来度量金融资产的风险,给出在修正过的极值模型下,其估计的方法和置信区间。3. ARMA(Asymmetric)GARCH模型3.1 ARMA(Asymmetric)GARCH模型的性质模型: (4)其中,是期望为0,方差为常数的独立同分布随机变量,模型在可逆的情况下可以表示为。该模型假设的条件期望是可得的,条件方差为常数,通常可以用来解释时间序列的相关性,并可以对时间序列进行的短期
9、预测。但是该模型条件方差为常数的假设,使其无法有效的解释在金融时间序列中经常被观察到的波动率聚类现象,为此,我们需要在模型中进一步引入模型。我们令,其中是期望为0,方差为常数1,的独立同分布随机变量,是在时刻的条件方差。这里我们采用通常使用的最简单的模型,则条件方差可以表示为:,模型也可以表示成平方误的形式: (5)其中,因此模型本质上是平方误的。模型的引入不仅可以捕获到金融时间序列的波动率聚类现象,而且可以在一定程度上改善尖峰后尾现象,因为 (6)其中和分别表示和的峰度,的峰度明显大于等于的峰度。另外,在金融序列中我们还可以明显的观察到,波动率正方向变动与收益率负方向变动的相关性大于与收益率
10、正方向变动的相关性,一种可能的解释是收益率的负方向变动会加大波动幅度。而模型认为收益的正方向变动和负方向变动对波动率变动幅度有着相同的影响,为了捕获金融序列波动率变动的这一不对称性,我们引入需要Glosten et al(1993)提出的非对称模型: (7)其中,在这个模型中我们通过项来捕获收益率的正负变动对波动率变动的不同影响,如果收益率的波动与收益率波动率的变动像我们上面所预期的那样,则。这样我们就得到了ARMA(Asymmetric)GARCH模型 (8)3.2、ARMA(Asymmetric)GARCH模型的参数估计:我们知道在条件正态分布的假设下,可以很容易的利用ARMA(Asymm
11、etric)GARCH模型的似然函数,给出参数向量的估计值,其中,。即使在金融收益率序列残差不满足条件正态分布的情况下,使用正态极大似然估计法,仍然可以得到参数的一致渐进正态非最小方差估计。但是这样我们得到的残差将有很大的误差,而是我们下一步进行EVT尾部估计的输入变量,它的有效性将会直接影响我们整个的估计结果,为此我们必须寻找一个更有效的估计方法。GMM(Generalized Method of Moments)广义矩估计恰好可以满足我们的要求,它不需要假设符合任何分布,只需要的条件矩。在Skoglund(2001)“A simple efficient GMM estimator of
12、GARCH models”给出了该估计方法的计算过程和收敛情况。下面给去估计的步骤:首先,定义一个行向量 和广义向量 ,其中是工具变量,则参数的GMM估计可以通过下式得到: (9)其中是一个恰当的权重矩阵。在Newey and McFadden(1994)中,我们可以知道,有效的GMM估计可以通过另,其中,是Jacobian行列式。把和带入上面的目标函数(9)得到: (10)其中,是一个含有参数的权重矩阵,它的元素可以表示为:其中,通过上面对目标函数(9)的变化,我们得到函数是恰好可识别的,即参数的最优估计是使函数等于0。另外,我们要进行GMM估计还需要一个对参数的初始估计值和对的三阶矩和四阶
13、矩的初始估计值,而这一初始值我们可以通过对ARMA(Asymmetric)GARCH模型残差符合正态分布的情况进行最大似然估计得到。这样我们就可以得到有效的参数估计值和残差序列。4、极值理论极值理论是测量极端市场条件下风险损失的一种方法,它具有超越样本数据的估计能力,并可以准确地描述分布尾部的分位数。它主要包括两类模型:BMM模型(Block Maxima Method)和POT模型(Peaks over Threshold),两类模型的主要区别有:1、极值数据的获取方法上的区别,BMM模型通过对数据进行分组,然后在每个小组中选取最大的一个构成新的极值数据组,并以该数据组进行建模;POT模型则
14、通过事先设定一个阀值,把所有观测到的超过这一阀值的数据构成的数据组,以该数据组作为建模的对象,两个模型的共同点是只考虑尾部的近似表达,而不是对整个分布进行建模。2、两个模型分别采用极值理论中的两个不同的定理作为其理论依据,同时也因为获取极值数据的不同方法导致两个模型分别采用不同的分布来拟合极值数据。3、BMM模型是一种传统的极值分析方法,主要用于处理具有明显季节性数据的极值问题上,POT模型是一种新型的模型,对数据要求的数量比较少,是现在经常使用的一类极值模型。4、BMM模型主要用于对未来一段较长的时间内的VaR和ES预测,而POT则可以进行单步预测,给出在未来一段小的时间内VaR和ES的估计
15、值。5、BMM模型的前提条件是样本独立同分布,POT模型的前提条件是超限发生的时间服从泊松分布,超限彼此相互独立,服从GPD(generalized Pareto distribution)分布,且超限与超限发生的时间相互独立。样本独立同分布可以保证POT模型的前提条件。4.1 BMM模型的理论基础假设表示我们采用BMM方法获得的极值数据组,其中n表示每个子样本的大小,则有下面的极限定理成立定理1:(Fisher and Tippett (1928), Gnedenko (1943))假设是一个独立同分布的随机变量序列,如果存在常数,以及一个非退化的分布函数,使得 成立,则分布函数一定属于下面
16、的三种标准的极值分布: Frechet: Weibull: Gumbel: 从图1可以清楚的Frechet分布用来描述那些极值无上界有下界的分布,Weibull分布用来描述极值分布有上界,无下界的分布,Gumbel分布用来描述极值无上界也无下界的分布。我们通常见到的很多分布函数都可以根据他们尾部的状况划分到上面的三种极值分布分布中去,例如:学生分布、帕累托分布(Pareto distribution)、对数Gamma分布、Cauchy distributed根据尾部特征可以划分到Frechet分布中去;均匀分布和Beta分布的尾部分布可以收敛到Weibull分布;正态分布、Gamma分布和对数
17、正态分布的尾部分布都收敛到Gumbel分布。 图形1:标准Frechet、Weibull和Gumbel分布图但是,在实际应用中对于一个给定得极值序列,我们应该如何在这三种极值分布中做出选择呢。一种理想的方法是通过参数的形式把三种极值分布统一的表示成一个分布函数,这样我们就可以在利用最大似然估计的时候,把该参数也一块估计出来,让数据去决定它们的选择,这将极大的增加模型估计的准去性。这里我们采用 Jenkinson and Mises 的方法,把三种分布表示成如下单参数的形式: (11)其中,这一表达形式也被称为广义极值分布函数(Generalized extreme value distribu
18、tion),当时,表示Frechet分布,当时,表示weibull分布,当时表示Gumbel分布。 在定理1的基础上,对于给定一个金融资产的残差序列,我们就可以首先分组求最大值得到的极值序列记为。为了表达上的简洁,用和代替公式(11)中的和,则可以序列的近似分布函数: (12)其中。然后,我们要对参数进行最大似然估计,这需要得到随机变量的概率密度函数,通过概率分布函数(12)对求导,我们得到随机变量的概率密度函数: (13)其中。通过似然函数就可以得到各参数的估计值: (14)在各参数估计值给定的基础上,我们就可以利用极值分布函数计算不同下的分位数值,如用表示这一分位数,则在个周期内出现的极值
19、收益会超过这一阀值的预期数量有且仅有一次。 表达形式为: (15)注:关于参数的置信区间的确定我们在后面给出其计算方法。4.2 POT模型的理论基础假设序列的分布函数为,定义为随机变量超过门值的条件分布函数,它可以表示为: (16)根据条件概率公式我们可以得到: (17)定理2:(Pickand (1975), Balkema and de Haan (1974))对于一大类分布(几乎包括所有的常用分布)条件超量分布函数,存在一个使得: (12)当时,;当时,。分布函数被称作广义的Pareto分布。图2:广义Pareto分布在,取0.3,0,-0.3的图形从图形上我们可以看到的不同取值确定了尾
20、部的厚度,越大则尾部越厚,越小尾部越薄,从函数我们还可以得到当时,的最大取值为,有上界。Lee and Saltoglu(2003)在金融资产收益时间序列上直接使用EVT时,由于序列的尖峰后尾,使得确定出来的一定是大于零的,但是在我们的模型中,我们对残差序列进行极值分析,因此我们得到的不一定大于零。根据公式(12)我们可以得到广义的Pareto分布的概率密度函数:因此对于给定的一个样本,对数似然函数可以表示为: (13)在POT模型中另一个重要的问题,那就是如何确定我们定理2中的阀值,它的确定非常重要,它是正确估计参数和的前提。如果阀值选取的过高,会导致超额数据量太少,使估计出来的参数方差很大
21、;如果阀值选取的过低,则不能保证超量分布的收敛性,使估计产生大的偏差。Danielsson et al(1997)、de Vries(1997)和Dupuis(1998)给出了对阀值的估计方法,一般有两种:一是根据Hill图,令表示独立同分布的顺序统计量。尾部指数的Hill统计量定义为:Hill图定义为点构成的曲线,选取Hill图形中尾部指数的稳定区域的起始点的横坐标K所对应的数据作为阀值。二是根据样本的超额限望图,令,样本的超限期望函数定义为: (14)超限期望图为点构成的曲线,选取充分大的作为阀值,它使得当时为近似线性函数。另外,如果超限期望图当时是向上倾斜的,说明数据遵循形状参数为正的G
22、PD分布,如果超限期望图当时是向上倾斜的,说明数据来源于尾部较短的分布,如果如果超限期望图当时是水平的,则说明该数据来源于指数分布。这一判断方法是根据广义Pareto分布在参数的时候,它超限期望函数是一个线性函数。 (15)注:因为对于广义Pareto分布只存在阶矩,如果则存在一阶矩,否则一阶矩将不存在,就没有办法计算超限期望函数。当确定以后,;利用的观测值,根据公式(13)进行最大似然估计得到和。同时,我们得到的观测值中比阀值大的个数,记为,根据公式(17)用频率代替的值,可以得到在时的表达式: (16)对于给定某个置信水平,可以由的分布函数公式(15)可以得到: (17)根据GPD的条件分
23、布函数公式(15)可以得到: (18)4.3 序列的和置信区间的估计方法:通常,对于参数置信区间的估计方法,在大样本的情况下我们可以从似然比率检验(Likelihood Ratio Test)的思路中获到。似然比率检验用来检验两个同类型模型的拟和程度的好坏。两个同类型模型的似然比率符合分布,它的自由度等于复杂模型中新加入的参数的个数。以POT模型为例,要估计参数和在给定置信水平下的置信区间可以通过下式得到:其中,和为估计的最优值,表示似然函数。这样我们就得到了和的联合置信区间,如果我们希望得到的估计值,则可以根据公式(17)反解出带入公式(13)得到,令,的置信区间可以通过下式得到:但是,于超
24、过阀值的极值数据量不会很多,使的这一估计的渐进效果可能不佳。为此,我们引入Bootstrap方法来获得置信区间的估计。既然我们得到的序列时独立同分布,就可以每次独立从中抽取个点组成新的序列,用该序列估计和,重复这一操作,就可以得到一系列的和估计值,求出和的经验分布,最后根据经验分布得到和的置信区间,并把和的期望值作为和的估计值。我们在这里只给出了POT模型中置信区间的求法,其他参数的置信区间可以类似的求得。该方法在确定置信区间的同时,也是一种检验模型稳定性的方法。5、实证分析 我们采用上海证券交易所公布的日收益综合指数为原始数据(数据来源:大智慧),样本空间选自1990年12月19日-2004
25、年9月30日。样本容量为3391个(使用Eviews和Matlab软件)。我们定义收益为。我们的实证过程分为四步,(1)用ARMA(Asymmetric)GARCH模型对收益序列进行过虑得到近似独立同分布的残差序列;(2)用极值理论对这一残差进行分析,给出其渐进分布,并估计出相应的和值。(3)比较用似然比率和用Bootstrap方法给出和值的置信区间的估计。(4)整合第一步和第二步的结果,计算收益的和值。(5)利用BMM模型估计值。5.1 ARMA(Asymmetric)GARCH模型形式和参数的确定首先给出收益序列的描述性统计量(图1),可以看到序列具有明显的尖峰后尾现象,从JB检验可以显著
26、的拒绝正态性假设。对收益序列进行单位根ADF检验(见表1),因为检验的统计量是,比显著性水平为1的临界值还小,所以拒绝原假设,序列不存在单位根,是平稳序列。图1:收益序列的描述性统计量ADF Test Statistic-23.64516 1% Critical Value*-3.4354 5% Critical Value-2.8629 10% Critical Value-2.5675*MacKinnon critical values for rejection of hypothesis of a unit root.表1:序列的单位根检验可以进一步分析数据的自相关和偏相关(见表2)现
27、象,发现滞后10期,在99的置信水平下都不能拒绝没有自相关和偏相关的原假设,为此可以认为收益序列中不存在ARMA现象。这样,我们就可以直接用序列对常数项作最小二乘回归得到残差项,然后对残差序列进行ARCH效应的LM检验(见表3),发现当取比较大的值时的相伴概率仍然有,小于显著水平,拒绝原假设,残差序列存在高阶ARCH效应,即有GARCH效应。表2:样本数据的自相关和偏相关表ARCH Test:F-statistic1.986141 Probability0.044340Obs*R-squared15.85684 Probability0.044476表3:ARCH效应的LM统计量检验根据上面的
28、分析,我们可以确定在第一步中所采用的模型公式(19),并对其进行正态最大似然估计(见表4)。 (19)CoefficientStd. Errorz-StatisticProb. C9.43E-059.03E-051.0442060.2964 Variance EquationC1.47E-061.06E-0713.956390.0000ARCH(1)0.4797340.01034546.372400.0000(RESID0)*ARCH(1)-0.1338430.016456-8.1335990.0000GARCH(1)0.7231520.005243137.91590.0000表4:公式(19
29、)最大似然估计的结果从表中可以看到,正如我们所预见的那样,预测不到收益的负方向变动可以导致更大的波动率出现,正方向变动会使波动率下降。和都大于零表明过去时刻的波动对未来价格波动有着正向缓解作用,从而可以有效的解释了波动率的聚类性现象。下面我们以最大似然估计的结果为初始值按照前面所介绍的方法进行GMM估计,其结果如下表:最大似然估计1.47E-060.479734-0.1338430.7231529.43E-050.0027GMM估计4.68E-080.65088-0.473330.772548.33E-041.90E-06表5:最大似然估计和GMM估计比较在GMM估计值与最大似然估计值的比较中
30、,我们可以清楚的看到,GMM估计明显的增加了非对称项系数的绝对值,使收益的正负向变动对波动率表动的不同影响更加明显。另外,在最大似然估计中,这意味不存在有限的方差,而在GMM估计中,保证了的方差有限性。GMM估计在没有分布的情况下给出了参数的取值,并有效的降低了目标函数的取值。把GMM估计值代入公式(19),由收益序列得到残差序列(见图2),从图像上可以看出序列变的更平稳,波动率聚类现象明显下降,更接近于独立同分布。对其进行一阶,二阶自相关和偏相关性检验和LjungBox检验,结果都在很高的水平上拒绝原假设,表示残差序列以没有ARMA现象和条件异方差现象。图2:收益序列R和残差序列ARCH T
31、est:F-statistic2.75E-05 Probability0.995818Obs*R-squared2.75E-05 Probability0.995817表6:序列的ARCH检验5.2 POT模型的应用基于极值理论中POT模型,我们需要利用充分大的阀值,对超限分布进行GPD拟合,根据公式(14),得到超限期望图(见图3)。发现样本的平均超限函数图在时近似直线,具有明显的Pareto分布特征。当时数据超过阀值的个数;当时;当时,我们的总样本个数,在允许的情况下选取10左右的数据(DuMouchel(1983)作为极值数据组是比较合适的选择,否则可能不能抓住序列尾部分布的特征,样本内
32、过度拟合,样本外不适用。为此,我们分别给出阀值取0.8,0.9的情况下,利用最大似然估计得到各参数、的取值和95的置信区间(见表7),以及在这些参数下的QQ图和分布图(见图4和图五),从图形中我们可以看到极值分布有效拟合了我们的样本分布,只有个别地方出现异常现象。且在和两种情况下的拟合效果没有明显的区别,为此在后面我们只给出时的图形。 下界0.150.331.822.460.160.321.812.46估计值0.2290.3671.9672.7910.2540.3731.9582.818上界0.340.422.153.390.380.432.143.50区间长度0.190.090.330.93
33、0.160.110.231.04表7:参数的最大似然估计和95置信区间 图3:序列的超限期望图 图4:和时的QQ图图5:和极值分布与经验分布的比较对于的估计 Embrechets(1999)认为金融序列的的取值范围在3到4之间,而我们这里计算出来的,几乎不落在的区域内,这主要是因为我们对金融序列用ARMA(Asymmetric)GARCH模型进行了过滤,得到的序列在一定程度上消除了的尖峰后尾现象,使得估计出来的值偏小,这与Embrechets的结论并不矛盾。另外在QQ图中,我们可以看到在0.99的分为数之前拟合效果非常好,在后面出现了个别的异常值,这不会影响我们对的估计,因为只关心0.99分为
34、数之前的分布情况,而不受到0.99分为数之后分布情况的影响。但是的估计由于受到0.99分为数之后分布情况的影响,所以这会对的估计造成一定的误差,这也是为什么我们在表7中看到的95估计区间明显比的95估计区间要宽的原因之一。下面我们采用Bootstrap的方法来确定各参数的置信区间,首先在序列中进行3390次重复抽取得到一个包含3390个数据的新样本,利用这些新样本估计、和取值,重复上述1000次,则得到四个估计序列,其中每个序列中包含了1000关于某个参数的估计值,我们把他看作是一个样本,把这些样本与前面估计出来的参数区间相比较,如图6左其中方形区域是、单参数确定的95置信区间,椭圆形区域是、
35、的95联合置信区间,图形中的散点表示每次估计出来的、的值构成的点。从图形中我们可以看到大概有5的点落在了95的联合置信区间的外面,但是当我们考虑单参数置信区间时发现在区域以外的点大大超过了5,这表明单参数估计的置信区间存在一定的问题,类似的现象我们还可以在和的估计中(见图6右)看到,联合置信区间比较准确的捕获了数据的特性,单参数置信区间的表示方法就有较大的误差。图6:单参数和联合置信区间,以及bootstrap的估计点图7:Bootstrap方法得到的、和的经验分布图另外,从四个参数估计序列我们可以得到四个参数的经验分布(见图7),通过线性插值的方法得到参数的估计值和95的置信区间(见表8),
36、用Bootstrap方法估计的置信区间明显比最大似然估计得到的置信区间要宽,这可能是因为我们的样本与广义Pareto分布并不是完全符合,且样本数量有限,最大似然估计的估计值是无偏的,但不是最小方差的,造成的估计的误差,但是两种方法估计出来的参数值比较接近,特别是对和的估计的误差都在以上,没有明显的差别,只需要对使用似然比率计算出的置信区间坐适当的调整。 下界0.0890.3181.8062.3720.0850.3151.7892.348估计值0.2220.3701.9662.7910.2420.3771.9552.816上界0.3510.4282.1443.3290.3860.4482.134
37、3.379区间长度0.2620.110.3380.9570.3010.1330.3431.031表8:参数的Bootstrap估计和95置信区间有了前面的结果,我们就可以把两个模型结合起来计算收益的和。首先,根据公式(19)和第一步中估计出的ARMA(Asymmetric)GARCH模型中的参数计算时刻的波动率,然后把的、的值和95的上下界代入就可以得到收益的和的值和95的上下界(见表9):0.01397 下界1.8062.3720.0243970.0323041.7892.3480.0241590.03197估计值1.9662.7910.0266320.0381571.9552.8160.0
38、264780.03851上界2.1443.3290.0291190.0456732.1343.3790.0289790.04637区间长度0.3380.9570.0038890.0125360.3431.0310.0039590.01357未经ARMA(Asymmetric)GARCH模型调整估计出来的和下界估计值上界下界估计值上界2.833.0793.143.854.4035.49表9:残差序列和收益序列的和比较上面计算出来的和值,我们发现ARMA(Asymmetric)GARCH模型调整估计出来的和比未经调整估计出来的值明显偏小,是因为在1992年到1994年间中国的股市处于起步阶段,监督
39、力度不够,市场波动幅度比较大,也使的未经调整的超限收益主要发生再1995年以前(见图2),并没有考虑到在1996年以后证券市场进一步规范化,股市超限收益波动减小,应该对和进行相应的调整,而数据调整过的极值预测,可以有效的考虑到这一因素所造成的影响,使得对未来的估计更多的考虑到现在的市场风险,更准确估计市场现在的风险。5.3 BMM模型的应用 首先我们把经过过滤的数据按照季度进行分组,共包括56个季度,在每个季度中选取最大的观测值构成一个极值样本。根据定理1可知,这个极值样本符合广义极值分布。图8:序列每季度的最大值和最小值我们知道一年平均有252个交易日,每个季度有63个交易日,如果一个事件在100天内出现一次,且该事件是独立同分布的,则这一事件在每天出现的概率为0.01。我们使用BMM模型计算出来的表示在个周期内出现的收益会超过它的预期数量为1,所以要计算只需取,利用最大似然估计得到参数的估计值为,其中用似然比率函数估计的95的置信区间为,在根据就可以得到收益的,它的95的置信区间为。 与POT模型估计出的相比较,会发现BMM模型的估计值偏小,