《第六章:收益率曲线的拟合技术.doc》由会员分享,可在线阅读,更多相关《第六章:收益率曲线的拟合技术.doc(21页珍藏版)》请在三一办公上搜索。
1、第六章 收益率曲线的拟合技术关于利率期限结构的研究,在整个债券投资分析的理论和方法中居于最核心的地位。准确地获得当前市场的利率期限结构信息,对估计当前利率形势,定价未来现金流,以及债券衍生物的定价和研究都有重要的作用。可以这样说:如果没有期限结构信息,债券分析师就无从对债券市场和个别品种进行有效研究。构成利率期限结构的基础是即期利率曲线。通常,即期利率曲线的完整形态和数据是可以准确地通过市场数据中导出的。这个过程有时候被称为“收益率曲线的提取”(Yield Curve Extraction)。由于这个“提取”过程的关键在于能够有效地建立收益率曲线的参数模型,而其具体应用中有时也会借助于一些工程
2、应用中的曲线拟合方法,因此本章的核心内容即是主要关于收益率曲线参数模型和具体的一些应用拟合方法的探讨。在国外成熟的债券市场上,关于“收益率曲线的提取”的理论和技术已经相当完善,其市场的程度成熟和理性程度较高,这降低了不同的参数模型和拟合方法对最终拟合结果的影响。因此,在国外的一些关于固定收益证券理论的书籍和文献上,对收益率曲线拟合的问题都泛泛带过,或者叙述得相当简略。但对于中国债券市场来讲,无论是市场本身,还是针对市场的研究方法和理论都还很不成熟。国内研究人员往往直接采用一些分析软件上的收益率曲线数据,而不是自己去尝试建立参数模型进行拟合。而且,人为地将市场割裂成交易所和银行间两个交易制度和参
3、与主体都不尽相同的市场,也给准确地拟合合理的收益率曲线增加了难度。因此,本章的内容将着重介绍这些通常被忽视的理论和方法,包括如何从当前的市场上的债券(对于国内市场来说,主要是固定息票的国债)数据,来获得当前市场的即期利率曲线。本章将着重介绍几种最常被使用的方法:Nelson-Siegel-Svensson方法、三次多项式样条法和三次指数样条法,以及拟合中的一些理论和应用问题,如目标函数的设定和异方差问题的处理。最后,在本章的附录中,我们将比较这些方法在中国国债交易所市场的应用效果和优缺点。6-1一般方法息票债券的理论价格和定价误差在第五章中,我们已经提及了对于固定息票债券的定价方法,其前提是我
4、们已知了即期利率曲线,而相应地,我们也可以导出瞬间远期利率曲线。对于每一笔确定性的,发生在未来时点t的远期现金流CF,我们有其现值 (6-1)其中,S (t)为t时点的年计连续复利的即期利率水平,finst (t)为瞬间远期利率函数。类似地,我们也定义固定息票债券的理论价格为其所有的内含远期现金流的现值加总(我们不区分具体的远期现金流是利率或本金): (6-2)当然,在真实的交易环境(包含交易成本和税费支出)下,(6-2)中的固息债券理论价格只能是一个近似的定价水平。此外,这里的理论价格也没有考虑债券交易的流动性问题。但我们的目的并不是给债券定价,而是要从考察当前的收益率曲线。假设当前市场上的
5、债券品种(或我们选取的债券样本)为集合,N为样本债券总数。我们以来表示市场上债券品种i的有效交易价格,为债券品种i的理论价格,则我们有 (6-3)为对应债券品种i的定价误差。对于整个样本集合,我们可以将(6-3)写作向量(即N1维矩阵)形式,有 (6-4)这样,我们就有了总体债券样本的定价误差向量,接下来的内容中,我们将经常会用到这个关键的向量,并基于定价误差最小化的原则来建立我们的收益率曲线拟合方法。一般方法我们这里所提到的“一般方法”,实际上就是前面所讲到的收益率曲线拟合方法的基本原理。原则上来将,一般方法包含的原理可以适用于各种参数模型。事实上,本章节中介绍的收益率曲线拟合方法是一种所谓
6、“间接”方法。在许多文献中也提到“直接”的方法,即不考虑理论价格和实际价格间的误差,而是直接将所有远期现金流样本所对应的贴现率直接作为即期利率曲线的基础。这些贴现率在收益率-期限的两维平面上是一系列离散的点,可以通过内插法把它们连成一条曲线,这就是直接从市场。然而,这种方法在应用中实际上是不可行的。如果样本仅有零息债券,那么每一笔远期现金流都有可观察到的实际市场价格与其对应。但如果我们的债券样本中包含息票债券的话,情况就复杂得多(注*:对于一组息票债券来说,其市场价格向量为全部现金流组成的矩阵F和贴现率向量B的乘积,即P = FB。显然,如果我们要根据P和F求出B,则必须要求矩阵F非奇异,即所
7、有的样本债券现金流都相互线性无关,这很可能导致我们不能将某些债券纳入总体样本中,因此收益率曲线无法代表整个市场的信息)。此外,这样获得的收益率曲线也不会是一条很平滑的曲线。因为这样的原因,通常研究人员都会采取“间接”的方法来获得收益率曲线。所谓“间接”方法就是先假设收益率曲线近似符合某些包含有自由参数的参数模型,并且约定一个与自由参数有关的目标函数。然后在现有市场数据的基础上,估计和调整函数中自由参数,使其令目标函数达到或接近优化目标。这样,我们将获得自由参数的“最优值”代入最初的期限结构参数模型,就可以获得收益率曲线的结果。这个最优化的过程就是我们“拟合”收益率曲线的过程。这样的方法有许多好
8、处,它可以包含所有必要的市场债券品种,而且确保我们的收益率曲线是平滑的曲线。但这种一般方法代价的是较高的模型风险,即研究人员必须合理地选择适用的期限结构参数模型,如果模型本身不恰当,或者根本就选取了错误的模型,那最终的输出结果可能是灾难性的,所以本章将会使用大部分的篇幅来讨论具体的参数模型。收益率曲线拟合的一般方法,通常是设定一个参数模型,这个模型可能是直接体现为一个即期利率关于到期期限t的函数,我们记为,其中,为自由参数向量。另外一种形式为建立贴现率关于到期期限t的函数,我们计为,而读者在上一章已经了解,年计连续复利的即期利率和贴现率之间使可以相互换算的,可表示为 (6-5)所以,这两种形式
9、的期限结构参数模型本质上是一样的。使用贴现率的函数往往是出于方便于表达的考虑。在上一小节中,我们已经知道了关于定价误差的定义。对于理想的即期利率曲线来说,通常要求使整个债券样本的总体定价误差最小,也就是说,如果我们考虑样本的定价误差(列)向量,显然有。而对于自由参数向量来说,其最优估计量应满足使 (6-6)成立。(6-6)这就是我们优化的目标函数。如果按前述的式(6-4),我们实际上是要求理论价格和市场价格间的“绝对定价误差”最小化,这也就是说,应满足使(6-7)成立。我们注意(6-6)和(6-7)式,这样的目标函数形式和我们熟知的最小二乘法(Ordinary Least Squares) 的
10、目标函数是一致的。事实上,对于某些仅包含线性参数的期限结构模型,直接使用最小二乘法的结果使可以求出自由参数向量的最优解的。即,k维参数向量是函数关于(残差平方和最小化)的最小二乘估计量。根据最小二乘原理进行多元线性回归,线性参数最小二乘估计量的解析解为 (6-8)在(6-8)式中,P是可观察到的N个样本债券在同一时点的市场价格组成的N维向量。我们需要注意的一点是,Nk维的数据矩阵X的取值是和具体的模型设定有关的。在本章的多项式样条法一节里,我们还会具体讨论数据矩阵X的设定。当然,这样的在最小二乘法(OLS)下的解是可能存在很多问题的,因为我们的期限结构模型设定违反了最小二乘法的一些古典假定。此
11、外,有些形式的期限结构模型是没有最小二乘估计量的解析解的。关于这些问题,也会在后面的内容中具体讨论。最后,关于债券样本的选取,最好选择“同质”的一组固定息票或零息债券,也就是说,如果选取的债券样本不具有相同的信用等级,则它们之间会存在因信用风险息差。而对于含有内置期权的债券也存在类似的问题。不过在国内的债券市场上,我们通常最关心的是固息国债收益率曲线,所以债券样本选取的问题会简单一些。6-2Nelson-Siegel-Svensson模型Nelson-Siegel模型让我们开始来关注一下具体的期限结构参数模型。Nelson-Siegel模型是一种简单而且有效的参数模型,最早在1987年在一篇论
12、文中被Charles Nelson和Andrew Siegel提出。它是通过建立现金流的起息和支付时间(两者差即期限)对瞬间远期利率的一个较为简单的函数表达形式。我们在上一章中曾经提到过远期时点t的瞬间远期利率是连续复利的即期利率曲线关于t的偏导数 (6-9)(6-9)和(5-23)的含义是一致的。不过由于在对收益率曲线拟合时,我们只需考虑当前的即期利率曲线,因此(6-9)的瞬间远期利率计算时点就是即刻。Nelson和Siegel在论文中推导出了一个的瞬间远期利率的函数表达式,其形式如下 (6-10)而有了瞬间远期利率的函数表达式,我们就可以相应地获得即期利率的函数表达式,因为即期利率,我们求
13、(6-10)的积分,得出 (6-11)在式(6-10)和(6-11)中,我们需要估计四个自由参数,它们是、 和。这四个参数都是有真实的经济意义的,具体分别为: 是一个正数,它表示瞬间远期利率曲线的水平渐近线,随着TTM的增大, 的曲线应趋向于的值。 是瞬间远期利率曲线在初始位置(或短期)和渐近线的背离值,它也包含了瞬间远期利率曲线向水平渐进线的趋近速度的因素。若它是一个正数,则瞬间远期利率曲线是随着期限的增大而上升的,反之则瞬间远期利率曲线随着期限的增大而下降。 是一个正数,它与瞬间远期利率曲线的横坐标(期限)相对应,标志了远期利率曲线的极值点出现的位置。 则决定了瞬间远期利率曲线极值点的性质
14、和曲度。若是一个正数,则曲线是上凸的,反之则曲线是上凹的。图6-1为以Nelsen-Siegel方法拟合的中国国债银行间市场期限结构。我们由上面对自由参数的经济意义的介绍内容以及图6-1可以发现,显然我们可以看出,Nelson-Siegel提供的方程只能描绘形状较为简单的收益率曲线,瞬间远期利率只能有一个极值点,这就使得实际上经常出现的马鞍形或其他一些更复杂的收益率曲线形态无法准确地被表达。此外,单调的收益率曲线也造成了整体定价误差和模型风险的增加。图6-1Svensson的扩展模型为了弥补Nelson-Siegel模型的这一缺陷,Svensson(1994)提出了一个对Nelson-Sieg
15、el方程的扩展形式,在这个扩展形式中,瞬间远期利率为 (6-12)由(6-12),我们可以得出Svensson扩展模型的即期利率参数模型为 (6-13)Svensson扩展模型中,比Nelson-Siegel模型的基础方程又多出了一个关于瞬间远期利率的修正项,以及两个新的自由参数 和。这个增加的修正项可以使瞬间远期利率曲线表现出更为复杂的形态。类似Nelson-Siegel基础模型的自由参数,和分别描述了瞬间远期利率曲线的第二个极值点的曲度和出现的位置。这样,Svensson扩展模型事实上已经可以描绘大多数形态的收益率曲线了。图6-2是以Svensson模型拟合的2002年12月26日中国国债
16、交易所市场期限结构。图6-2Nelson-Siegel-Svensson扩展模型具有很多应用上的优点,它仅有6个自由参数(注*:与具有类似性质的其他一些“动态”模型相比,Svensson模型的自由参数数目的确是可接受的),而这个较为简洁的模型却同时具备了相当强的灵活性,而且在整个模型框架内,每个自由参数都被赋予了很明确的经济意义。有时候,研究人员甚至可以直接通过这些参数的估计结果来判断整个收益率曲线的拟合效果。这一点在实际应用中带来的好处是非常明显的。此外,在整个模型中的全部6个自由参数都仅仅依赖于现实的市场数据,而不需要我们去考虑设定某些参数(注*:在有些文献中称参数是需要设定的,这实际上是
17、指需要设定其进行优化前的初值而并非终值,因为瞬间远期利率曲线形态必须完全通过市场数据去获知),因而模型风险被大大地降低了。Nelson-Siegel参数模型和Svensson扩展模型的另一个特点在于:关于瞬间远期利率的参数方程中包含有非线性的自由参数。在这种情况下,6-1节中自由参数向量(就是前述的六个自由参数组成的列向量)是没有办法直接获得解析解的,我们必须通过牛顿迭代方法之类的最优化方法来获得参数向量的最优解。在迭代过程中,需要我们根据目标函数(6-7),将每一次的即期利率函数转化成为债券样本的理论价格,然后考察总体定价误差(理论价-市场价的残差平方和项),直到获得满意的优化结果。如图6-
18、3所示。图6-3 以Nelson-Siegel-Svensson方法进行参数优化,获得期限结构函数参数向量瞬间远期利率 finst (t;)即期利率 S (t;)通过迭代方法进行反复优化贴现函数 B (t )目标函数由贴现函数和样本债券导出定价误差样本债券现金流矩阵当然,进行非线性优化前需要对自由参数向量预设初值。David Bolder和David Streliski(1999)的研究指出,Nelson-Siegel基础模型对于参数初值是较为敏感的,即自由参数向量的初值设定不同会引至最终优化结果的一定差异,这也是对Nelson-Siegel方法批评最多的一点。但Svensson扩展模型由于包
19、含了修正项而更具灵活性,因此对于参数初值的敏感性较低,在绝大多数情况下,Svensson扩展模型的初值设定对最终拟合结果的影响并不太大。实际上,任何包含非线性参数的期限结构模型都存在上述这种初值设定的问题,包括本章接下来要介绍的指数样条方法。而要深入研究这方面的问题,事实上属于最优化理论和数值方法的研究范畴。基本上,我们认为Nelson-Siegel-Svensson扩展模型在这方面的问题还并不算严重,毕竟它要求参与优化的参数不多,而且根据它们的经济意义,初值的设定也不太困难。由于其模型具有良好的实用效果,Nelson-Siegel-Svensson方法在90年代中后期在世界范围内得到了广泛的
20、使用。目前,已经有瑞典、法国和加拿大等国家的中央银行使用Svensson扩展模型来计算并公布其政府债券的收益率曲线。特别值得一提的是,Nelson-Siegel-Svensson方法是比较适合类似中国国债交易所市场这种交易品种不太多,而且自身也不是非常成熟的市场的。6-2多项式样条方法多项式样条函数样条方法(Splines Approach)是一种广为人知的曲线拟合方法。而在对收益率曲线拟合的诸多方法中,样条方法也是被应用得最广泛的一种方法。它通过构造高阶多项式或指数分段函数的方法来拟和收益率曲线。由于这类函数具有连续、可积、高阶可导等良好的性质,因此往往可以较好地表现收益率曲线形态。同Nel
21、son-Siegel方法原理一样,样条法也需要先假设具体的函数形式,然后估计函数中自由参数的最优值。但和通常Nelson-Siegel直接给出瞬间远期利率关于计算时点的方程不同的是,样条方法是将与即期利率曲线对应的即期贴现率函数B(t)作为参数模型。通常,这个参数模型是一个关于到期期限t的二次或三次多项式,我们称之为样条函数(Splines Function)。考虑到仅仅依赖一个三次多项式也并不能很好地描述形态复杂的收益率曲线,一般来说样条函数是一个分段函数,为了收益率曲线光滑而且连续,样条函数在分段点必需连续且可导(注*:对于三次多项式样条函数来说,我们一般要求其在分段点上二阶可导)。MoC
22、ulloch(1975)最先提出了贴现函数B(t)的三次多项式样条函数一般形式,如下: (6-14)对于即期贴现率函数B(t)来说,显然有B (0) = 1。此外,为了要满足贴现函数在整个定义域内连续且一、二阶可导,还需要满足如下约束条件: (6-15)其中i 为上式中分段点的序数,和分别表示贴现率函数的一阶和二阶导数。相对于Nelsen Siegel方法的复杂之处在于,我们在以多项式样条法进行拟合时,存在一个参数矩阵需要估计。函数分段点越多,需要估计的参数越多。对于三次多项式样条法来说,每段分段函数就需要有四个自由参数。如果我们将整个收益率曲线的拟合区间分为三段,就有34 = 12个自由参数
23、。不过,由于多项式样条法还是一个线性回归模型(其需要估计的自由参数对贴现率函数的影响都是线性的),因此,我们可以直接应用最小二乘法的对线性回归模型的估计结果求自由参数,而不必担心过多的参数会导致优化过程消耗太长时间。利用最小二乘法计算参数的解析解以上面的三次多项式样条函数作为一个例子,对于每一个样条分段函数,我们有一个自由参数的列向量为那么,由(6-14),贴现函数B (t) 应当为 (6-16)而对于整个债券样本的市场价格观测值向量,这个多元线性回归模型为 (6-17)我们关键要考虑如何从市场数据中取得N4维的数据矩阵X。我们可以知道每只固息债券的现金流状况,即其数量和发生时间,那么,由(6
24、-16),我们可以将(6-17)变换为 (6-18)上式中,我们将所有的债券远期现金流数量都映射到矩阵上,而所有的现金流发生时间都映射到矩阵上。注意一点,由于t1 tm包含了债券样本所有的远期现金流的发生时间,因此对应的现金流矩阵CF必然是一个“稀疏”的矩阵,也就是说,对于每一只债券对应的现金流向量(表现为CF的每一个行向量),是对应整个债券样本的现金流的。在实际生成CF矩阵时非常简单,我们只需要把每一行向量中与本行对应的那只债券无关的现金流计为0即可了。这样,我们事实上已经有了数据矩阵X,即 (6-19)直接利用最小二乘正则方程组的解,我们就可以求出自由参数向量的最小二乘估计量了。当然,对于
25、分段的样条函数来说,我们还要在分段点上连续和可导的约束条件。一种简单的处理办法是考虑改变现金流的时间映射矩阵T,例如,如果我们取两个样条分段函数,唯一的分段点取值在t =,可考虑对T和的形式作如下改变: (6-20)上式中,。这样,我们就可以将两个分段的样条函数写入同一个正则方程组中。而分段函数连续同时一阶和二阶可导的约束条件为 (6-21)为了求出正则方程组的解析解,我们将(6-21)变为的矩阵形式。即 (6-22)约束条件矩阵R为 (6-23) 而在约束的下的最小二乘估计量为 (6-24)其中,是无约束条件下求出的自由参数估计量。上述方法看似繁琐,特别是分段点越多,(6-20)和(6-23
26、)中的矩阵就会变得愈发庞大。但在应用处理中,我们通常是以Matlab等数学工具软件对收益率曲线进行拟合的,因此上述过程可以通过编程完成。而且,直接求最优估计量的解析解比迭代优化方法在运行时速度快得多。如果我们采用迭代算法,而且设置的样条函数分段点较多时,自由参数数目的增加将会造成处理时间的几何增长。当自由参数的数目超过12个时(也就是取3段以上的分段函数时),即使以目前的硬件处理速度,迭代优化所需要的时间也是比较长的。虽然在MoCulloch的三次多项式样条法在80年代的华尔街是一种流行的收益率拟合方法,但它也遭受了许多批评。作为一种关于贴现率的参数模型,多项式样条法的缺点主要在于:1、 需要
27、足够的市场数据(债券样本)作为拟合的基础数据,否则只能减少函数分段数量,导致拟合质量下降(例如,在缺乏长期债券的市场,比如中国的国债市场上,三次多项式样条法对20年以上长期利率的拟合结果明显不合理)。2、 而在有足够样本数据的情况,对分段点数量的选择也需谨慎,否则很容易出现“过度拟合”的情况。有时候,甚至会出现“扭动的”或“摆动的”收益率曲线。3、 多项式样条法的参数基本上没有经济意义,因此无法根据这些参数获得关于收益率曲线的经济信息(这也是多项式样条法相比Nelson-Siegel-Svensson方法这类参数模型的重要不足之处)。对于多项式样条法的收益率出现的扭动和摆动(特别是在远端)问题
28、,许多学者提出,应对多项式样条法的目标函数加入一个惩罚函数(Roughness Penalty)来进行修正。典型的一种惩罚函数如Fisher(1995),Fisher提出的修正的目标函数形式如下: (6-25)其中,为瞬间远期利率曲线,而常数的取值需使成立。其中,N为集合中的债券数量,RSS () 为理论价格和实际价格的残差方差和(实际上就是最早的未经调整过的目标函数),ep() 为有效参数的数目,为参数调整的成本,在Fisher的方法中取为2。针对应用中的批评,多项式样条方法也在不断改进中。对三次多项式函数的“惩罚函数”修正就是其中之一,但这类方法使模型变得复杂而臃肿,使用中也存在很多问题。
29、例如惩罚函数修正虽然避免了收益率曲线的摆动,但它也使曲线变得僵硬(注*:特别是修正常数取值过大时)。6-3指数样条法三次指数样条函数在多项式样条函数的基础上,Vasicek和Fong (1982) 提出的三次指数样条函数得到了为广泛的认同,因为它选取了自然对数底e关于时间t的幂作为表达贴现函数的基础,这样能够更好地反映资产在经过(关于时间的)连续复利后的增长。三次指数样条法的贴现函数的有如下的形式 (6-26)在样条函数所具有的一般性质和服从的约束条件上,指数样条函数和多项式样条函数并无不同。对于三次指数样条函数来说,通常的约束条件为分段函数在分段点上连续和一阶、二阶可导。自由参数u但值得注意
30、的是,指数样条函数比多项式样条函数多包含一个参数u,实际上可以证明 (6-27)也就是说,u是一个具有明确经济意义的参数。它是前述的瞬间远期利率在即期计算的、发生时点趋向于无限远时的极限值。有了这样一个重要的参数,在我们研究最终样条函数的优化结果时,可以通过u的最终值来估计拟合结果是否合理,这也是指数样条法得到广泛欢迎的原因。但这个参数也带来了很大的麻烦,由于u在模型中是一个非线性参数,因此我们无法通过最小二乘法正则方程组得出关于自由参数的估计值,而必须通过迭代优化方法来进行最优估计。这就带来了一个两难的问题,我们如果取分段点过多,那么自由参数的数量也会相应增加。但有的时候,为了拟合的准确性,
31、我们又必须选取较多的分段点,所以研究人员必须在拟合的准确性和速度之间寻找一个平衡点。比对多项式函数进行迭代更麻烦的是,指数样条函数需要非线性优化,其目标函数收敛速度要慢得多。在计算机硬件运算速度远远无法和现在相比的80年代,研究人员们通常估计一个u的值(例如5%),然后将它作为一个常数代入模型,这样指数样条函数就变成了一个线性回归模型。即使失去了一个最重要的自由参数,指数样条法的表现还是要优于多项式样条法。另一种折衷的方法是直接利用约束条件来化简(6-26)式,这样可以约去一部分自由参数。化简的好处不仅仅是减少了参数,甚至连约束条件也包含在化简后的样条函数中了。这样的办法在处理有3个以下分段点
32、的样条函数的时候还是很实用的。分段点的选择样条函数分段点的选取并不是越多越好。虽然理论上来说,分段越多则最后的拟合结果越精确,但这也需要有足够的样本才可以。此外,考虑到避免“过度拟合(Over Fitting)”的问题,因此每个分段区间包含的债券样本不宜少于3只。Priaulet(1997)认为,样条分段点数目的选取应使样本债券的平均定价误差小于一个具体标准。Priaulet选取“平均定价标准差”作为衡量定价误差的依据,即 (6-28)(注*:这里的定价标准差,实际上没有考虑有关自由度的问题,不过我们通常并不是要把期限结构模型作为一个经济模型来研究,而是侧重于研究样本债券和收益率曲线的关系,因
33、此Priaulet的方法从实用的角度上看是较为恰当的)Priaulet认为,定价标准差小于0.15%则说明样条分段点数目是合理的。但他的研究基础是法国债券市场,其市场的成熟程度显然是比较高的。对于中国债券市场来说, 0.15%的平均定价误差显然是太小了。关于这个问题,将在附录中提供一些实证研究的资料。此外,即使我们确定了样条分段点的数目,关于分段点的位置选取也需要研究者自行设定。一般来说,分段原则上要考虑到能够体现市场的自然属性。MoCulloch从拟合原理的角度出发,认为每一个分段区间内包含的样本债券数目都应该是相同的。这样的考虑在现实中并不一定符合市场的特征。最后需要指出的是,设置分段点的
34、做法,是考虑到样条方法对于收益率曲线只是“一种合适的曲线拟合方法”而已,因为其模型本身包含的关于收益率曲线的经济意义信息非常有限,因此,如果我们手头的债券样本没有足够的某一期限的债券数据,那最终样条曲线对于这一区域内收益率曲线的表达就有会很大问题。例如国内交易所市场剩余期限最长的债券只有不到20年,则对20年以上的收益率曲线就只是一种函数自然延伸的结果,并不一定代表市场的真实状况或预期。6-4异方差问题与处理异方差性在本章前面几个小节中介绍的描述利率期限的参数模型中,通常都是以到期期限(或发生时点,相对于瞬间远期利率)作为重要的解释变量,而由于我们在对模型中的自由参数向量进行估计时,通常以残差
35、方差和作为衡量参数最优值的标准,即参数向量的估计量应满足目标函数(6-6)和(6-7)。我们注意(6-6)和(6-7)的关系,在计算残差时,我们是根据式(6-4)取得。对于其方差,我们记为。对于参数向量,我们也给出了其作为最小二乘估计量的解析解(6-8)和(6-24)。但注意,这种目标函数设定中及其推导,都是基于普通最小二乘法的(注*:我们这里将前面所述的最小二乘法(Ordinary Least Squares)称为普通最小二乘法,是为了和后面内容中广义最小二乘法相区分)。熟悉数理统计的读者应该知道,普通最小二乘法要求:残差项必须服从零均值,非自相关和同方差三个假设,这样,(6-8)和(6-2
36、4)中的解才是对参数向量的线性无偏有效估计量。这也是普通最小二乘法的古典假设。在我们前述的几种拟合方法中,残差项服从零均值是体现在参数模型的目标函数中的。而由于收益率曲线的拟合是对横截面数据进行处理,因此我们也可不考虑自相关问题。对上述的一系列方法来说,最关键的模型风险,即其关于异方差问题的处理。换而言之,对于个别的残差项方差,其经济意义是什么呢?这里的i对应的是某一只具体债券的定价误差,而在期限结构模型中与其对应的唯一解释变量是到期期限t。如果我们以即期利率曲线作为研究对象,这里的t对应的也就是某一只具体债券的久期。在第三章中,我们已经介绍了关于久期的概念。一个众所周知的结论是:债券价格的波
37、动主要受利率变动影响,而在利率变动同样大小的条件下,其价格性同时受其久期(Duration)和凸度(Convexity)影响,表现为。如果我们忽略凸度影响,则近似为 。也就是说,假设即期利率曲线上对应每一个期限的点利率的波动率水平都是一致的话,那么期限越长的债券,价格波动率越大,并且其波动率与其久期有线性关系(注*:实际上,不同的点利率的波动率水平并非一致,关于这个问题,本书后面章节会有一些深入的讨论)。我们还需要第二个假设,即债券市场是有效的,那么可以有另一个推论,就是债券的定价误差是完全因随机因素引起的,其被观测到的平均定价误差的大小应是与其价格的波动率水平一致的。因此我们可以认为,对于残
38、差的期望值与解释变量t之间存在着线性关系,而具有不同期限的债券样本的跨观测值方差的期望值也不同。这显然从根本上违反了普通最小二乘法的同方差假定。也就是说,我们设定的目标函数(6-7)的对最终估计结果是无效的估计量(注*:严格地讲,根据扰动项的具体分布等因素,目标函数(6-7)下的估计量对并不一定是完全无效的,也可能存在可以得出一个的至少是无偏的估计量的情况。但这一部分的推断的目的只是解释异方差问题带来的模型风险,而且可以证明广以最小二乘法可以得出更有效地估计量)。让我们换一个角度,从直观上来理解这个问题。由于我们选择的样本债券本身就是一组期限不等(通常由小于1年到20年以上)的同质债券,而至少
39、是从经验上我们也可以判断出,短期限的,尤其是即将到期的债券,其净价迅速收敛于其面值;而长期限的债券品种往往有更大的价格波动性和定价误差。然而,关于目标函数(6-7),所有券种的定价误差都拥有相同的权重,显然,这样的收益率曲线拟合结果对于长期券是相对“过度拟合”的,而对于短期券则是相对“拟合不足”的。这个问题在中国的债券市场上体现得特别明显。久期修正的目标函数与广义最小二乘法显然,我们理应允许期限较长的债券具有较大的定价误差。因此,我们在设定目标函数时应加入一个权重系数,使目标函数(6-7)修正为一个加入权重的目标函数 (6-29)关于权重系数的选择问题,有许多不同的处理方法。但我们考虑到,的选
40、取原则是给与长期券较低的权重,而给与短期券较高的券重。根据我们上一部分所提到的,若市场是有效的,且不同期限点利率具有相同的波动性,则个券的定价误差与其久期存在线性关系。也就是说应使这个久期在定价误差中的影响被消去。基于这个原则,显然应是久期倒数的一个线性函数。如果我们取,则有 (6-30)式(6-30)是一种最常见的权重选取方法。Vasicek和Fong (1982)也使用了类似的办法,但相对略微复杂,他们采用美元久期的倒数作为修正的权重系数: (6-31)这两种方法本质上并无区别。根据(6-30)的方法,修正后的目标函数为 (6-32)我们如果希望通过Nelson-Siegel-Svenss
41、on模型进行收益率曲线的拟合,可以直接在Matlab软件中设定(6-32)式作为修正的目标函数。了解广义最小二乘法的读者应该已经注意到,上述方法在原理上是符合广义最小二乘法对于异方差问题的处理办法的。我们考虑将残差项写成下面的矩阵形式: (6-33)上式中,我们将异方差的残差项方差-协方差矩阵写作权重矩阵和标准化的残差方差的乘积形式。如果我们上述的两个假设(市场有效且点利率同方差)成立,那么,对于(6-33),其中的 (6-34)而权重 (6-35)请读者注意一点,广义最小二乘法需要权重矩阵被标准化为的状况,因此(6-35)与(6-30)的权重计算方法略有不同。但它们在原则上都是符合修正的目标
42、函数(6-29)的。针对多项式样条函数,我们在已知了债券样本的市场价格观测值向量P、数据矩阵X和权重矩阵的情况下,可以求出自由参数向量的广义最小二乘估计量 (6-36)同样,对于分段的样条函数,我们也可以继续求出约束条件下的自由参数估计量。由于其解析表达式比较复杂,这里就不再列出了。 应该说明的式,虽然上面所列的这种解决方案是最常用的修正样条函数的,但它在理论上也需要依赖一些假设。事实上,除此之外,我们也没有其他的更好的方法来处理异方差问题。大多数关于期限结构参数模型的文献对这些问题也没有进行特别深入的研究。这是因为,在成熟高效、且债券品种较多的市场上,即使不考虑异方差问题,采取样条方法进行收
43、益率曲线拟合的质量也是很高的。但对于中国市场来说,异方差的影响对于收益率曲线拟合的影响特别严重。因此,重视这个问题对于进行期限结构的高质量研究还是非常重要的。附录:收益率曲线拟合方法的比较研究在本章的正文部分已经对收益率曲线的拟合技术原理作了详细的介绍。但这些方法和理论在实际应用中的表现如何呢?特别是它们在中国债券市场的应用效果如何呢?相信这是很多读者都很关心的问题。相对而言,由于我国的交易所债券市场的流动性较好,同一时点可获得的横截面数据较为完全地体现了所有交易品种的状况,也基本上不存在类似银行间市场的非正常报价和成交。因此在附录中,将基于上海证券交易所债券市场数据,借鉴国外一些成熟的方法进
44、行利率期限结构的构造,并根据实证研究的结论,对最常用的两种收益率曲线拟合方法:Svensson方法和三次指数样条法的优缺点进行具体分析。此外,我们还将考察针对异方差问题的久期修正对拟合效果的影响。定价误差比较我们以2002年11 -12月内国债交易所市场14只固息国债的价格信息,分别采用Nelson-Siegel-Svensson扩展模型和三次指数样条法,对国债交易所的收益率曲线进行拟合,并考察拟合结果的差别和定价误差。我们参照Priaulet的“平均定价标准差”方法来定义针对收益率曲线拟合结果的样本债券定价误差 (6-37)同时,考虑到为了解决异方差问题,我们在目标函数加入了久期权重修正,因
45、此同时选取另一标准,即经久期加权的定价误差 (6-38)其中,权重项选取为 (6-39)我们在比较Nelson-Siegel-Svensson模型和三次指数样条法的拟合效果时,均采用了Matlab 6.1软件进行迭代优化。优化的目标函数均为加入久期修正的目标函数(6-29)。Nelson-Siegel-Svensson(加入久期修正)拟合的平均定价误差为(共43个样本点):SD = 1.3211%WSD = 0.3735%考虑到交易所市场债券品种较少,而样条分段函数的分段点应代表出市场的特性,因此我们选取3年和8年作为样条函数的两个分段点。三次指数样条法的平均定价误差为(共43个样本点):SD = 1.4067%WSD = 0.4042%图6-4为2002年11月29日分别以Nelson-Siegel-Svensson扩展模型和三次指数样条法(加入久期修正)拟合的交易所市场国债即期利率曲线。同时,我们还在图中标出了交易所国债当日的位置(横坐标为久期