《小样本DW统计量的分布特征.doc》由会员分享,可在线阅读,更多相关《小样本DW统计量的分布特征.doc(12页珍藏版)》请在三一办公上搜索。
1、小样本DW统计量的分布特征 小样本DW统计量的分布特征张晓峒1 赵初晓2(1. 南开大学国际经济研究所, 天津 300071)(2. 天津大学管理学院, 天津 300072)摘要:本文用模特卡罗模拟方法研究了样本容量在54以下的DW统计量的分布特征,并给出小样本DW检验临界值表。同时用DW检验提出了一个判别最小二乘估计中是否存在虚假回归的有效方法。关键词:模特卡罗模拟,DW分布,非平稳性,协整Distribution of Small Sample
2、 DW StatisticZhang Xiaotong1 Zhao Chuxiao2(1. Institute of International Economics, Nankai University, Tianjin 300071)(2. Management School, Tianjin University, Tianjin 300072)Abstract &nb
3、sp;In this paper we investigated the DW distribution with sample size under 54 by Monte Carlo simulation method and gave a critical table for small sample DW test.&n
4、bsp;Based on that we proposed a method for recognizing spurious regression in ordinary least squares estimation.Keywords: Monte Carlo simulation, DW distribution, nonstationary, cointegratio
5、n1概述 八十年代以来,Engle-Granger (1987), Engle-Yoo (1987) 和Sargan-Bhargava (1983)都曾提及用DW统计量检验非平稳变量间的协整性问题。在Sargan-Bhargava (1983)中还专门给出一个DW协整检验用表。但在这些论文中均未对小样本DW统计量的分布特征给与研究。本文采用蒙特卡罗模拟方法对小样本DW统计量的分布特征进行了充分、详细的研究。样本容量分别取为10,20,30,40和50。变量的设定分为三种情形:一. 
6、;所涉及的两个变量都取自I(1)过程;二. 所涉及的两个变量中一个取自I(1)过程,一个取自I(0)过程;三. 所涉及的两个变量都取自I(0)过程。在有些国家以年为单位的时间序列的最大可观测值个数并不是很大,所以对小样本DW统计量分布特征的研究有着非常重要的理论与现实意义。本文结构如下。第二节推导两个I(1)变量进行最小二乘回归后,由残差计算的DW统计量的极限分布表达式,第三节介绍蒙特卡罗模拟结果及其分析,第四节给出实例,第五节给出结论。2DW统计量的极限分布给定如下随机数据生成系统,yt = yt-1 + ut ,&nbs
7、p; y1 = 0,  
8、; (1)xt = xt-1 + vt , x1 = 0, &nbs
9、p; (2)其中ut, vt I(0), E(ut) = E(vt) = 0; E(ui uj) = 0, i ¹ j,” i, j。则yt和xt为相互独立的两个I(1)过程。 建立如下回归模型:yt&nb
10、sp;= b0 + b1xt + wt . &nb
11、sp; (3)当对上式进行最小二乘估计时,会产生虚假回归问题。用随机误差wt的最小二乘估计值 构造DW统计量, &
12、nbsp; (4)因为当T ® µ 时, 必然接近于零,上式中分子为Op(1),而分母T -1sw2也是Op(1),所以DW统计量是Op(T -1)的。当T ® µ 时,有
13、 DW Þ 0.即当用两个I(1)变量进行如模型(3)形式的回归时,DW统计量的极限分布为零。3小样本DW分布的蒙特卡罗模拟及其结果分析当样本为有限样本,特别是小样本时,DW统计量的分布与其极限分布有着很大不同。由于上述条件下的DW统计量的分布无法用解析的方法求解,本文用蒙特卡罗模拟方法对DW统计量的小样本分布特征进行了研究。以模型(3)为基础,除了以yt,xt I(1)为条件对DW分布(记为DW(1,1))进行模拟外,还分别以yt I(
14、1),xt I(0) 和yt,xt I(0)为条件进行了模拟(分别记为DW(1,0) 和DW(0,0))。由于DW(0,0)就是通常意义的DW统计量,所以只模拟样本容量T = 10, 40两种情形。对于DW(1,1)和DW(1,0),分别取T = 10, 20, 30, 40和50进行了模拟。在每个样本容量条件下各模拟1000次。所得结果见表一。首先见表一的第三部分,先分析DW(0,0) 的分布特征。由于DW(0,0) 就是通常意义
15、的DW统计量,所以模拟结果表明,一. DW(0,0)分布的均值为2,不受样本容量大小的影响;二.分布是对称的,相应JB值(表中最后一列)说明小样本DW(0,0)统计量的分布与正态分布相当近似。三. 随着样本容量的增大,分布的标准差逐步减小。见表一的第一、二部分。小样本DW(1,1)和DW(1,0)统计量有着相似的分布特征。一. 分布均为右偏态,分布左侧有端点,端点为零;二. 随着样本容量的增大,DW(1,1)和DW(1,0)分布的右偏倚程度越来越大,分布均值逐步相左移动,90、95、99百分位数也逐步向左移动,同时分布的标准差逐步减小,分布的峰值越来越大
16、,DW取值向零集中;三. 在样本容量相同的条件下,DW(1,0)分布总是位于DW(1,1)分布的左侧,即DW(1,0)分布的均值、百分位数以及方差都比DW(1,1)分布的相应量小。T = 50模拟1000次的DW(1,1)和DW(1,0)分布的结果分别见图一和图二。表一 DW分布的蒙特卡罗模拟结果类 型样本容量百 分位 数 均 值标准差偏 度JB统计量 1 90 95 99 100.22
17、2.182.452.81 1.28 0.620.50 48.74DW(1,1) 200.111.281.491.80 0.75 0.390.68 77.61 300.090.901.041.39 0.51 0.291.07 293.73 400.060.770.881.16 0.41 0.251.06 2
18、50.10 500.050.590.710.98 0.33 0.201.16 341.31 100.181.732.022.38 0.98 0.530.73 89.59 200.091.021.211.59 0.56 0.341.22 369.61DW(1,0) 300.060.700.831.18 0
19、.38 0.241.27 430.43 400.040.540.660.91 0.30 0.191.25 383.68 500.040.450.540.71 0.24 0.151.12 261.84DW(0,0) 101.312.752.973.24 2.02 0.570.00 7.17 40
20、0.722.412.532.70 2.00 0.310.03 4.06注:1. DW(1,1)表示由两个I(1)变量进行回归,计算得到的DW值。 2. DW(1,0)表示由一个I(1)变量和一个I(0)变量进行回归,计算得到的DW值。 3. DW(0,0)表示由两个I(0)变量进行回归,计算得到的DW值。 4. 在每个样本容量条件下各模拟1000次。图一
21、 T = 50模拟1000次的DW(1,1)分布直方图 图二 T = 50模拟1000次的DW(1,0)分布直方图在相同样本容量条件下,DW(1,0)分布之所以位于DW(1,1)分布左侧,可作如下解释。随着T ® µ,DW(1,0)和DW(1,1)的分布都趋近于零。由于DW(1,0)来自于一个I(1) 变量和一个I(0)变量之间的回归,所以残差序列wt I(1)。由于DW(1,1)来自于两个I(
22、1)变量之间的回归,一般来说残差序列wt I(1),但也有可能在yt和xt之间存在协整关系,从而使wt I(0)。所以DW(1,0)分布必位于DW(1,1)分布的左侧。用DW(1,1)统计量可以检验相应两个I(1)变量yt和xt是否存在协整关系。同时DW(1,1)统计量也可用来判断普通最小二乘回归中是否存在虚假回归。这与协整检验是一致的。若两个I(1)变量存在协整关系,则回归是有意义的,否则为虚假回归。用表一中关于DW(1,1)的模拟结果,即用表一中第一部分DW(1,1)分布的第90、95、99百分位数,均值和标准差分别对样本容量的到数(1/T)进行
23、回归。结果见表二。表二 DW(1,1)分布第90、95、99百分位数,均值和标准差分别对1/T的回归函数(用表一中第一栏相应数据估计) i 回归函数 R2 s.e. F DW 1 P90 = 0.2561 + 19.4438&nb
24、sp;(1/T)(6.4)(26.3)0.9957 0.05 691.2 2.35 2 P95 = 0.3338 + 21.4633 (1/T)(6.7)(23.2)0.9945 0.06 538.8 2.37 3 P99 = 0.6059 + 22.3828 (1/T)(10.8)(21.5)0.9936 0.07 462.7&
25、nbsp;1.45 4 Mean = 0.1182 + 11.7759 (1/T) (4.7) (25.6)0.9954 0.03 656.1 2.18 5 SD = 0.1167 + 5.1082 (1/T)(8.7)(20.6)0.9930 
26、;0.02 462.3 1.90 注:1. P90 , P95 和P99分别表示DW(1,1)分布的第90、95和99百分位数。 2. Mean和SD分别表示DW(1,1)分布的均值和标准差;1/T表示样本容量的倒数。 &n
27、bsp; 3. R2表示拟合优度,s.e. 表示回归函数的标准差。 通过拟合优度R2的值可以看到DW(1,1)分布的第90、95、99百分位数,均值和标准差与1/T高度相关。所以完全有理由以表二中的前三个回归函数作为响应面函数,编制小样本DW检验临界值表(见表三)。表三可用来检验两个原变量是否存在协整关系,同时也就是检验原最小二乘回归式中是否存在严重的虚假回归。如果两个原变量是平稳的或者两个变量都是非平稳的但存在协整关系,则最小二乘回归后用残差计算的DW统计量一定服从均值为2的近似正态的分布,其第90、95
28、和99百分位数一定会大于表三中所给出的相应临界值。而只有当wt非平稳时,DW统计量的值才会以相应概率小于表三给出的相应临界值。表二中的第4和5回归式表明小样本DW(1,1)分布的均值和标准差都随着样本容量的增大而极有规律地减小。表三 小样本DW检验临界值表 样本容量 T DW分布第90百分位数第95百分位数第99百分位数 10 2.20  
29、; 2.48 2.84 14 1.64 1.87 2.20 18 1.34 1
30、.53 1.85 22 1.14 1.31 1.62 26 1.00 1.16  
31、; 1.47 30 0.90 1.05 1.35 34 0.83 0.97 1.26&nb
32、sp; 38 0.77 0.90 1.19 42 0.72 0.84 1.14  
33、; 46 0.68 0.80 1.09 50 0.64 0.76 1.05 54 
34、; 0.62 0.73 1.024实例分析为研究我国国际贸易与国民经济的关系,以我国进出口贸易总额(Yt,亿元人民币)和社会总产值(Xt,亿元人民币)为变量(数据见中国统计年鉴,1983,第26页和591页,1950-1983)得如下估计模型: = - 64.4061 + 0.0734 Xt &
35、nbsp; (5) &nbs
36、p; (-3.2) (17.5) R2 = 0.91, s.e. = 66.9, DW = 0.27用DW = 0.27与表三中检验水平为0.05的相应临界值(0.97)相比较,因为0.27 < 0.97,结论是上述回归为虚假回归,模型误差项存在严重的自相关。这种
37、情况下应该对模型进行修正或用其他方法建立与估计该两个变量之间的关系。 下面用单整和协整检验的方法验证虚假回归的存在。经ADF检验,结论是Yt I(2),Xt I(2)。用 表示与上式相应的残差序列。对 进行ADF检验,得ADF = -1.9;对 的一阶差分序列d 进行ADF检验,得ADF = -3.4,所以wt I(1)。这说明Yt和Xt都是二阶非平稳的,且不存在协整关系。则回归式(5)必然为虚假回归。5
38、结论本文对小样本DW统计量的分布特征进行了充分研究。小样本DW统计量的基本分布特征是左侧以零为端点,右侧拖尾。样本越小,DW分布的离散程度越大,右尾部越“胖”,偏度越小。它与DW统计量的极限分布有着很大不同。当回归函数所涉及的变量为平稳变量或为非平稳变量但存在协整关系时,用最小二乘法得到的估计式才是有意义的。当回归函数所涉及的变量为非平稳变量,且不存在协整关系时,用最小二乘法得到的估计式为虚假回归式。本文用DW统计量提出了一个判别有意义回归和虚假回归的有效方法。参考文献Engle, R. F. and Granger, C. W.&n
39、bsp;J. (1987), Cointegration and error correction representation, estimation and testing, Econometrica, 55: 251-76.Engle, R. F. and Yoo, B. S. (1987), Forcasting and
40、 testing in cointegrated system, Journal of Econometrics, 35: 143-59.Fuller, W. A. (1976), Introduction to statistical time series, John Wiley, New York.MacKinnon,&n
41、bsp;J. G. (1991), Critical values for co-integration test, in R. F. Engle and C. W. Granger (eds), Long-run Economic Relationships, Oxford University Press,&nbs
42、p;267-76.Sagran, J. T. and Bhargava, A. (1983), Testing residuals from least squares regression for being generated by the Gaussian random walk, Econometrica, 5
43、1: 153-74.Phillips, P. C. B. (1986), Understanding spurious regression in econometrics, Journal of Econometrics, 33: 311-40.张晓峒,大川勉,张世英小样本DF统计量的分布特征系统工程理论与实践1999(3): 3137