《序列的统计量、检验和分布(eviews应用).ppt》由会员分享,可在线阅读,更多相关《序列的统计量、检验和分布(eviews应用).ppt(43页珍藏版)》请在三一办公上搜索。
1、1,第一章 序列的统计量、检验和分布,EViews提供序列的各种统计图、统计方法及过程。当用前述的方法向工作文件中读入数据后,就可以对这些数据进行统计分析和图表分析。,EViews可以计算一个序列的各种统计量并可用表、图等形式将其表现出来。视图包括最简单的曲线图,一直到核密度估计。,2,打开工作文件,双击一个序列名,即进入序列的对话框。单击“view”可看到菜单分为四个区,第一部分为序列显示形式,第二和第三部分提供数据统计方法,第四部分是转换选项和标签。,3,1.1 描述统计量,以直方图显示序列的频率分布。直方图将序列的长度按等间距划分,显示观测值落入每一个区间的个数。同直方图一起显示的还有一
2、些标准的描述统计量。这些统计量都是由样本中的观测值计算出来的。如图(例1.1):,4,例1.3中GDP增长率的统计量:,5,均值(mean)即序列的平均值,用序列数据的总和除以数据的个数。,中位数(median)即从小到大排列的序列的中间值。是对序列分布中心的一个粗略估计。最大最小值(max and min)序列中的最大最小值。标准差(Standard Deviation)标准差衡量序列的离散程度。计算公式如下,N 是样本中观测值的个数,是样本均值。,6,偏度(Skewness)衡量序列分布围绕其均值的非对称性。计算公式如下,是变量方差的有偏估计。如果序列的分布是对称的,S值为0;正的S值意味
3、着序列分布有长的右拖尾,负的S值意味着序列分布有长的左拖尾。例1.1中X的偏度为0,说明X的分布是对称的;而例1.3中GDP增长率的偏度是0.78,说明GDP增长率的分布是不对称的。,7,峰度(Kurtosis)度量序列分布的凸起或平坦程度,计算公式如下,分布的凸起程度大于 正态分布;如果K值小于3,序列分布相对于正态分布是平坦的。例1.1中X的峰度为2.5,说明X的分布相对于正态分布是平坦的;而例1.3中GDP增长率的峰度为2.14,说明GDP增长率的分布相对于正态分布也是平坦的。,意义同S中,,正态分布的 K 值为3。如果 K 值大于3,,8,Jarque-Bera 检验 检验序列是否服从
4、正态分布。统计量计算公式如下,S为偏度,K为峰度,k是序列估计式中参数的个数。在正态分布的原假设下,J-B统计量是自由度为2的 2 分布。J-B统计量下显示的概率值(P值)是J-B统计量超出原假设下的观测值的概率。如果该值很小,则拒绝原假设。当然,在不同的显著性水平下的拒绝域是不一样的。例1.1中X的J-B统计量下显示的概率值(P值)是0.92,接受原假设,X 服从正态分布;而例1.3中GDP增长率的的J-B统计量的概率值(P值)是0.455,也接受原假设,说明GDP增长率服从正态分布。,9,1.2 均值、中位数、方差的假设检验,这部分是对序列均值、中位数、方差的假设检验。在序列对象菜单选择V
5、iew/tests for descriptive stats/simple hypothesis tests,就会出现下面的序列分布检验对话框:,10,1.均值检验,如果不指定序列 x 的标准差,EViews将在 t 统计量中使用该标准差的估计值 s。,是 x 的样本估计值,N是x的观测值的个数。在原假设下,如果x服从正态分布,t 统计量是自由度为N-1的t分布。,原假设是序列 x 的期望值 m,备选假设是 m,即,11,如果给定x的标准差,EViews计算t 统计量:,是指定的x的标准差。,要进行均值检验,在Mean内输入 值。如果已知标准差,想要计算t统计量,在右边的框内输入标准差值。可
6、以输入任何数或标准EViews表达式,下页我们给出检验的输出结果。,12,这是检验例1.7中GDP增长率的均值,检验H0:X=10%,H1:X10%。表中的Probability值是P值(边际显著水平)。在双边假设下,如果这个值小于检验的显著水平,如0.05则拒绝原假设。这里我们不能拒绝原假设。,13,2.方差检验,检验的原假设为序列 x 的方差等于 2,备选假设为双边的,x 的方差不等于 2,即,EViews计算2统计量,计算公式如下,N为观测值的个数,为x的样本均值。在原假设下,如果x服从正态分布,2 统计量是服从自由度为N-1的 2分布。要进行方差检验,在Variance处填入在原假设下
7、的方差值。可以填入任何正数或表达式。,14,3.中位数检验,原假设为序列x的中位数等于m,备选假设为双边假设,x的中位数不等于m,即,EViews提供了三个以排序为基础的无参数的检验统计量。方法的主要参考来自于Conover(1980)和Sheskin(1997)。进行中位数检验,在Median右边的框内输入中位数的值,可以输入任何数字表达式。,15,1.3 分布函数,EViews提供了几种对数据进行初步分析的方法。在1.1 我们已列出了几种图来描述序列分布特征。在本节,列出了几种散点图且允许我们可以用有参数或无参数过程来做拟合曲线图。这些图包含着复杂计算和大量的特殊操作,对某些完全技术性的介
8、绍,不必掌握所有细节。EViews中设置的缺省值除了对极特殊的分析外,对一般分析而言是足够用的。直接点击ok键接受缺省设置,就可以轻松的展现出每个图。,16,1.3.1 序列分布图,本节列出了三种描述序列经验分布特征的图。,1.CDFSurvivorQuantile图,这个图描绘出带有加或减两个标准误差带的经验累积分布函数,残存函数和分位数函数。在序列菜单中或组菜单中选择View/Distribution/CDFSurvivorQuantile时(组菜单的Multiple Graphs中),就会出现下面的对话框:,17,其中,Cumulative Distribution(累积分布)操作用来描
9、绘序列的经验累积函数(CDF)。CDF是序列中观测值不超过指定值 r 的概率,Survivor(残存)操作用来描绘序列的经验残存函数,18,Quantile(分位数)操作用来描绘序列的经验分位数。对 0 q 1,X 的分位数 x(q)满足下式:,,且,分位数函数是CDF的反函数,可以通过调换CDF的横纵坐标轴得到。All选项包括CDF,Survivor和Quantile函数。Saved matrix name可以允许把结果保存在一个矩阵内。Include standard errors(包括标准误差)操作标绘接近95%的置信区间的经验分布函数。,19,工作文件1_3.wf1中GDP增长率的分布
10、图,20,2.QuantileQuantile图,QuantileQuantile(QQ图)对于比较两个分布是一种简单但重要的工具。这个图标绘出一个被选序列的分位数分布相对于另一个序列的分位数分布或一个理论分布的异同。如果这两个分布是相同的,则QQ图将在一条直线上。如果QQ图不在一条直线上,则这两个分布是不同的。,当选择View/Distribution Graphs/Quantile-Quantile.下面的QQ Plot对话框会出现:,21,可以选与如下的理论分布的分位数相比较:Normal(正态)分布:钟形并且对称的分布.Uniform(均匀)分布:矩形密度函数分布.Exponentia
11、l(指数)分布:联合指数分布是一个有着一条长右尾的正态分布.Logistic(逻辑)分布:除比正态分布有更长的尾外是一种近似于正态的对称分布.Extreme value(极值)分布:I型极小值分布是有一条左长尾的负偏分布,它非常近似于对数正态分布.可以在工作文件中选择一些序列来与这些典型序列的分位数相比较,也可以在编辑框中键入序列或组的名称来选择对照的序列或组,EViews将针对列出的每个序列计算出QQ图。,22,下图是GDP增长率和指数分布的Q-Q图:,23,3.Kernel Density(核密度),这个视图标绘出序列分布的核密度估计。一个序列的分布的最简单非参数密度估计是直方图。通过选V
12、iew/Descriptive Statistics/Histogram and Stats可以得到直方图,直方图对原点的选择比较敏感并且是不连续的。下图是GDP增长率序列分布的直方图:,24,核密度估计用“冲击”代替了直方图中的“框”,所以它是平滑的。平滑是通过给远离被估计的点的观测值以小的权重来达到的。一个序列 X 在点 x 的核密度估计为:,这里,N是观测值的数目,h是带宽(或平滑参数),K是合并为一体的核函数。,25,当选View/Distribution Graphs/Kernel Density会出现下面的核密度对话框:,要展现核密度估计,需要指定如下几项:,26,(1)Kerne
13、l(核)核函数是一个加权函数,它决定冲击的形状。EViews针对核函数K提供如下操作:,这里u是核函数的辐角,I(.)是指示函数,辐角为真时,它取 1,否则取 0。,27,(2)Bandwidth(带宽)带宽h控制密度估计的平滑程度;带宽越大,估计越平滑。带宽的选取在密度估计中非常重要,缺省设置是一种基于数据的自动带宽,,这里N是观测值的数目;s是标准离差;R是序列的分位数间距;因子k是标准带宽变换,标准带宽变换用来调整带宽以便对不同的核函数自动密度估计有大致相当的平滑。也可以自定带宽,先点击User Specified,在下面的对话框中键入一个非负数。,28,下图是GDP增长率序列分布的核密
14、度估计:,29,1.3.2 带有拟合线的散点图,通过view/Graph/Scatter打开一个组的视图菜单包括四种散点图。,1.Simple Scatter(简单散点图)其第一个序列在水平轴上,其余的在纵轴上。,2.Scatter with Regression(回归散点图),在组中对第一个序列及第二个序列进行总体变换来进行二元回归,选择Regression后出现对话框:,30,工作文件1_5.wf1中的居民消费和GDP的带回归线的散点图,31,下面是针对二元拟合的序列变换:,在编辑框中来指定参数a,b。如果变换是不可以的,会出现错误提示,对多项式(Polynomial)的阶数定的过高。EV
15、iews会自动降低阶数以避免共线性。点击ok后,EViews拟合出一条回归线,可以在Fitted Y series编辑框中键入一个名称保存这个拟合的序列。,32,Robustness lterations(稳健叠代),最小二乘法对一些无关观测值的存在非常敏感,稳健叠代操作就是产生一种对残差平方的加权形式,使无关的观测值在估计参数时被加最小的权数。,这里xi,yi 是变形后的序列,权值 r 通过下式得到:,其中:ei yi a bxi,m是|ei|的中间数,大的残差的观测值给一个小权数。选择叠代次数应是一个整数。,33,3.Scatter with Nearest Neighber Fit(最邻
16、近拟合散点图),这是一种带宽基于最邻近点的局部回归。简而言之,对样本中的每一数据点,它拟合出一条局部的并经加权的回归线。局部是说只用邻近点也就是样本的子集来一步步回归,加权是说邻近点越远给越小的权数。当选择后,会出现如下的对话框:,34,因为要靠子样本点周围的点来进行局部回归,并来求拟合值,因此specification操作就是确定选择识别周围进行回归的观测值的规则。Bandwidth span(带宽范围)用来决定在局部回归中应包括哪些观测值,可以选取在0,1之间的一个数。Polynomial degree(多项式次数)选择多项式的次数来拟合每一局部回归。,(1)Specification(说
17、明操作),35,(2)Method 操作,可以选择在样本中的每一个数据点作局部回归或在数据点的子集中作局部回归。Exact(full sample)在样本中的每一数据点都作局部回归 Cleveland subsampling 在选取的子样本中进行回归,可以在编辑框中键入子样本的大小。,36,工作文件1_5.wf1中的居民消费和GDP的最邻近点拟合的散点图,37,4.Scatter with Kernel Fit(核拟合分布),这也是一种局部回归拟合,不过是无参数的。另外与最邻近回归拟合相比,区别主要体现在局部带宽的选取上。最邻近拟合的有效带宽可以有很多种,而核拟合则固定带宽且局部的观测值通过核
18、函数来加权。局部核回归拟合通过选取参数 使加权残差平方和最小。,N是观测值的个数,h是带宽(或光滑参数),K是核函数。注意:对于不同的 x,的估计值不同。,38,打开Scatter with kernel fit,出现下面的对话框:,Regression用来指定局部回归的形式,指定多项式的阶数k。Nadaraya-Watson操作设置k=0。Local linear操作设置k=1。对于高阶多项式,应使用 Local polynomial 操作,可在下面编辑框中输入k的值。,39,工作文件1_5.wf1中的居民消费和GDP的核拟合的散点图 使用 Local polynomial 操作,k=2。,
19、40,Kernel用来定义核函数,这里的核函数用来在每个局部回归中给观测值加权,对核函数的操作前面已经介绍过。核心函数如下:,在这里 I 是指示器,1表示真,2表示假。带宽 h 决定每个局部回归的观测值的权数。越大越平滑。,41,1.4 相关矩阵及协方差矩阵,在组中可以显示了组中各序列的相关矩阵及协方差矩阵。Common Sample使任何缺数据的序列都被排除在相关及协方差计算之外。Pairwise Samples用相关序列的所有无丢失观察值计算。此方法使用样本的最大数,但可能导致不确定矩阵。,42,1.5 交叉相关,交叉相关(Cross correlation and Correligrams)显示组中头两个序列的交叉相关。序列 X 与 Y 的交叉相关的计算公式如下:,注意与自相关不同,交叉相关不必围绕滞后期对称。交叉相关图中的虚线是二倍的标准差,近似计算。,43,居民消费(CS)和GDP的交叉相关系数,