经典单方程计量经济学.ppt

资源描述

《经典单方程计量经济学.ppt》由会员分享，可在线阅读，更多相关《经典单方程计量经济学.ppt（29页珍藏版）》请在三一办公上搜索。

1、第二章经典单方程计量经济学,2.1 一元线性回归模型（1）,一般地，一元线性回归模型（统计模型）有如下形式：yt=0+1 xt+ut 上式表示变量yt 和xt之间的真实关系。其中yt 称被解释变量（因变量），xt称解释变量（自变量），ut称随机误差项，0称常数项，1称回归系数（通常未知）。上模型可以分为两部分。（1）回归函数部分，E(yt)=0+1 xt,（2）随机部分，ut。,2.1 一元线性回归模型（2）,以收入与支出的关系为例。假设固定对一个家庭进行观察，随着收入水平的不同，与支出呈线性函数关系。但实际上数据来自各个家庭，来自各个不同收入水平，使其他条件不变成为不可能，所以由数据得到的散

2、点图不在一条直线上（不呈函数关系），而是散在直线周围，服从统计关系。随机误差项ut中可能包括家庭人口数不同，消费习惯不同，不同地域的消费指数不同，不同家庭的外来收入不同等因素。所以在经济问题上“控制其他因素不变”是不可能的。,2.1 一元线性回归模型（3）,2.1 一元线性回归模型（4）,回归模型的随机误差项中一般包括如下几项内容，（1）非重要解释变量的省略，（2）人的随机行为，（3）数学模型形式欠妥，（4）归并误差（粮食的归并）（5）测量误差等。回归模型存在两个特点。（1）建立在某些假定条件不变前提下抽象出来的回归函数不能百分之百地再现所研究的经济过程。（2）也正是由于这些假定与抽象，才使我

3、们能够透过复杂的经济现象，深刻认识到该经济过程的本质。,2.1 一元线性回归模型（5）,通常线性回归函数E(yt)=0+1 xt 是观察不到的，利用样本得到的只是对E(yt)=0+1 xt 的估计，即对0和1的估计。在对回归函数进行估计之前应该对随机误差项ut做出如下假定。(1)ut 是一个随机变量，ut 的取值服从概率分布（再初等阶段我们一般假设服从正态分布）。(2)E(ut)=0。(3)D(ut)=Eut-E(ut)2=E(ut)2=2。称ui 具有同方差性。,(4)ut 为正态分布（根据中心极限定理）。以上四个假定可作如下表达。ut N(0,)。(5)Cov(ui,uj)=E(ui-E(

4、ui)(uj-E(uj)=E(ui,uj)=0,(i j)。含义是不同观测值所对应的随机项相互独立。称为ui 的非自相关性。(6)xi是非随机的（初等阶段）。(7)Cov(ui,xi)=E(ui-E(ui)(xi-E(xi)=Eui(xi-E(xi)=Eui xi-ui E(xi)=E(ui xi)=0.ui 与xi 相互独立。否则，分不清是谁对yt的贡献。(8)对于多元线性回归模型，解释变量之间不能完全相关或高度相关（非多重共线性）。在假定（1），（2）成立条件下有E(yt)=E(0+1 xt+ut)=0+1 xt。,2.2最小二乘估计（OLS）,对于所研究的经济问题，通常真实的回归直线是观

5、测不到的。收集样本的目的就是要对这条真实的回归直线做出估计。,2.2最小二乘估计（2）,怎样估计这条直线呢？显然综合起来看，这条直线处于样本数据的中心位置最合理。怎样用数学语言描述“处于样本数据的中心位置”？设估计的直线用表示。其中称yt的拟合值，和分别是 0 和1的估计量。观测值到这条直线的纵向距离用表示，称为残差。称为估计的模型。假定样本容量为T。（1）用“残差和最小”确定直线位置是一个途径。但很快发现计算“残差和”存在相互抵消的问题。（2）用“残差绝对值和最小”确定直线位置也是一个途径。但绝对值的计算比较麻烦。（3）最小二乘法的原则是以“残差平方和最小”确定直线位置。用最小二乘法

6、除了计算比较方便外，得到的估计量还具有优良特性。（这种方法对异常值非常敏感）,2.2最小二乘估计（3）,设残差平方和用Q表示，则通过Q最小确定这条直线，即确定和的估计值。以和为变量，把Q看作是和的函数，这是一个求极值的问题。求Q对和的偏导数并令其为零，得正规方程，计算结果的推导过程参见（附录21）,2.3 最小二乘估计量和的特性,1.线性特性:这里指和分别是yt的线性函数。令代入上式，得可见是yt的线性函数，是1的线性估计量。同理0也具有线性特性（证明留作课后习题）。,2.3 最小二乘估计量和的特性,2.无偏性：估计量的数学期望即总体参数本身利用上式E()=E(kt yt)

7、=E kt(0+1 xt+ut)=E(0 kt+1 kt xt+kt ut)=E1 kt(xt-)+kt ut=1+E(kt ut)=1 3.有效性：OLS估计量在线性无偏估计量中方差最小。0,1的OLS估计量的方差比其他估计量的方差小。Gauss-Marcov定理：若ut满足E(ut)=0，D(ut)=2，那么用OLS法得到的估计量就具有最佳线性无偏性。估计量称最佳线性无偏估计量。最佳线性无偏估计特性保证估计值最大限度的集中在真值周围，估计值的置信区间最小。OLS估计量都能满足上述渐近特性，但满足渐近特性的估计量不见得是最佳线性无偏估计量。(见附录二）,OLS 小结,注意：分清4个式子的关系

8、。(1)真实的统计模型，yt=0+1 xt+ut(2)估计的统计模型，yt=+xt+(3)真实的回归直线，E(yt)=0+1 xt(4)估计的回归直线，=+xt,2.4 OLS 回归直线的性质,(1)残差和等于零，=0 由正规方程2(yt-xt)(-1)=0得(yt-xt)=(yt-)=()=0(2)估计的回归直线=+xt 过（,）点。正规方程(yt-xt)=0两侧同除样本容量T，得=+。得证。(3)yt 的拟合值的平均数等于其样本观测值的平均数，=。=(+xt)=+=。得证。(4)Cov(,xt)=0 只需证明(xt-)=xt-=xt=0。上式为正规方程之一。(5)Cov(,)=0（证明留作

9、课后作业）,2.5 yt的分布和的分布,根据假定条件ut N(0,)，E(yt)=E(0+1 xt+ut)=0+1 xt+E(ut)=0+1 xt。Var(yt)=Var(0+1 xt+ut)=Var(0+1 xt)+Var(ut)=yt是ut的线性函数，所以yt N(0+1 xt,)。可以证明 E()=1;Var()=，是yt的线性函数（=kt yt），所以 N(1,)。证明留作课后练习,2.6 的估计,定义,其中2表示待估参数的个数。可以证明.是的无偏估计量。因为是残差，所以又称作误差均方。可用来考察观测值对回归直线的离散程度。和的估计的方差是,2.7 拟合优度的测量,可以证明(yt

10、-)2=(-)2+(yt-)2=(-)2+()2。SST（总平方和）=SSR（回归平方和）+SSE（残差平方和）注：SSR：旧指回归平方和（regression sum of squares），现指残差平方和（sum of squared residuals）SSE：旧指残差平方和（error sum of squares(sum of squared errors)），现指回归平方和（explained sum of squares）,拟合优度是指回归直线对观测值的拟合程度。显然若观测值离回归直线近，则拟合程度好；反之则拟合程度差。,2.7 拟合优度的测量（2）,证:(yt-)2=(yt-)

11、+(-)2=(yt-)2+(-)2+2(yt-)(-)其中(yt-)(-)=(yt-)(xt-)=(yt-)xt-(yt-)=xt=0（正则方程）度量拟合优度的统计量是可决系数（确定系数）。R2=（回归平方和）/（总平方和）=SSR/SST 所以R2的取值范围是 0，1。对于一组数据，SST是不变的，所以SSR（），SSE（）。,2.8 回归参数的显著性检验及其置信区间,主要是检验 1 是否为零。而用样本计算的是否等于零则应通过检验来判断是否有统计上的显著性。原假设 H0:1=0;备择假设 H1:1 0,在H0成立条件下，统计量若 t t(T-2)，则 1 0；若 t t(T-2)，则 1=

12、0,2.8 参数显著性检验及其置信区间（2）,还可以利用估计1的置信区间。由于由大括号内不等式得1的置信区间-t(T-2)1+t(T-2)其中是的算术根，而其中的是的算术根。,2.9 yF 的点预测及其区间预测,以下以时间序列数据为例介绍预测问题。预测可分为事前预测和事后预测。两种预测都是在样本区间之外进行。对于事后预测，被解释变量和解释变量的值在预测区间都是已知的。可以直接用实际发生值评价模型的预测能力。对于事前预测，解释变量是未发生的。（当模型中含有滞后变量时，解释变量则有可能是已知的。）当预测被解释变量时，则首先应该预测解释变量的值。对于解释变量的预测，通常采用时间序列模型。

13、,预测还分为有条件预测和无条件预测。对于无条件预测，预测式中所有解释变量的值都是已知的。所以事后预测应该属于无条件预测。当一个模型的解释变量完全由滞后变量组成时，事前预测也有可能是无条件预测。例如：当预测T+1期的yt值时，xt用的是T期值，是已知值。预测还分为静态预测和动态预测。,2.9 yF 的点预测及其区间预测（2）,yF 的点预测。根据估计的回归函数，得:单个yF 的区间预测的分布是所以，yF 的区间预测是E(yF)的区间预测 E()的分布是则E(yF)的区间预测是,OLS及其预测的Eviews操作,案例21：用回归模型预测木材剩余物：（见附录24）（附录ch21为作业数据）,O

14、LS及其预测的Eviews操作（2）,根据EViews输出结果（上图），写出OLS估计式如下：=-0.7629+0.4043 xt(-0.6)(12.1)R2=0.91,s.e.=2.04其中括号内数字是相应t 统计量的值。s.e.是回归函数的标准误差，即。R2是可决系数。R 2=0.91说明上式的拟合情况较好。yt变差的91%由变量xt解释。检验回归系数显著性的原假设和备择假设是（给定=0.05）：H0：1=0；H1：1 0,因为t=12.1 t0.05(14)=2.15，检验结果是拒绝1=0，即认为年木材剩余物和年木材采伐量之间存在回归关系。（残差图见操作）估计1的置信区间。由得 1的置

15、信区间是-t0.05(14),+t0.05(14)0.4043-2.15 0.0334,0.4043+2.15 0.0334 0.3325,0.4761以95%的置信度认为，1的真值范围应在0.3325,0.4761 范围中。,OLS及其预测的Eviews操作（3）,yt的点预测和平均木材剩余物产出量的置信区间预测。假设乌伊岭林业局2000年计划采伐木材20万m3，求木材剩余物的点预测值。2000=-0.7629+0.4043 X2000=-0.7629+0.4043 20=7.3231万m3（置信区间预测及单点置信区间预测留作课后作业）,2.10 相关理论,简单线性相关系数（见附录三）简称相

16、关系数（correlation coefficient）度量两个变量间的线性相关强度，用表示。的随机变量表达式是：估计表达式是：,2.10 相关理论,偏相关系数（见附录三）以上介绍了简单线性相关系数，但是当两个变量xt,yt同时受其它变量z1t,z2t,影响时，有必要研究当控制其它变量z1t,z2t,不变时，该两个变量xt,yt之间的相关关系。称这种相关关系为偏相关关系。以3个变量xt,yt,zt,为例（多于3个变量的情形与此相似。），假定控制zt不变，测度xt,yt偏相关关系的偏相关系数定义如下。=控制zt不变条件下的xt,yt的简单相关系数。（作业：附录三例一、例二、例三的eviews操作）,

展开阅读全文