计量经济学.ppt

上传人:文库蛋蛋多 文档编号:2265178 上传时间:2023-02-07 格式:PPT 页数:134 大小:1.10MB
返回 下载 相关 举报
计量经济学.ppt_第1页
第1页 / 共134页
计量经济学.ppt_第2页
第2页 / 共134页
计量经济学.ppt_第3页
第3页 / 共134页
计量经济学.ppt_第4页
第4页 / 共134页
计量经济学.ppt_第5页
第5页 / 共134页
点击查看更多>>
资源描述

《计量经济学.ppt》由会员分享,可在线阅读,更多相关《计量经济学.ppt(134页珍藏版)》请在三一办公上搜索。

1、1,计量经济学Econometrics,2,第一章 绪论,一、计量经济学,1、计量经济学(Econometrics)利用数学和统计推断为工具,在经济理论指导下对经济现象进行分析,并对经济理论进行检验和发展的一门学科。其内容涉及经济理论、数理经济、经济统计和数理统计等。2、计量经济学与经济理论 经济理论:定性 计量经济学:数值估计,检验3、计量经济学与数理经济学 数理经济学:以数学形式表述经济理论,不涉及理论的可度量性和经验方面的可论证性。计量经济学:利用数理经济学的数学方程式,并把之改造成适合于经验检验的形式。,3,4、计量经济学与经济统计学 经济统计:经济数据的收集、加工,不利用数据来检验经

2、济理论。计量经济学:以经济统计数据为原始资料进行分析。5、计量经济学与数理统计 数理统计:是计量经济学的基本工具,但由于经济数据的特殊性,力量经济学需要特殊的处理方法。,4,二、计量经济学的建模过程,基本过程:经济理论或假说的陈述 经济理论或假说的数学模型的设定 理论的计量经济学模型 数据的收集整理 计量经济模型的参数估计 假设检验 预测 利用模型进行控制或制定政策,5,例:检验凯恩斯关于边际消费倾向理论,或利用该理论进行经济控制或经济政策制定。,理论 人们的消费支出随收入的增加而增加,但消费支出的增加小于收入的增加。即边际消费倾向MPC大于零而小于1。(定性)建立数学模型 假定消费支出Y与收

3、入X之间有如下关系:,其中,Y为消费支出,X为收入,a和b为模型参数。B就是MPC。这里Y为因变量,X为自变量/解释变量。假定两者之间存在先行关系。(在不同情况下,数学模型的形式不一样,也可能是多个方程连立,有多个解释变量),6,建立计量经济学模型 由于经济变量之间的关系不是确定的(以函数形式准确表达),必须修改数理模型,建立计量模型:,u为误差项,代表了影响变量间非确定关系的其他因素的影响。这是一个线性回归模型。,O,X,Y,斜率为b,数理模型,O,X,Y,斜率为b,计量模型,a,a,7,数据的收集整理 如果分析一国的消费情况,要收集该国的总消费支出数据和总收入数据。,(选择、加工),美国1

4、980-1991年个人消费支出与GDP(10亿美元,1987年不变价格),8,计量经济模型的参数估计 采用回归技术,利用统计数据估计出参数a和b的经验值。,根据估计结果,美国1980-1991年的MPC约为0.72。假设检验 以一定的标准,对参数的估计结果进行检验。如果在统计意义上,b小于1,说明结果是可接受的。,预报和预测 如果计量模型可以接受,就可用来对因变量进行预测。假定1994年,美国的GDP预计为6万亿美元,则该年的消费支出预计为,9,控制或政策制定 如果希望1994年的消费支出达到4万亿美元,则政府必须通过政策来保证收入水平为:,三、计量经济学的内容,可分为理论和应用两大类。,理论

5、计量经济学:研究适当的方法,来测度有计量经济模型设定的经济关系式。,应用计量经济学:以理论计量经济学为工具,研究经济学或商业中的各领域。,10,四、计量经济分析使用的数据 有三类。(1)时间序列数据。一个时间序列是对一个变量在不同时间取的一组观测结果。这些数据可以按固定的时间间隔收集。收集的数据可以是定量的,也可以是定性的(虚拟变量)。中国1993年1998年的GDP增长率(%),11,(2)横截面数据。一个或多个变量在同一时点上收集的数据。1992年实际GDP增长,(3)面板数据。,12,第二章 一元线性回归模型,第一节 经典正态线性回归模型(CNLRM),一、基本概念 以下表为例。,13,

6、1、几个概念条件分布(Conditional distribution):以X取定值为条件的Y的条件分布条件概率(Conditional probability):给定X的Y的概率,记为P(Y|X)。例如,P(Y=55|X=80)=1/5;P(Y=150|X=260)=1/7。条件期望(conditional Expectation):给定X的Y的期望值,记为E(Y|X)。例如,E(Y|X=80)=551/5601/5651/5701/5751/565总体回归曲线(Popular Regression Curve)(总体回归曲线的几何意义):当解释变量给定值时因变量的条件期望值的轨迹。2、总体

7、回归函数(Popular Regression Function,PRF)E(Y|Xi)=f(Xi)当PRF的函数形式为线性函数,则有,E(Y|Xi)=1+2Xi其中1和2为未知而固定的参数,称为回归系数。1和2也分别称为截距和斜率系数。上述方程也称为线性总体回归函数。3、“线性”的含义“线性”可作两种解释:对变量为线性,对参数为线性。一般“线性回归”一词总是指对参数为线性的一种回归(即参数只以它的1次方出现)。,14,4、PRF的随机设定 将个别的Yi围绕其期望值的离差(Deviation)表述如下:ui=Yi-E(Y|Xi)或 Yi=E(Y|Xi)+ui其中ui为随机误差项(Stochas

8、tic error)或随机干扰项(Stochastic disturbance)。线性总体回归函数:PRF:Yi=1+2Xi+ui=E(Y|Xi)+ui5、随机干扰项的意义 随机扰动项是从模型中省略下来的而又集体地影响着Y的全部变量的替代物。显然的问题是:为什么不把这些变量明显地引进到模型中来,而以随即扰动项来替代?理由是多方面的:(1)理论的含糊性:理论不能完全说明影响因变量的所有影响因素。(2)数据的欠缺:无法获得有关数据。(3)核心变量与周边变量:希望能找到与有较大影响的核心变量的关系。(4)内在随机性:因变量具有内在的随机性。(5)替代变量:用来代替不可观测变量的替代变量选择,造成一定

9、误差。(6)省略原则:研究中尽可能使回归式简单。(7)错误的函数形式:回归式的的选择是主观的。,15,6、样本回归函数(SRF)由于在大多数情况下,我们只知道变量值得一个样本,要用样本信息的基础上估计PRF。,样本1,样本2,样本回归函数SRF:,在回归分析中,我们用SRF估计PRF。,16,估计量(Estimator):一个估计量又称统计量(statistic),是指一个规则、公式或方法,以用来根据已知的样本所提供的信息去估计总体参数。在应用中,由估计量算出的数值称为估计(值)(estimate)。样本回归函数SRF的随机形式为:,其中 表示(样本)残差项(residual)。,Xi X,P

10、RF:E(Y|Xi)=1+2Xi,SRF:,Y,E(Y|Xi),SRF是PRF的近似估计。为了使二者更为接近,即要使,17,二、经典线性回归模型(CLRM)的基本假定 假定1:回归模型对参数是线性的假定2:在重复抽样中X的值是固定的(非随机)假定3:干扰项的均值为零。即,E(ui|Xi)=0假定4:同方差性或ui的方差相等。即Var(ui|Xi)=Eui-E(ui)|Xi2=E(ui2|Xi2=2假定5:各个干扰项无自相关。即Cov(ui,uj|Xi,Xj)=Eui-E(ui|Xi)uj-E(uj|Xj)=E(ui|Xi)(uj|Xj)=0假定6:ui和Xi的协方差为零。即Cov(ui,Xi)

11、=Eui E(ui)Xi E(Xi)=Eui(Xi E(Xi)=E(ui Xi)E(ui)E(Xi)=E(ui Xi)=0假定7:观测次数必须大于待估计的参数个数。假定8:解释变量X的只要有变异性。即一个样本中,Xi不能完全相同。假定9:模型没有设定误差。假定10:没有完全的多重共线性,即解释变量之间没有完全的线性关系。,18,第二节 一元线性回归模型的估计,一、普通最小二乘法(Ordinary Least Squares,OLS)基本思路:用样本回归函数估计总体回归函数。以,估计,时,真实值,19,求解这一最小化问题,根据最大化的一阶条件:,20,可得到以下正规方程(Normal equat

12、ion):,二、参数的估计(点估计):OLS估计量 1、解上述正规方程组得到估计值:,解出,,可得到估计值。,称为最小二乘估计量(OLS估计)。,21,2、OLS样本回归线的性质:,22,三、2 的估计 真实方差的估计量:,四、OLS估计的精度或标准误差 由于OLS估计是根据一个样本得到的,需要检验估计量的可靠性(reliability)或精密度。在统计学中,一个估计量的精密度由它的标准误(standard error,se)来衡量。,23,24,五、OLS 统计量的性质:高斯-马尔柯夫定理 在CLRM假定下,在所有线性无偏估计量中,OLS估计量有最小方差,即OLS是BLUE(Best Lin

13、ear Unbiased Estimator)。,(1)线性:,为Yi的线性函数,25,(2)无偏性:,为,的无偏估计量。,26,(3)最小方差性:OLS估计量,在所有线性无偏估计量中,具有最小方差。即,可以证明OLS估计量具有最小方差。,27,第三节 拟合优度检验,拟合优度检验是指对样本回归线与样本观测值之间拟合程度的检验。度量拟合程度的指标是判定系数R2。基本思路:因变量Y的变异,能够被X的变异解释的比例越大,则OLS回归线对总体的解释程度就越好。,Xi X,PRF,SRF,Y,总平方和(TSS):实测的Y值围绕其均值的总变异:,28,定义判定系数R2:,估计的Y值围绕其均值的总变异,未被

14、解释的围绕回归线的Y值的变异,29,R2 测度了在Y的总变异中,由回归模型解释的部分所占的比例。R2 越高,回归模型拟合的程度就越好。R2 的性质:(1)非负。(2)0R2 1其它表达方式:,30,判定系数与相关系数的关系:相关系数:表示两个随机变量之间的相关程度。定义为:,以样本方差和样本协方差估计X、Y的方差和协方差,样本相关系数为:,样本相关系数的平方与判定系数相等,但二者的意义不同。,31,第四节 区间估计,为了判断点估计与真值的接近程度,可以通过构造以估计值为中心的一个区间(随机的),以该区间包括了真值的概率来确定估计值接近真值的把握程度:,一、的置信区间,32,由于未知,以其估计值

15、代替,,给定置信系数100(1-)%,随机的置信区间将有100(1-)%包含真值2。,二、的置信区间,33,三、的置信区间,34,第五节 OLS估计量的显著性检验,根据样本回归得到的总体参数的估计量,随着选取样本的不同观测值而不同;给定样本观测值时,得到的参数也与总体参数的真值不同。因此,必须对估计的参数值是否显著成立,做统计检验,即显著性检验。,一、的显著性检验,原假设 H0:2=0备择假设 H1:2 0,35,如果有理由认为2不能小于零(不能大于零),则在,2倍t法则,36,二、的显著性检验,原假设 H0:1=0备择假设 H1:1 0,三、回归方程的的显著性检验:F 检验 从方差分析(an

16、alysis of variance,ANOVA)的角度,检验回归方程的显著性。根据总离查平方和的分解式:TSS=ESS+RSS,,37,总离差(TSS)的自由度为(n-1),回归平方和(ESS)的自由度为1,残差平方和(RSS)的自由度为(n-2)。定义均方差=平方和/自由度,方差分析表(ANOVA/AOV表)为:,双变量回归模型ANOVA表,样本决定系数 R2 能够说明样本的拟和优度。但是我们还需要对总体做出推断,检验总体的线性是否成立。思路:若ESS/RSS 比较大,则X对Y的解释程度就比较高,可以推测总体存在线性。但是ESS/RSS 样本不同而不同,对于给定的样本,利用ESS/RSS

17、对总体进行推断,必须进行统计检验。,38,原假设 H0:2=0备择假设 H1:2 0,若H0成立,说明回归方程无显著意义,总体不存在线性;若拒绝H0,则可认为回归方程显著成立,总体存在线性。因此,定义统计量,39,第六节 利用回归方程预测,根据经济理论建立线性回归模型,并利用统计资料对模型参数进行了估计,建立了回归方程。经过显著性检验,判定回归方程能正确反映经济现象时,一个重要目标就是利用回归方程进行预测。,一、均值预测,已知X的一个特定值X0,要预测Y0的条件均值(总体回归线上的对应Y值)E(Y|X0),,40,显然,当X0越接近X 的均值,区间就变得越狭窄。,41,二、个值预测 预测给定X

18、的值X0,对应的Y0,仍为BLUE)。,42,小结:简单线性回归分析的主要步骤,1、建立回归模型 研究某一经济现象,先根据经济理论,选择具有因果关系的两个变量(Y,X),建立线性回归模型,确定解释变量和被解释变量。如果不明确两个变量是否为线性关系,也可以根据散点图来分析。建立回归模型可以是根据经济理论,也可以根据相同或相似经济现象的历史分析经验来建立回归模型。建立模型时,不仅要考虑理论或经验的依据,同时也要考虑数据的可利用程度。2、收集数据,并经过适当的加工整理,得到适于回归分析的样本数据集。3、估计模型参数。利用样本数据,以OLS得到模型参数的估计值。4、对回归模型和参数估计值进行检验。检验

19、回归结果是否正确反映经济现象,是否与理论相符。包括理论检验和统计检验。经济理论检验:参数的符号,大小是否与理论和实际相符。若不符,寻找原因(数据?模型设定?理论错误?)统计检验:拟和优度检验,估计量、回归方程的显著性检验。,43,5、预测 对于解释变量的特定值,带入回归方程得到因变量的预测值;在给定的置信水平上,得到因变量预测值的置信区间。6、回归结果的表述:,并说明参数的显著水平()。,44,第三章 多元线性回归模型,第一节 多元线性回归模型一、多元线性回归模型的PRF 如果假定对因变量Y 有k-1个解释变量:X2,X3,Xk,k 变量总体回归函数为:,其中1为常数项,2 2 为解释变量X2

20、 Xk 的系数,u为随机干扰项。总体回归函数PRF给出的是给定解释变量X2 Xk 的值时,Y的期望值:E(Y|X2,X3,Xk)。假定有n组观测值,则可写成矩阵形式:,45,二、多 元线性回归模型的基本假定,随机干扰项的期望值为0。,同方差性;无序列相关。,46,无多重共线性,即Xi(i=2,3,k)之间不存在线性关系:,随机干扰项服从正态分布。,三、多 元线性回归模型的SRF,47,根据残差的平方和最小化的原理,解出参数的估计量。,第二节 多元回归模型的OLS估计,一、参数估计,可得到如下正规方程组:,48,49,如果直接用矩阵微分,则,二、的估计量,三、的方差-协方差矩阵,50,51,四、

21、OLS估计量 的性质:,52,第三节 拟合优度检验:一、判定系数R2:,方差分析表(ANOVA),53,二、校正的R2:由R2的计算式可看出,R2 随解释变量的增加而可能提高(不可能降低):,与解释变量X的个数无关,而 则可能随着解释变量的增加而减少(至少不会下降),因而,不同的SRF,得到的R2 就可能不同。必须消除这种因素,使R2 即能说明被解释的离差与总离差之间的关系,又能说明自由度的数目。定义校正的样本决定系数:,54,三、R2 与 的性质,第四节 显著性检验 一、单参数的显著性检验:,如果接受H0,则变量Xi 对因变量没有影响,而接受H1,则说明变量Xi 对因变量有显著影响。,检验

22、的显著性,即在一定显著水平下,是否显著不为0。,55,检验步骤:,如果根据理论或常识,非负,则可做单侧检验,比较 t 与t。,二、回归的总显著性检验:检验回归系数全部为零的可能性。,56,方差分析表(ANOVA),显然,R2 越大,F越大,当 R2=1时,F无限大。,选择显著水平,计算F统计量的值,与F分布表中的临界值进行比较:,57,第五节 解释变量的选择 在回归模型中的解释变量,除非由明确的理论指导或其他原因,在选择上具有一定的主观性,如何正确选择解释变量是非常重要的。一、解释变量的边际贡献分析 在建立回归模型时,假定我们顺序引入变量。在建立了Y与X2的回归模型,并进行回归分析后,再加入X

23、2。考虑加入的变量X2是否有贡献:能否再加入后显著提高回归的解释程度ESS或决定系数R2。ESS提高的量称为变量X2的边际贡献。决定一个变量是否引入回归模型,就要先研究它的边际贡献,以正确地建立模型。如果变量的边际贡献较小,说明改变量没有必要加入模型。分析变量的编辑贡献,可以使用方差分析表为工具,根据变量引入前、后的RSS的变化量及其显著性检验(扣除原来引入模型的解释变量的贡献),确定该变量的边际贡献是否显著。一个简单的检验方法,就是对引入新变量后的RSS增量与新的ESS的比值做显著性检验。,58,可以利用方差分析表来进行分析。设ESS为引入变量前的回归平方和,ESS 为引入m个新变量后,得到

24、的回归平方和,RSS为引入变量后的残差平方和。ANOVA表如下:,59,在新引入变量的系数为0的原假设下,,把计算出的该统计量的值与 显著水平下的临界值进行比较:,引入的新变量的边际贡献显著,则应该把这些变量纳入回归模型,否则这些变量不应引入回归模型做解释变量。,二、逐步回归法 如果根据理论,因变量Y与k-1个变量X2,X2,Xk 有因果关系,我们要建立的回归模型要在这些变量中选择正确的解释变量,要根据变量的边际贡献大小,把贡献大的变量纳入回归模型。分析边际贡献并选择变量的过程,实际上是一个逐步回归的过程。首先,分别建立Y与k-1个变量X2,X2,Xk 的回归模型:,60,回归后,得到各回归方

25、程的平方和,选择其中ESS最大并通过F检验的变量作为首选解释变量,假定是X2。此时可确定一个基本的回归方程:在此基础上进行第二次回归,在剩下的变量中寻找最佳的变量:建立k 2 个回归方程:,61,回归后,得到各回归方程的平方和:,同样,选择其中ESS最大并通过F检验的变量作为新增解释变量,假定是X3。此时可确定一个基本的回归方程:,重复这一过程,直到所有变量中,边际贡献显著的变量全部引入回归模型中为止,得到最终的回归式:,也可以采用逐步减少边际贡献不显著的变量的方式,逐步回归确定回归模型包括的变量,方法一样。,62,第六节 利用多元回归模型进行预测,对于多元回归模型:,通过回归分析,得到回归方

26、程,后,就可根据给定的解释变量的一组值X0=(1,X20,X30,Xk0),对因变量Y的值进行估计。,一、个值预测,为Y0及 的预测值。,63,二、区间预测,64,第四章 非线性回归模型的线性化,因变量和解释变量之间的线性关系,包括参数线性和解释变量线性两种。前面的分析假定总体回归函数的形式为:,但是根据经济现实或经济理论,变量之间不一定存在这种形式的线性关系。如参数线性形式的回归函数:,或参数、变量均为非线性形式的函数关系,如C-D生产函数:,对于这些不符合线性假定的模型进行参数估计,必须加以适当的变换以后,才能用OLS方法估计模型参数。,65,对于参数线性的模型,可以采用变量的直接代换,转

27、化为参数、变量均为线性的形式进行估计。一、倒数模型:函数形式为:,令变量,则回归函数可变为:,根据解释变量的观测值,计算出X*i 的之后进行OLS估计,得到:,因此可得到原模型的估计方程:,66,二、对数线性模型:通过对原模型的对数变换,函数形式可变为:,令变量,则回归函数可变为:,根据解释变量的观测值,进行OLS估计,得到:,因此可得到原模型的估计方程:,例如,估计C-D 函数:,,两边取对数后:,得到原模型的估计方程:,因此,C-D 函数的估计形式为:,67,三、半对数线性模型:模型的函数形式可变为:,令变量,同样可以进行参数的OLS估计。,根据解释变量的观测值,进行OLS估计,得到:,因

28、此可得到原模型的估计方程:,四、多项式模型:模型的函数为:,68,我们关于经典线性回归模型(CLRM)有如下假定:假定1:回归模型对参数是线性的假定2:在重复抽样中X的值是固定的(非随机)假定3:干扰项的均值为零。即,E(ui|Xi)=0假定4:同方差性或ui的方差相等。即Var(ui|Xi)=Eui-E(ui)|Xi2=E(ui2|Xi2=2假定5:各个干扰项无自相关。即Cov(ui,uj|Xi,Xj)=Eui-E(ui|Xi)uj-E(uj|Xj)=E(ui|Xi)(uj|Xj)=0假定6:ui和Xi的协方差为零。即Cov(ui,Xi)=Eui E(ui)Xi E(Xi)=Eui(Xi E

29、(Xi)=E(ui Xi)E(ui)E(Xi)=E(ui Xi)=0假定7:观测次数必须大于待估计的参数个数。假定8:解释变量X的只要有变异性。即一个样本中,Xi不能完全相同。假定9:模型没有设定误差。假定10:没有完全的多重共线性,即解释变量之间没有完全的线性关系。在现实中,以上假定不一定得到满足。本章讨论某些假定不成立时的估计问题。,第五章 多重共线性,第一节 违背古典假定的估计问题,69,第二节 多重共线性(multi-collinearity),如果假定10不成立,即在解释变量X1,X2,Xk中,存在线性关系。当解释变量间的确定线系关系存在时,存在不全为零的常数,这种关系为完全多重共线

30、性,变量间的相关系数为1。实际上更多的情况是,解释变量间有不完全的线性关系:存在不全为零的数:,其中vi 为随机项。我们把这种解释变量间存在的完全或不完全的线性关系称为多重共线性。由于经济变量自身的性质,它们之间这种多重共线性或强或弱,普遍存在的。,假定10,,70,第三节 多重共线性的影响一、完全多重共线性 以两个解释变量的回归模型为例,假定回归模型为:,如果采用OLS估计,则有:,根据最小平方和原则,并求解正规方程组,可得到:,71,如果X2与X3存在完全共线性,即 则:,因此,存在完全共线性时,不能利用OLS估计参数,参数的方差变为无限大。,72,二、不完全多重共线性 假定X2,X3 间

31、存在不完全多重共线性,以离差形式表示为:。其中vi 为随机项。则,73,显然,当解释变量X2、X3 之间的相关系数 r23 的绝对值越大,共线性程度就越高,参数估计值的方差就越大,越不准确,且随着相关系数的增大,方差以更大的幅度增加。,三、多重共线性的影响,(1)参数估计值的方差增大,估计量的精度大大降低。影响预测结果(准确度和置信区间)。(2)参数估计值的标准差增大,使的 t 检验值变小,增大了接受H0,舍弃对因变量有显著影响的变量。(3)尽管t 检验不显著,但是R2仍可能非常高。(4)OLS估计量对观测值的轻微变化相当敏感。,一、多重共线性的探查 由于多重共线性使一种普遍现象,而多重共线性

32、的程度影响了参数估计结果,因此我们关心的是共线性的程度,而不是共线性是否存在。,第四节 多重共线性的探查和解决,74,在双边量回归模型中,可以直接对解释变量的相关系数进行显著性检验,以确定线性相关的程度(此时相关系数的平方等于样本决定系数)。而对于多于两个结束变量的回归模型,则不能利用俩俩相关系数来检验。对于有多个变量的回归模型,可以采用辅助回归的方法,分别以k-1个解释变量中的第i个对其他变量进行回归,可得到k-2个回归方程的判定系数:R22,R32,Rk2。假定这些判定系数中Rj2最大且接近1,则变量Xj 与其他解释变量中的一个或多个有较高相关程度,因此回归方程出现高度多重共线性。可以进行

33、F检验确定其显著性:根据第三章的结果,检验R2显著性的F检验值为:,可以采用类似的方法检验:,选择显著水平,计算F 统计量的值,与F分布表中的临界值进行比较,若F检验值小于临界值,则多重共线性不显著,反之,则多重共线性显著。,75,二、解决多重共线性的方法 如果发现监视变量之间存在高度得多重共线性,就必须消除这种多重共线性的影响,保证模型的正确性和估计的有效性。有以下几种解决方法。1、除去不重要的变量 把回归模型中引起多重共线性,而对因变量的影响不大的变量。但是变量的剔除可能导致模型的设定偏误。,服从t(n-k+1)。给定显著水平,若统计量大于临界值t/2,则说明Xj 与Xi引起回归方程的多重

34、共线性。,如果通过前的F检验得到某解释变量Xj 与其它解释变量存在多重共线性,则可以通过t 检验寻找Xj 与哪些变量引起多重共线性。首先计算Xj 与其它每个解释变量的偏相关系数:,76,已知X2 和X3 之间高度共线。根据先验信息,确定3=22,带入模型后可得:,例如:C-D生产函数,K与L高度相关。已知规模收益不变,则+=1。生产汉数的双对数模型可变为:,可以对这一新回归方程进行估计。,2、利用先验信息 假定对回归模型:,77,3、变换模型的形式 如果作为解释变量的某些经济变量间出现高度相关,而进行回归分析的目的是为了预测,不是研究单个经济变量对因变量的影响时,可以根据实际问题,改变模型模型

35、的形式。4、增加样本容量 如果多重共线性是由样本引起,增加样本容量可以减少多重共线性的程度。以二元回归方程为例,根据第二节的结果,参数估计值的方差为:,当样本容量增大时,增大,方差将减小,可以提高参数估计的精度。,5、横截面数据与时间序列数据并用 如果时间序列数据中,解释变量间存在高度相关,可以先使用横截面数据估计出存在高度相关解释变量中的一个或多个,然后再在时间序列数据中剔除这些变量,在消除多重共线性影响下估计因变量与剩余变量间的回归式。,78,例如,为了估计汽车需求的价格弹性和收入弹性,得到销售量、平均价格、消费者收入的时间序列数据。设定回归式:,新的回归式中消除了多重共线性的影响。,由于

36、在时间序列数据中价格Pt、收入It 一般都具有高度共线的趋势。因此,直接估计上面的回归式将存在问题。由于在同一式点上,价格与收入的相关程度不高,可以先利用截面数据估计出收入弹性,再利用这一估计结果修改原回归式,变为:,6、利用时间序列数据的差分或离差进行估计 如果时间序列数据中,解释变量间存在高度相关,那么这些变量的差分之间不一定相关。因此利用差分进行回归能降低多重共线性的程度。,79,第六章 异方差,第一节 异方差的性质,一、异方差,在经典线性回归模型(CLRM)中,我们假定随即干扰项具有同方差性,即:Var(ui|Xi)=Eui-E(ui)|Xi2=E(ui2|Xi2=2这实际上是假定了解

37、释变量Yi 的值围绕其期望值的分散程度相同。实际上,对应于解释变量的不同取值,方差可能不同,即本假定不成立。,Y2,X2,.,Y1,X1,X2,.,同方差,异方差,80,如果保持随机项的协方差为0,则,的方差、协方差矩阵为:,或者说,。,在这种情况下,称随机项ui 具有异方差性。,二、异方差的原因,1、因变量与解释变量间相互关系的性质。如“干中学”、经济行为规则等。2、解释变量的遗漏。3、异常观测值的出现。4、时间序列数据中,观测技术的改进引起的观测值的变化。,81,三、异方差的后果 由于异方差性,基于CLRM假定的OLS估计参数结果将受到影响。1、考虑异方差性的OLS估计 如果假定,保留其它

38、的CLRM假定,以双变量回归模型为例,普通OLS估计为:,可以证明该估计量是线性、无偏的(第二章的证明),但是否为最优估计量(具有最小方差性)性,则不一定。可以在考虑异方差性的前提下,采用适当的OLS估计方法来分析。,2、存在异方差性的OLS估计广义最小二乘法(GLS)估计 对于,可以进行变量代换,构造满足CLRM假定的回归方程。,82,83,在估计过程中,新模型的残差平方和实际上是原模型的残差的加权平方和:,因此,这种GLS估计,称为加权 最小二乘法(WLS)。显然,在求最小残差的过程中,对于方差较大的观测值赋予的权重较小(不符合“平均”意义上的“异常”观测值),而对于方差较小的观测值赋予较

39、大的权重,使样本回归函数更接近总体回归函数。,这种先将原始变量转换成满足CLRM假定的转换变量,再利用OLS进行估计的方法,称为广义最小二乘法(GLS),得到的估计量称为GLS估计量。显然,GLS估计量是BLUE的。,84,3、考虑OLS估计与GLS 估计的比较 OLS估计量:,GLS估计量:,1、两种估计量都是无偏的。2、GLS估计量具有最小方差性:。3、在假设检验中,OLS估计将降低检验的显著性。4、OLS估计降低估计的精度。4、忽略异方差的OLS估计(同方差假定下的OLS估计),不仅不具最小方差性,而且估计是有偏的。以此为基础的统计推断将可能产生严重的误导。,85,第二节 异方差性的探察

40、 由于异方差性可能导致的后果,在估计中要考虑如何探察异方差的存在,并采取相应的补救措施。一、图示法 由于在存在异方差的情况下,随机项ui 的方差与解释变量的取值有关,因此可以画出因变量Y与解释变量X的散点图,或同方差假定下以OLS估计得到的残差平方与X或Y(多变量模型中)的散点图,据此对异方差做出直观的近似判断。二、帕克(Pack)检验,且能确定影响随机项的解释变量。,86,二、Glejser检验,如果回归结果表明异方差与多个变量有关,可以引入多个变量进行回归,并进行检验。Glejser检验的优点在于,在检验异方差的同时,可以得到异方差形式的信息(与解释变量的关系),在后续分析中据此处理样本数

41、据和回归模型,以得到BLUE估计。,87,三、斯皮尔曼(Spearman)等级相关系数检验 通过随机项的方差与解释变量的等级相关系数的显著性检验,判断是否存在异方差性。步骤:,这一检验的依据,其实就是检查随着因变量的变化,方差是否随之变化(等级差异意味着变动)。,88,四、戈德菲尔德匡特(Goldfied-Quandt)检验 G-Q检验适用于大样本、随机项的方差与某异解释变量存在正相关的情况。检验的前提条件是:随机项服从正态分布;无序列相关。步骤:,如果同方差,则 F 1;如果存在以方差性,根据正相关的假设,F1。F越大(超过临界值),说明存在以方差性的可能性就越大。,89,第三节 异方差模型

42、的处理一、随机项的方差已知的情况,对新模型作OLS回归可以估计出原模型参数的BLUE估计。,二、随机项的方差未知的情况 存在以方差性,则随机项的方差与一个或多个解释变量有关。如:,90,可得到满足CLRM假定的新模型:,因此,关键的问题是找出异方差的具体形式。,91,第七章 自相关,第一节 自相关一、自相关 对于时间序列数据,不同期的样本观测值形成一个序列;横截面数据中按不同空间(省份、厂商、家庭等)排列的样本数据也可看为一个序列,为了方便,先把横截面数据也视为不同期的数据。对于一个变量u,可以得到其观测值序列:u1,u2,ut-1,ut下标t代表不同时期。如果在这个序列中,每期的观测值与其前

43、一期或前几期的取值有关,即Cov(ui,uj)0,i j则称该序列存在自相关(Autocorrelation)。在CLRM中,假定干扰项u不存在自相关,即Cov(ui,uj)=0,i j如果这一条件被破坏,即干扰项存在自相关,那么使用OLS估计就可能存在问题。实际上,在经济计量研究中,自相关士一种常见的现象。如,消费支出要受到当期和前几期收入的影响;某一年的GDP要受到前期的GDP水平的影响;某种商品的供给量要受到前一期的其它变量影响,等等。,92,三、自相关的形式 如果u存在自相关,t期的取值与前p期有关,关系可由:ut=f(ut-1,ut-p)+vt决定,其中vt满足:即vt满足CLRM假

44、定。一般把f(ut-1,ut-p)假定为线性形式。,二、产生自相关的原因(1)经济变量的惯性时间序列变量的自相关导致干扰项的自相关(2)应进入模型的变量未被引入模型,能引起自相关(3)回归模型的的形式设定存在错误(4)蛛网现象:应变量对子变量的反应滞后(5)滞后效应:应变量受其前几期取值的影响(6)数据“编造”。数据的加工过程(如季度数据)或推算过程(根据某种 假定获得未调查数据)引起自相关(7)随机项自身可能存在“真正自相关”性(偶然性冲击对变量的长期影响)自相关主要出现在时间序列数据中。横截面数据中也可能存在自相关(spatial autocorrelation,空间自相关)。,93,如果

45、,则称为马尔科夫一阶自回归模式(或简称为一阶自回归模式),记为AR(1)。其中被称为自协方差系数(coefficient of autocovariance),或自相关系数。,如果,则称为s阶自回归模式,记为AR(s)。对于AR(1),,(同方差假定),这与异方差一样,影响OLS估计的结果。,94,第二节 存在自相关的OLS估计一、考虑自相关的GLS估计 对于二元回归模型:,95,估计系数和方差为:,其中,C和D未校正因子(关于的表达式,较小)。,二、忽略自相关使用OLS估计的后果 利用OLS估计,得到的估计值和方差都与GLS估计不同。根据前面关于OLS估计的线性和无偏性的证明,OLS估计是线

46、性无偏的,但是考虑到干扰项的自相关,OLS估计是无效的。,96,如果=0,估计结果是相同的。在存在自相关的情况下,参数的GLS估计式和方差估计式中均有自相关系数,因此,忽略自相关的OLS估计值和方差都是不可信的。,97,1、绘制 的散点图,第三节 自相关的探察一、图示法,首先利用OLS回归后,求出残差。,如果大部分落在第I、第三象限,则 存在正自相关。,如果大部分落在第II、第IV象限,则 存在负自相关。,98,2、按时间顺序绘制 图 作出 随时间变化的图形,如果 呈由规律的变化,如锯齿形或循环形,则说明干扰项存在自相关。若 随时间变化不断变换符号,说明存在负相关;若连续几个为正,后边几个为负

47、,则可能存在正相关。,二、杜宾瓦特森(Durbin-Watson)检验 基本假定:(1)回归式中有截距项(2)解释变量是非随机的(3)干扰项的模式为一阶自回归模式:,99,(4)回归模型中,物质后因变量被当作解释变量。(5)没有缺落数据。检验方法如下:,当d约接近2,u的自相关性越小。,100,检验步骤:(1)做OLS回归,得到残差。(2)计算统计量d(3)对给定的样本数量和解释变量数目,在给定显著水平下,找出临界值的下界和上界dL、dU。(4)根据下表的决策规则决定是否接受原假设。,D-W检验的缺陷是存在两个不确定域。如果统计量落入不确定域中时,无法判断是否存在自相关。,101,第四节 自相

48、关的解决方法一、差分法 若存在一阶自相关,可采用广义差分,利用GLS得到参数的BLUE估计量。对于二元回归模型,然后再计算出估计值。,102,二、杜宾两步法 把二元回归模型的差分形式写为:,再计算出1、2。,103,第八章 虚拟变量与滞后变量模型,104,第一节 虚拟变量模型一、虚拟变量的引入 在经济分析中,某些特殊因素会影响到变量的取值,如季节对饮料需求的影响,特定时期实施特殊政策对各宏观经济变量产生的影响等。而这些因素属于“定性”的变量,可以通过赋予一个数量值,以虚拟变量(哑变量Dummy)的形式进入分析模型中。例如,消费函数模型:Ct=b0+b1Yt+ut=Ct=b0+b1Yt+b2Dt

49、+ut二、虚拟变量的不同形式 虚拟变量在模型中可代表对截距的影响,如:Ct=b0+b1Yt+b2Dt+ut(Dt在正常年份取1,反常年份取0)可利用OLS估计得到估计结果:,Ct,Yt,0,正常年份,反常年份,根据回归结果,正常年份的基本支出水平比反常年份小,而边际支出倾向不变。,105,虚拟变量在模型中也可以代表对和参数的全面影响,如:Ct=(b01+b02Dt)+(b11+b12Dt)Yt+ut该式可变为:Ct=b01+b02Dt+b11DtYt+b12DtYt+ut如果得到估计方程:,Ct,Yt,0,正常年份,反常年份,二、多个虚拟变量的引入及虚拟变量陷阱问题 在模型中,对于一个定性变量

50、可能需要引入多个虚拟变量。典型的例子是季节变化对商品销售的影响。,106,在该季节模型:,中,有,即解释变量间存在完全的共线性,因此模型无法估计。这就是虚拟变量陷阱。为了解决这以问题,在引入虚拟变量时,对于一个有m种可能的定性变量,只能引入m-1个虚拟变量。如前面的模型:,107,三、引入不同定性变量的多个虚拟变量 在模型中,如果有多个定性变量对因变量有影响,可同时把对应于各定性变量的虚拟变量引入模型。如,季节变化和当年是否有重大事件发生对商品的销售都有影响,销售回归方程可写为:,其中,Qt(取1获0)代表正常年份和反常年份,而D2D4代表季节变化。使用的原则,仍是对于任一个有m种可能的定性变

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号