《管理研究方法07-计量经济学方法new(二).ppt》由会员分享,可在线阅读,更多相关《管理研究方法07-计量经济学方法new(二).ppt(53页珍藏版)》请在三一办公上搜索。
1、管理研究方法(7)-计量经济学方法(二),主要参考书目,教材:美古扎拉蒂(Damodar N.Gujarati)著:计量经济学(Basic Econometrics),第四版,中译本,林少宫译,中国人民大学出版社,2006。新版本:古扎拉蒂(Damodar N.Gujarati)著:计量经济学(Basic Econometrics),第五版,中译本,费剑平译,中国人民大学出版社,2012。其他参考书目:1.易丹辉主编,数据分析与EViews应用,中国人民大学出版社,2008年10月。2.马庆国:管理统计-数据获取、统计原理、SPSS工具与应用研究,科学出版社,2006。,主要内容,计量经济学专
2、题(1)-多重共线性与异方差性问题计量经济学专题(2)-自相关、自回归及分布滞后计量经济学专题(3)-虚拟变量回归问题计量经济学专题(4)-联系方程组方法计量经济学专题(5)-面板数据模型及其估计因子分析、主成份分析、聚类分析,一、多重共线性与异方差性问题,放宽古典模型的假设-多重共线性(multi-collinearity)问题-异方差性(heteroscedasticity)问题,1.多重共线性问题,多重共线性的例子 例1:消费收入的例子 例2:农民消费与农业产值 多重共线性的程度-pp 313 多重共线性的原因:-pp313-数据采集方法和范围-模型或总体受到约束-模型设定-过度决定的模
3、型(样本信息过于集中),-cont,多重共线性的实质-样本(间)的回归现象 1x1+2x2+kxk=0 其中:1,2,k为一组不同时为零的数多重共线性的后果-理论后果和实际后果:p316-321 标准误差将随着变量间的共线程度的增大而增大 由于标准误差较大,会使有关的总体参数的置信区间更大。如果存在高度共线性,则样本数据可能与各种不同的假设相容,因此接受错误假设(犯第二类错误)的概率增大了。,-cont,在不完全的多重共线性下,回归系数的估计是可能的,但其估计量及其标准差非常敏感。例子 pp 321,323 如果是高度多重共线的,可能得出较高的R2值,但几乎没有一个估计的回归系数在统计上是显著
4、的。多重共线性的检测(发现):pp325-328 经验判断:a.估计的回归系数无法解释;b.R2值很高或者p,但几乎所有偏回归系数的 t-检验在统计上是不显著的;,-cont,c.偏回归系数的估计值大小及符号与常识不符;d.专业知识上可以肯定对因变量的影响因素,但在多元回归中却不能纳入方程;e.去掉一两个变量或样本观测值,方程的回归系数值发生剧烈变动,非常不稳定。可以考察解释变量间的判定系数R2,如果只有两个自变量,考察他们之间的简单相关系数即可判断。如果 r 较大,则一般是共线的。如果R2值较高而偏相关系数较低,则可能存在多重共线性;其中的一个或多个变量可能是多余的。,-cont,可将模型中
5、的每一个变量xi对其它的变量进行回归,求出相应的可决系数Ri2。如果某个Ri2较高,则表明该变量与其它变量是高度相关的。只要不导致严重的设定偏倚,可将其从模型中剔除。逐步回归法:将Y 分别与Xi进行回归:-有用的变量:R2大,t-检验显著-多余的变量:R2变化不大,其他系数无影响-可能重要的变量:R2变化大,其他系数及符号均发生变化 检测共线性的统计指标:pp327-328-本征值(eigenvalues)与病态指数(condition index)经验规则:k在1001000之间,就算有中等强度的多重共线性;,-cont,如果k大于1000,就算有严重的多重共线性.或者:CI在10-30之间
6、,就算有中等强度的多重共线性;如果CI大于30,就算有严重的多重共线性!-容许度(tolerrance)与方差膨胀因子(variance inflating factor)经验规则:VIFj值越大,变量xj共线性可能性越大。如果一个变量的VIFj值超过10,则该变量是高度共线的。用容许度来检测多重共线性:如果Xj与其他回归元无关,则TOLj=1;如果Xj与其他回归元完全相关,则TOLj=0。,如何避免多重共线性问题 补救措施,利用额外的或先验的信息 合并截面数据和时间序列数据(并用)剔除(某个高度共线的)变量和设定偏倚 变换数据 增加样本观测值或补充新的数据 主成分分析 差分模型或增长率模型
7、岭回归方法-例题(略),2.异方差性(heteroscedasticity),问题的提出-不满足统计假设中的随机扰动项同方差 同方差(homo-scedasticity):E(ui2)=2 异方差(heter-scedasticity):E(ui2)=i2-实际经济问题的同方差假定不合理(尤其时间序列数据,要格外当心!)异方差的来源-干中学,边错边改(error-learning)-行为方式或偏好发生改变-数据采集技术的改进,使误差可能减小-异常值(离群值,outliers)的出现-模型设定错误,广义最小二乘法(GLS),基本思想 先将原始变量转换成满足经典模型假设的转换变量,然后再对它们使用
8、OLS程序。即GLS是对满足标准最小二乘假定的转换变量的OLS。如此得到的估计量称为GLS。GLS估计量是BLUE pp354-355 OLS与GLS的区别 pp355,-cont,异方差性的后果-在其他条件满足时,有异方差时,用OLS估计式得到的系数估计仍是无偏的、一致的,但不再是有效的。(方差不是最小)p352-353,-由于此时Var(hat)不具有最小方差,导致过低估计hat的t-值。-的置信区间不必要地增大,从而使显著性检验的功效变小。P356-如果忽视异方差性而一味使用惯用的检验程序,则无论得出何结论或做出何判断,都可能产生严重误导。p357,-cont,异方差性的检验(或发现)-
9、pp 358 369-图解法-ei与Yi或Xi 的散点图(Scat plot)-Park检验 ln(i2)=ln(2)+ln(Xi)+i=+ln(Xi)+i 估计时,用ei2作为i2的替代变量,看是否显著?-Glejser检验-ei与Xi 之间的各种可能关系?-Spearman等级相关检验:di为两变量的等级差 步骤:pp362 例题:pp363,-cont,-戈德菲尔德-匡特检验 步骤:pp364 例题:pp365-366-布劳殊-培干-戈弗德检验 步骤:pp367 例题:pp368-怀特(White)的一般异方差性检验 步骤:pp369 例题:pp369-370,-cont,异方差性的补救
10、 在理论上,克服异方差性还没有很好的办法。-出现异方差时的一般对策是从经济理论上考虑更合理的解释变量和函数形式。-当i2为已知时:加权最小二乘法(WLS)pp371-进行数据变换尤其是对数变换通常是较有效的办法 关于异方差性模式的可能假定 数据变换的形式 pp373-376-双变量总体方差是否相同的F-检验 一个总结性例题 pp377,二、计量经济学专题(2),自相关(Autocorrelation)自回归(Auto-Regression)分布滞后(Distributed-lag)模型,1.自相关(Autocorrelation)问题,问题的提出:自相关是指按时间顺序或空间顺序排列的观察值之间
11、的相关现象,又称序列相关。Cov(Ui,Uj)=E(Ui,Uj)0 自相关的来源:pp395-398 在经济时间序列中,序列相关现象之所以经常存在,是因为模型常把一些不重要的或无法观测到的因素都包括在随机误差中,而这些因素往往具有时间趋势,从而在随机误差项Ut中体现了在时间先后上的某种相关性。-惯性:时间序列数据的回归中,连续观测值可能是相互依存的。-省略了不该省的解释变量-设定偏误(错误的数学表达式或函数形式)-数据的编造(对原始数据的处理或变换不当),-cont,-蛛网现象:Qt=f(Pt-1)+Ut-滞后效应:Ct=1+2Yt+3Ct-I+Ut自相关出现时的OLS估计:一阶自回归模型:A
12、R(1)Ut=Ut-1+t,t N(0,2)一阶移动平均模型:MA(1)Ut=t+t-1 ARMA(1,1)Ut=Ut-1+t+t-1,-cont,在自相关情况下,用OLS估计式得到的系数估计仍是无偏的、一致的,但不再是有效的。(方差不是最小的)自相关出现时的后果:OLS估计式是无偏的,但无偏性是在重复抽样中体现出来的,在任一特定的样本中,OLS估计式对于样本波动非常敏感。估计的方差可能增大:剩余的方差E(ei2)可能低估扰动项ut的方差2;OLS估计式的方差和标准差也可能低于真实的方差和标准差。使检验失效,如 t 检验(t-值放大),拒绝H0 例子:pp403-407,-cont,自相关的检
13、验a.图示法:用ei代替ui,若ui之间存在自相关(序列相关),比通过ei反映出来。因此,可用ei来考察ui的序列相关性质。-看et与et-1之间的散点图:-看et 与 t 之间的散点图:-看et 的数值的变化(如季节变化):b.Durbin Watson 检验(DW值)适用于检验是否存在一阶线性自回归:Ut=Ut-1+vt,vt N(0,2),称为白噪声序列 一阶马尔可夫过程 AR(1),-cont,-cont,结论:duDW4-du 无序列相关(无自相关)0 DW dL 正相关 4 dL DW4 负相关 DLDWDu 不确定 4-duDW4-dL 不确定 图示:p413 查表du和dL,与
14、估计或计算的DW-值比较!c.游程检验:pp410-411,补救办法(存在序列相关时的估计方法),如果是遗漏解释变量而造成的,加入之。确定正确的模型形式,或变量变换 如果是真实的序列相关:Ut=Ut-1+vt a.已知时,做广义差分变换;b.未知时,-由于:,-cont,-科克伦-奥克特(Cochrane-Orcutt)迭代法 step1:step2:广义差分变换 step3:广义差分变换 参数估计 直到的估计量没有显著差异为止!或无序列相关!,-Durbin 两段法,-自回归条件异方差模型(ARCH),模型及含义 检验 例子 处理-GLS,-GARCH,2.自回归与分布滞后模型,问题的提出-
15、分布滞后模型:不仅包含解释变量的本期值,还包括解释变量的滞后值。如:Yt=+0Xt+1Xt-1+2Xt-2+Ut-自回归模型:不仅包含解释变量的本期值,还包括被解释变量的滞后值。如:Yt=0+1Xt+2Yt-1+Ut 经济研究中分布滞后的作用或意义 有限滞后分布模型:无限滞后分布模型:,-cont,-短期乘数:0-延迟乘数(过渡乘数):1,2,k-长期乘数:=j-例子:投资乘数:KI=1/(1-MPC)货币乘数:m=1/(1-Re),-cont,滞后的原因-人们的心理与习惯:并不因为价格的变化或收入的变化而立刻改变其消费习惯、投资决策等。-技术上的原因:预期心理-制度上的原因:如固定资产管理体
16、制、宏观经济体制、货币政策、财政政策、信贷政策与管理体制等。-信息传递和延迟:信息传递需要时间、政策效应具有时滞等。,-cont,滞后模型的估计-经验权数法 a.递减滞后 W1=(1/3)Xt+(1/5)Xt-1+(1/7)Xt-2+(1/9)Xt-3 Yt=0+1W1+Ut b.矩形滞后(均匀)W1=(1/3)Xt+(1/3)Xt-1+(1/3)Xt-2 Yt=0+1W1+Ut c.“”形滞后 W1=(1/10)Xt+(1/4)Xt-1+(1/2)Xt-2+(1/5)Xt-3+(1/9)Xt-4 Yt=0+1W1+Ut,-cont,-库伊克(Koyck)几何滞后形式 对模型:Yt=+0Xt+
17、1Xt-1+kXt-k+Ut 设:k=0.k(01,分布滞后的下降率)长期乘数=j=0.k=0/(1-)平均滞后=(kk)/(j)=/(1-)变换方法:广义差分变换,-阿尔蒙(Almon)多项式滞后形式,对模型:设:j=0+1j+2j2+mjm,-cont,-自适应期望模型 适应性规则:Xte Xt-1e=(Xt Xt-1e)(*)Xt为t期的实际值;Xte为t期的期望值(预期值);为期望系数,0 1 当=0时,Xte=Xt-1e 期望值不变;=1时,Xt=Xte 期望值等于现值。例子:货币需求量:Yt=0+1Xte+Ut(1)Xte=Xt+(1-)Xt-1e(2)估计:(2)式代入模型(1)
18、式、变形、整理,得到自回归模型,用OLS估计,可得0、1 估计值。,-cont,-局部调整模型 模型一:Yte=0+1Xt+Ut(1)令:Yt Yt-1=(Yte Yt-1)(2)为调整系数,01 估计:(1)式代入(2)式,有:Yt Yt-1=(0+1Xt+Ut Yt-1)Yt=0+1Xt+(1-)Yt-1+Ut 得到自回归模型:Yt=0+1Xt+2 Yt-1+Vt,-cont,模型二:Yte=0Xt 1e Ut(1)调整模型:(2)估计:分别取对数,代入,变为对数形式的自回归模型,然后用OLS估计即可。【例】:旅游外汇收入的汇率弹性!辽宁金融,1994(2),-cont,基础数据:旅游统计
19、年鉴 1978-1991:境外旅游者来华入境人数(万人),人民币汇率(年底数)、人民币汇率(年内平均)、旅游外汇收入(百万美元)长期模型(对数形式的局部调整模型):调整公式:,-cont,估计及其结果:短期模型:估计结果:旅游外汇收入对汇率变化的短期弹性及含义:长期弹性及含义:,-cont,注意:在研究诸如货币需求量、银行存款、利率及汇率变动、就业与失业、通货膨胀、投资分析等实际问题时,经常遇到自适应模型和局部调整模型的应用。自回归模型中自相关的检验 在自回归模型中,DW值通常难以检测自回归模型中的自相关,因为此时DW值一般趋近于2,即按常规算出的DW统计量存在一种阻碍发现一阶序列相关的内在偏
20、倚。调整如下:为Yt-1前的系数的估计量的方差。,-cont,-Durbin证明:当样本容量较大时,如果=0,则h服从N(0,1)。对于给定的显著性水平,可查出正态分布表的临界值Z/2。则可做出拒绝或接受H0:=0的假设。-说明:(1)计算h时,只计算滞后Yt-1系数的方差,与其他滞后值无关。(2)当NVar(2 hat)1时,不用此检验。实际中并不常见!(3)大样本时较实用,小样本时不恰当。,三、计量经济学专题(3),虚拟自变量(Dummy Variables)回归虚拟因变量的回归模型:-线性概率模型(linear probability models)-对数(线性)回归模型(logisti
21、c regression)-概率单位模型(probit model)-托比模型(Tobit model),1.虚拟自变量的回归,虚拟变量的实质 属性变量、品质变量、二元变量、标记变量虚拟变量回归方法 Y=0+1x1+2x2+1D 具有某种属性 不具有某种属性例1 大学教授性别差异而导致的工资差距 pp.494例2 是否吸烟对身体的影响例3-是否提供便捷服务对营业额的影响,-cont,参数的解释 E(y|D=1)=(0+1)+1x1+2x2 E(y|D=0)=0+1x1+2x2 y E(y)=(0+1)+1x1+2x2 E(y)=0+1x1+2x2 1 0 x,-cont,多个虚拟变量的情况-p
22、p 499-501-虚拟变量是一个多分定性变量 一般规则是虚拟变量的个数比变量分类数少一!例子:p499-500、p511-虚拟变量是多个定性变量 例子:p501、502 虚拟变量与回归的比较 例子:p505-508 不同属性的交互作用:p509,-cont,分段回归中的虚拟变量 例子:p513-514 在时间序列和横截面数据中合并使用虚拟变量 例子:p515-518 其它技术问题 p518-521,1.线性概率模型,虚拟因变量:具有二分属性的因变量。线性概率模型:Yi=1+2Xi+Ui 其中,Yi=1 具有某种属性 Yi=0 不具有某种属性 E(Yi|Xi)=1+2Xi=Pi LPM的估计问
23、题:-Ui的非正态性-Ui的异方差性-可疑的拟合优度:R2,-cont,LPM模型的估计步骤:pp539 step 1:先是普通的OLS估计,step 2:用估计的wi 做数据变换,再对变换后的数据做OLS回归估计。LPM模型的例子及应用:pp540-545,2.对数(线性)回归模型,模型:,-cont,特点:pp549 估计:pp550,551-552 例子及说明:552-557,3.概率单位模型,含义 估计及步骤:例子:p559,562-564托比模型 截取(样本)回归模型 例子:pp 566-567,四、联立方程组模型及其估计,参考文献:1.易丹辉主编,数据分析与EViews应用,中国人
24、民大学出版社,2008年。Ch 7.2.美古扎拉蒂(Damodar N.Gujarati)著:计量经济学(Basic Econometrics),中译本,第五版,费剑平译,2012年)中国人民大学出版社。Ch18、19、20核心思想:变量间的关系不是简单的因果关系,二是一种双向或联立关系!(相互作用!)关键:联立方程组模型的建立、方程组的识别估计方法:工具变量法、2SLS法(单个方程)、系统估计法(似无关回归法、三阶段最小二乘法、广义矩估计法)PPT 见单独专题。,五、面板数据(Panel Data)模型,一、参考文献:1.易丹辉主编,数据分析与EViews应用,中国人民大学出版社,2008年。Ch11.2.美古扎拉蒂(Damodar N.Gujarati)著:计量经济学(Basic Econometrics),中译本,第五版,费剑平译,2012年)中国人民大学出版社。Ch16.二、主要内容:1.面板数据的基本含义和基本概念 2.面板数据模型及其估计(固定效应和随机效应模型及其估计)3.面板数据模型的检验(固定效应和随机效应的检验)4.用EVIEWS、SPSS估计与检验面板数据 5.应用举例,