面板数据分析对决牛.ppt

上传人:小飞机 文档编号:6213438 上传时间:2023-10-05 格式:PPT 页数:102 大小:3.86MB
返回 下载 相关 举报
面板数据分析对决牛.ppt_第1页
第1页 / 共102页
面板数据分析对决牛.ppt_第2页
第2页 / 共102页
面板数据分析对决牛.ppt_第3页
第3页 / 共102页
面板数据分析对决牛.ppt_第4页
第4页 / 共102页
面板数据分析对决牛.ppt_第5页
第5页 / 共102页
点击查看更多>>
资源描述

《面板数据分析对决牛.ppt》由会员分享,可在线阅读,更多相关《面板数据分析对决牛.ppt(102页珍藏版)》请在三一办公上搜索。

1、第八章 面板数据分析,面板数据模型的基本分类,固定效应模型,随机效应模型,实证分析,面板数据(Panel Data)又称纵列数据(Longitudinal Data),是指不同的横截面个体在不同的时间上的观测值的集合。从水平看,它包括了某一时间上的不同的横截面个体的数据;从纵向看,它包括了每一横截面的时间序列数据。因此,面板数据模型可以增加模型的自由度,降低解释变量之间的多重共线性程度,从而可能获得更精确的参数估计值。此外,面板数据可以进行更复杂的行为假设,并能在一定程度上控制缺失或不可观测变量的影响。但是,面板数据模型也不是万能的,它的设定和估计都存在一定的假定条件,如果应用不当的话同样会产

2、生偏误。,第一节 面板数据模型的基本分类,从形式上看,面板数据模型与一般的横截面数据模型或时间序列模型的区别在于模型中的变量有两个下角标,例如:(8.1)其中的i代表了横截面个体,如个人、家庭、企业或国家等,t代表时间。因此,N代表横截面的宽度,T代表时间的长度。是K1的向量,Xit是K个解释变量(这里暂不包括常数项)的第it个观测值。是随机扰动项(或随机误差项)。面板数据模型的基本分类与(8.1)式中的随机误差项的分解和假设有关。,一、双向误差构成模型(Two-way Error Component Model),假设(8.1)式中的随机误差项 可以分解为:(8.2)其中,表示横截面效应,它

3、不随时间的变动而变动,但却随着横截面个体的不同而不同;表示时间效应,它对同一时间的横截面个体是相同的,但却随着时间的变动而变动。,当(8.2)式成立并且假定:A1:(8.3)A2:(8.4)则(8.1)式的面板数据模型称为双向误差构成模型。因为它将(8.1)式中的误差项从横截面和时间两个维度上进行了分解。,二、单向误差构成模型(One-way Error Component Model),当把(8.1)式中的随机误差项 只分解为:(8.5)或(8.6)时,并且同样假设(8.3)式和(8.4)式成立,则(8.1)式的面板数据模型称为单向误差构成模型,因为它仅将(8.1)式中的误差项从横截面或时间

4、的维度上进行了分解。,三、固定效应(Fixed Effects)模型,无论是双向误差构成模型还是单向误差构成模型,当假设(8.2)式、(8.5)式或(8.6)式中的 或 是固定的(未知)常数时,则相应的面板数据模型称为固定效应模型。具体的,当假设(8.5)式中的 为固定的常数时,相应的面板数据模型称为横截面固定效应模型;当假设(8.6)式中的 为固定的常数时,相应的面板数据模型称为时间固定效应模型;当假设(8.2)式中的 和 都为固定的常数时,相应的面板数据模型称为同时横截面和时间固定效应模型或双向固定效应模型。,四、随机效应(Random Effects)模型,同样,无论是双向误差构成模型还

5、是单向误差构成模型,当假设(8.2)式、(8.5)式或(8.6)式中的 和/或 是一个随机变量而非固定的常数时,则相应的面板数据模型称为随机效应模型。具体的,当假设(8.5)式中的 为随机变量时,相应的面板数据模型称为横截面随机效应模型;当假设(8.6)式中的 为随机变量时,相应的面板数据模型称为时间随机效应模型;当假设(8.2)式中的 和 都为随机变量时,相应的面板数据模型称为同时横截面和时间随机效应模型或双向随机效应模型。,以上关于面板数据模型的基本分类的归纳可参见图8.1。,第二节 固定效应模型,最小二乘虚拟变量估计,协方差估计(内部估计),广义最小二乘估计,平均效应的估计,双向固定效应

6、模型,固定效应的检验,8.2.1 最小二乘虚拟变量估计,这里我们先以横截面固定效应模型为例来说明固定效应模型的估计方法。对于时间固定效应模型的估计,其方法与横截面固定效应模型的估计方法类似,只要将其中对横截面的处理改换为对时间的处理就可以了。将(8.5)式代入(8.1)式中,并且假定 为固定的常数,即可得以下的横截面固定效应模型:(8.7),假设,那么,(8.7)式的矩阵形式为:(8.8),(8.8)式中 对应的向量实际上是一个虚拟变量,设:这样(8.8)式可以进一步简化为:(8.9),设对(8.9)式进行OLS估计,实际上是通过对固定效应模型(8.7)式设定了N个虚拟变量后的最小二乘估计,因

7、此,对(8.9)式的OLS估计又被称为最小二乘虚拟变量估计(Least Squares Dummy Estimate,LSDE),模型(8.8)式或(8.9)式被称为最小二乘虚拟变量(LSDV)模型。,(8.9)式的OLS估计结果或(8.7)式的LSDE估计结果为:(8.10)当假定条件(8.3)式和(8.4)式满足时,LSDE估计量是最优线性无偏估计量(BLUE)。,8.2.2 协方差估计(内部估计),对于(8.10)式的LSDE的结果,需要涉及到(K+N)(K+N)矩阵的逆运算,过程较为复杂。实际的计算机计算一般是采用以下的较为简便的二步法进行的。(1)步骤一:设,对(8.7)式的每一个横

8、截面个体在时间上求平均,得以下模型:(8.11),将(8.7)式减去(8.11)式得:(8.12)(8.12)式与(8.7)式相比,没有了反应横截面固定效应的常数项。,对(8.12)式进行OLS估计,得到的参数估计量具有如(8.13)式的协方差的形式,因此这一估计过程被称为协方差估计(Covariance Estimate),得到的估计量称为协方差估计量。(8.13)与(8.10)式的LSDE相比,协方差估计只需要计算KK矩阵的逆,因此简化了计算的过程。,(2)步骤二:利用(8.13)式的估计结果,得到(8.14)由于在二步法的估计过程中,只用到了每一横截面个体内部不同时间的差异的信息,并未用

9、到不同横截面个体之间差异的信息,所以二步法的估计过程又称为内部估计(Within Estimate),其估计结果称为内部估计量。,但是,当解释变量X中包括有那些只随横截面个体的变化而变化但不随时间变动的变量时,由于在获得(8.12)式时会象 那样被消除,因此在(8.13)的估计结果中并不包含这些解释变量的系数的估计值。,需要注意的是,由于协方差估计或内部估计只估计了K个参数,因此其回归的方差 的估计值 是通过残差平方和除以(NTK)得到的。而LSDM中的方差的估计值 是通过用残差平方和除以(NTKN)得到的。因此,二者的关系为:(8.15),8.2.3 广义最小二乘估计,在(8.8)式中,第i

10、个方程可以写成:(8.16)令一个幂等转换矩阵Q为:(8.17),Q的秩Rank(Q)=T-1,且。将Q左乘(8.16)式得:(8.18)这样,(8.18)式等价于(8.12)式,也消除了横截面效应项,且因此,(8.18)式的OLS估计量,即(8.16)式的广义最小二乘(GLS)估计量会等价于前面介绍的协方差估计量,即(8.19),(8.19)式或(8.13)式的协方差估计量是无偏的,它的方差协方差矩阵为:(8.20)当N或T或二者都趋近于无穷时,协方差估计量是一致估计量。但(8.14)式中的 虽然是无偏的,但它仅当T趋近于无穷时是一致估计量。,8.2.4 平均效应的估计,当模型(8.1)式中

11、增加一个截距项 时,则固定效应模型(8.7)式相应的转变为:(8.21)为了避免在LSDM的设定中出现虚拟变量陷阱或完全的多重共线性,需要对(8.21)式中的 施加约束条件。一般假设。,根据前面的介绍,我们只能单独估计出 和(),而无法单独的估计出 和。在 的约束条件下,可以看成是横截面个体的平均截距项,则是第i个横截面个体与平均截距的差异。此时,依然可由协方差估计的结果(8.13)式获得,而 的估计量为:(8.22)其中,有了 和,即可进一步得到:(8.23),8.2.5 双向固定效应模型,将(8.2)式代入(8.1)式中,得到如下既反映横截面固定效应又反映时间固定效应的双向固定效应模型:(

12、8.24)(8.24)式的矩阵形式为(8.25),其中,,对(8.25)式进行OLS估计即可得参数、和 的估计值。但由于这一估计过程中需要估计K+N+T个参数,会损失较多的自由度,且有关的矩阵运算也较为繁杂,因此在实际应用中采用的是协方差估计法。对(8.24)式的每一个横截面在时间上求平均,得:(8.26)其中,。对(8.24)式的每一时间求横截面的平均,得:(8.27),其中,。另外,定义:将(8.26)式再对横截面平均或将(8.27)式再对时间平均,得:(8.28),由(8.24)式-(8.26)式-(8.27)式+(8.28)式,得:(8.29)对(8.29)进行OLS估计,可以得到 的

13、协方差估计量。和 的估计量为:(8.30)由于(8.29)式中消除了随时间不变或随横截面不变的解释变量,因此这些解释变量的系数的估计值不在 当中。,8.2.6 固定效应的检验,前面介绍的横截面固定效应模型为(8.31)实际上,(8.31)式是假设存在横截面个体效应。但是,如果这种效应不存在的话,则固定效应模型实际上就等于以下合并回归模型:(8.32)因此,检验横截面效应是否存在,实际上是把(8.31)式看成是无约束模型,(8.32)式看成是约束模型,构造以下F统计量进行检验:(8.33),其中,S1是(8.31)式的残差平方和,S2是(8.32)式的残差平方和。其中的约束条件为:同样,对于固定

14、时间效应模型:(8.34)检验固定时间效应是否存在的检验统计量为(8.35)其中S3为(8.34)式的残差平方和,其约束条件为:。,对于同时反映横截面固定效应和时间固定效应的双效应模型:(8.36)检验双效应(横截面效应和时间效应)是否存在的检验统计量为(8.37)其中S4为(8.36)式的残差平方和,其约束条件为:,,此外,还可以把(8.36)式作为无约束模型,以(8.31)式或(8.34)式为约束模型,构造F统计量检验在给定横截面固定效应下时间效应是否存在,或者检验在给定时间效应下横截面效应是否存在。,第三节随机效应模型,广义最小二乘(GLS)估计,FGLS估计,双向随机效应模型,随机效应

15、和固定效应的检验,当我们所获得的面板数据包括了总体的全部横截面个体时,固定效应模型也许是一个较为合理的模型,因为我们有理由相信横截面的个体之间存在着固定的差异。但是,当我们的横截面个体是从总体中抽样而来时,则可以认为横截面的差异是随机的,这时,随机效应模型也许更为合理。实际应用中,则还需要通过有关检验(将在本节的最后介绍)进一步确认。,8.3.1 广义最小二乘(GLS)估计,对于面板数据模型(8.38)当假设其随机误差项的构成联单 中,和 都是随机变量时,称(8.38)式为双向随机效应模型。对于随机效应模型,除了要满足(8.3)式和(8.4)式的A1和A2两个基本假定之外,还需要对随机项 和

16、进行假定:A3:,A4:服从独立同分布,且 服从独立同分布,且 A5:在A1A5假定之下,随机效应模型(8.38)式的扰动项 的方差为,为简化起见,我们暂时假定 中的,即假定只存在横截面随机效应而不存在时间随机效应,此时,(8.38)式的扰动项 的方差为:对 的协方差的分析如下:当ts时,,当ij时,因此,的方差协方差矩阵V为(8.39),由于V的非对角线上的元素不全为0,因此可以对随机效应模型(8.38)式进行GLS估计,得到 的BLUE估计量:(8.40)其中,(8.41),此时,(8.40)式等价于:(8.42)从(8.42)式可以看出,随机效应的GLS估计实际上是对(8.43)进行OL

17、S估计的结果。,当 时,因此。这里 是对(8.44)进行OLS估计的结果,表达式与(8.13)式相同。此外,可以证明,因此,对(8.38)式的GLS估计量比协方差估计量有效。实际上,GLS估计量是BLUE。当 时,这里 是对(8.38)式的合并最小二乘估计的结果;当 时,。,8.3.2 FGLS估计,以上GLS的估计首先要求 是已知的,根据(8.41)式,也就是需要知道 和 的值,但这是不可能的。实际估计中,一般是用 和 的一致估计量 和 代入到(8.41)式中,然后再得到 的GLS估计。这种用二步法所进行的GLS估计被称为可行的GLS(Feasible GLS,FGLS)估计,估计结果记为。

18、二步法的具体步骤如下:,(1)步骤一:对 和 的估计首先对(8.44)式进行OLS估计,得到 的协方差估计量,然后得到 的一致估计量 为:(8.45)然后进行组间估计,也就是以横截面个体的均值序列为对象,对模型,进行OLS估计,得到 的估计量称为组间估计量,记为:由此得到 的一致估计量(8.46),(2)步骤二:将(8.45)式和(8.46)式代入到(8.41)式中,得到:最后得到FGLS的估计结果:,当N和T都趋近于无穷时,是渐近有效的。即便对于适度的样本规模(T3,N-K9;T=2,N-K)10),依然比 有效。但是,当T很小时,由(8.46)式得到的 可能是负数,此时它违反了 的假设,F

19、GLS方法就无法进行了。,8.3.3 双向随机效应模型,在前面的分析中,我们假定。当 时,存在双向随机效应。我们已经知道,在A1A5假定之下,随机效应模型(8.38)的扰动项 的方差为此时对 的协方差的分析如下:当ts时,,当ij时,这时 的方差-协方差矩阵,它的逆矩阵为,,其中,的GLS估计结果为,8.3.4 随机效应和固定效应的检验,一、Breusch和Pagan的LM检验对于随机效应模型如果,则表明存在随机效应。因此,可以建立以下随机效应是否存在的假设检验。;或;,检验统计量为拉格朗日乘数(8.47)其中 为合并回归的残差,e为残差向量。,当H0成立时,LM服从 的分布。(8.47)还可

20、以写成以下矩阵的形式:其中D的定义同(8.9)式中的D。LM检验的结果如果无法拒绝H0,则表明随机效应存在的可能性不大。但是,如果当检验结果拒绝了H0的话,也不能保证随机效应一定存在,只能说明是可能存在随机效应,因为如果存在固定效应的话,同样可能会有拒绝H0的结果。,二、Hausman设定检验,对于随机效应模型来说,它假定,即随机的横截面效应 与解释变量之间是不相关的。但是在固定效应模型中,则允许这种相关性的存在。当随机效应模型存在解释变量的设定偏差,即遗漏重要解释变量时,会与解释变量之间产生相关,从而导致对随机效应模型的GLS估计的结果不再是一致估计量。,Hausman设定检验的思路是,当

21、成立时,对面板数据的GLS估计 和协方差估计 都是一致估计量,二者的差异不显著,此时采用随机效应模型可以提高估计的有效性。但是,当 时,两种估计的结果差异显著,则应采用固定效应模型。检验的思路如下:(随机效应)(固定效应),令可以证明,统计量 渐近分布于自由度为K的 分布。,第四节实证分析,美国航空公司成本函数的固定效应模型,美国航空公司成本函数的随机效应模型,8.4.1 美国航空公司成本函数的固定效应模型,美国6家航空公司19701984年共90个观测值的成本数据见表8.1。,表8.1 美国6家航空公司成本数据,1970-1984,我们考察以下简单的合并数据的成本函数:其中,Cost表示总成

22、本(单位:千美元);Q表示产出,用营收乘客里程(Revenue Passenger Miles)表示;PF表示燃料价格(Fuel Price);LF表示座位利用率(Load factor)。该模型实际上是假定6家航空公司的成本函数不存在个体的差异,并且在1970至1984年期间上不存在着时间上的变动。我们可以预期,和 的符号是正号,的符号是负号。用OLS法回归的EViews结果如表8.2所示。从表中的结果看,模型整体是显著的,单个变量的系数也都是显著的,并且符号与预期都是一致的。,表8.2 合并数据回归结果,根据本节所介绍的内容,我们还可以设定各种固定效应模型,即横截面固定效应模型、时间固定效

23、应模型、双效应模型。这些模型的Eviews估计结果如表8.3至表8.5所示。,表8.3 横截面固定效应模型的估计结果,表8.4 时间固定效应模型的估计结果,表8.5 双向固定效应模型的估计结果,表8.6综合了表8.2至表8.5的主要指标。从表8.6可以看到,各种固定效应模型都具有较高的拟合优度,模型整体都是显著的。但是,在时间固定效应模型的估计结果中可以看到,是不显著的,并且符号是负号,不符合预期。另外,在双向效应模型中,的符号虽然与预期相一致,但是却是不显著的。因此,我们首先可以否定后两种模型的设定方式。,表8.6 各种固定效应模型估计结果的比较(括号内为显著性水平p),此外,我们也可以进行

24、有关的固定效应检验。首先,我们以横截面固定效应模型为无约束模型,合并数据模型为约束模型,进行横截面效应的检验,计算的F统计量如下:在5%的显著性水平下,F(5,81)的临界值约等于2.3。因此,我们可以初步认定存在横截面的固定效应。在EViews6中,也可以直接进行这一检验。在横截面效应估计结果的窗口中,按viewFixed/Random Effects TestingRedundant Fixed EffectsLikelihood Ratio 的顺序,可以得到表8.7的结果。,表8.7 横截面固定效应的EViews检验结果,在表8.7中,横截面固定效应检验的F值为55.015289,这和我

25、们刚才计算的结果是一致的。同理,计算时间效应检验的F统计量为:这一结果小于5%显著性水平下的临界值F(14,72)=1.685。因此可以认为时间固定效应是不存在的。或者直接在时间固定效应的EViews的估计结果的窗口中,选择进行这一检验,检验的结果如表8.8所示。,表8.8 时间固定效应的EViews检验结果,8.4.2 美国航空公司成本函数的随机效应模型,我们仍然用表8.1中美国6家航空公司成本数据(19701984),估计横截面的随机效应模型,其EViews的估计结果见表8.9。,表8.9 横截面的随机效应模型的估计结果,在表8.9的回归结果中,我们可以看到,横截面随机效应模型拟合得也很好

26、,模型整体是显著的,回归系数的估计结果也是显著的,并且符号与预期一致。因此,我们到底应该选择固定效应模型还是随机效应模型呢?首先,我们进行Breusch和Pagan的LM检验,它需要用到合并回归的残差序列。计算的结果,得LM=425.30,它远远的超过了5%显著性水平下的临界值2(1)=3.84。因此,可以认为,可能存在随机效应。但是,如前面所述,它不排除固定效应存在的可能性。因此,我们进一步进行Hausman设定检验。EViews6中的Hausman设定检验的结果如表8.10所示。,表8.10 Hausman设定检验的结果,根据表8.10,我们无法拒绝原假设,也就是说,应该设定随机效应模型。

27、综合以上分析可以认为,横截面随机效应模型是更好的选择。,本章思考与练习,8.1 什么是双向误差模型和单向误差模型?他们之间有什么区别?8.2 什么是固定效应模型?它有什么基本假定?8.3 如何在横截面固定效应模型、时间固定效应模型和双向固定效应模型之间进行选择?8.4 什么是随机效应模型?它与固定效应模型的区别是什么?如果判断一个面板数据模型是固定效应模型还是随机效应模型?,8.5 以下是3家公司关于投资(y)和利润(x)在10个时期的数据,(1)合并数据,估计以下模型的最小二乘系数:(2)估计横截面固定效应模型,并检验假设:三家公司的常数项是相同的。(3)估计横截面随机效应模型,并进行LM检验。(4)进行Hausman设定检验。,8.6考虑面板数据模型:假定:求,并讨论应如何构造一个可行的GLS估计量。,8.7 当N=2,T=2时,在A1A5的假定下,写出双向随机效应模型的随机扰动项的方差协方差矩阵 的具体形式。8.8 对于当T=2时的一元横截面固定效应模型设该固定效应模型的斜率的协方差估计结果为。另外,对于一阶差分模型,其中,。假设一阶差分模型斜率的OLS估计的结果为。证明:=。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号