《[经管营销]EVIEWS用面板数据模型预测.doc》由会员分享,可在线阅读,更多相关《[经管营销]EVIEWS用面板数据模型预测.doc(50页珍藏版)》请在三一办公上搜索。
1、第8讲 用面板数据模型预测1面板数据定义时间序列数据或截面数据都是一维数据。时间序列数据是变量按时间得到的数据;截面数据是变量在固定时点的一组数据。面板数据是同时在时间和截面上取得的二维数据。面板数据也可以定义为相同截面上的个体在不同时点的重复观测数据或者称为纵向变量序列(个体)的多次测量。所以,面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据示意图见图1。面板数据从横截面(cross section)看,是由若干个体(entity, unit, individual)在某一时
2、点构成的截面观测值,从纵剖面(longitudinal section)看每个个体都是一个时间序列。图1 N=15,T=50的面板数据示意图图2是19782005年中国各省级地区消费性支出占可支配收入比率序列图。图2 1978-2005年中国各省级地区消费性支出占可支配收入比率序列图(价格平减过)面板数据用双下标变量表示。例如yi t, i = 1, 2, , N; t = 1, 2, , Ti对应面板数据中不同个体。N表示面板数据中含有N个个体。t对应面板数据中不同时点。T表示时间序列的最大长度。若固定t不变,yi ., ( i = 1, 2, , N)是横截面上的N个随机变量;若固定i不变
3、,y. t, (t = 1, 2, , T)是纵剖面上的一个时间序列(个体)。这里所讨论的面板数据主要指时期短而截面上包括的个体多的面板数据。利用面板数据建立模型的好处是:(1)由于观测值的增多,可以增加估计量的抽样精度。(2)对于固定效应回归模型能得到参数的一致估计量,甚至有效估计量。(3)面板数据建模比单截面数据建模可以获得更多的动态信息。例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。对于面板数据yi t, i =
4、1, 2, , N; t = 1, 2, , T,如果每个个体在相同的时期内都有观测值记录,则称此面板数据为平衡面板数据(balanced panel data)。若面板数据中的个体在相同时期内缺失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。案例1:1996-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费(CP)和人均收入(IP)关系研究(file:5panel02)1996-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费(CP)和人均收入(IP)数据见file:panel02。数据是7年的,每
5、一年都有15个数据,共105组观测值。人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消费面板数据按个体连线见图3,按截面连线见图4。人均收入面板数据按个体连线见图5,按截面连线见图6。图3 15个省级地区的人均消费序列(个体)(file:5panel02)图4 7个人均消费横截面数据(含15个地区) (每条连线表示同一年度15个地区的消费值) 图5 15个省级地区的人均收入序列(个体)(file:5panel02)图6 7个人均收入横截面数据(含15个地区) (每条连线表示同一年度15个地区的收入值)用CP表示消费,IP表示收入。AH, BJ, FJ, HB, HLJ, JL
6、, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。图7 人均消费对收入的面板数据散点图(15个时间序列叠加)图8 人均消费对收入的面板数据散点图(7个截面叠加)15个地区7年人均消费对收入的面板数据散点图见图7和图8。图7中每一种符号代表一个省级地区的7个观测点组成的时间序列。相当于观察15个时间序列。图8中每一种符号代表一个年度的截面散点图(共7个截面)。相当于观察7个截面散点图的叠加。 为了观察得更清楚,图9给出北京和内蒙古1996
7、-2002年消费对收入散点图。从图中可以看出,无论是从收入还是从消费看内蒙古的水平都低于北京市。内蒙古2002年的收入与消费规模还不如北京市1996年的大。图10给出该15个省级地区1996和2002年的消费对收入散点图。6年之后15个地区的消费和收入都有了相应的提高。 图9 北京和内蒙古1996-2002年消费对收入散点图 图10 1996和2002年15个地区的消费对收入散点图2面板数据模型分类用面板数据建立的模型通常有3种,即混合回归模型、固定效应回归模型和随机效应回归模型。2.1 混合回归模型(Pooled model)。如果一个面板数据模型定义为, yit = a + Xit b +
8、eit, i = 1, 2, , N; t = 1, 2, , T (1)其中yit为被回归变量(标量),a表示截距项,Xit为k 1阶回归变量列向量(包括k个回归量),b为k 1阶回归系数列向量,eit为误差项(标量)。则称此模型为混合回归模型。混合回归模型的特点是无论对任何个体和截面,回归系数a和b都相同。如果模型是正确设定的,解释变量与误差项不相关,即Cov(Xit,eit) = 0。那么无论是N,还是T,模型参数的混合最小二乘估计量(Pooled OLS)都是一致估计量。2.2 固定效应回归模型(fixed effects regression model)。固定效应模型分为3种类型,
9、即个体固定效应回归模型、时点固定效应回归模型和个体时点双固定效应回归模型。下面分别介绍。2.2.1个体固定效应回归模型(entity fixed effects regression model)如果一个面板数据模型定义为, yit = ai + Xit b +eit, i = 1, 2, , N; t = 1, 2, , T (3)其中ai是随机变量,表示对于i个个体有i个不同的截距项,且其变化与Xit有关系;Xit为k 1阶回归变量列向量(包括k个回归量),b为k 1阶回归系数列向量,对于不同个体回归系数相同,yit为被回归变量(标量),eit为误差项(标量),则称此模型为个体固定效应回归
10、模型。个体固定效应模型(3)的强假定条件是,E(eitai, Xit) = 0, i = 1, 2, , Nai作为随机变量描述不同个体建立的模型间的差异。因为ai是不可观测的,且与可观测的解释变量Xit的变化相联系,所以称(3)式为个体固定效应回归模型。个体固定效应回归模型也可以表示为 yit = a1 D1 + a2 D2 + +aN DN + Xit b +eit, t = 1, 2, , T (4)其中Di =注意:(1)在EViews5.0输出结果中ai是以一个不变的常数部分和随个体变化的部分相加而成。(2)在EViews 5.0以上版本个体固定效应对话框中的回归因子选项中填不填c输
11、出结果都会有固定常数项。个体固定效应回归模型的估计方法有多种,首先设法除去ai的影响,从而保证b估计量的一致性。(详见第3节,面板数据模型估计方法。)下面解释设定个体固定效应回归模型的原因。假定有面板数据模型 yit = b0 + b1 xit +b2 zi +eit, i = 1, 2, , N; t = 1, 2, , T (5)其中b0为常数,不随时间、截面变化;zi表示随个体变化,但不随时间变化的难以观测的变量。以案例1为例,省家庭平均人口数就是这样的一个变量。对于短期面板来说,这是一个基本不随时间变化的量,但是对于不同的省份,这个变量的值是不同的。上述模型可以被解释为含有N个截距,即
12、每个个体都对应一个不同截距的模型。令ai = b0 +b2 zi,于是(5)式变为 yit = ai + b1 xit +eit, i = 1, 2, , N; t = 1, 2, , T (6)这正是个体固定效应回归模型形式。对于每个个体回归函数的斜率相同(都是b1),截距ai却因个体不同而变化。可见个体固定效应回归模型中的截距项ai中包括了那些随个体变化,但不随时间变化的难以观测的变量的影响。ai是一个随机变量。因为zi是不随时间变化的量,所以当对个体固定效应回归模型中的变量进行差分时,可以剔除那些随个体变化,但不随时间变化的难以观测变量的影响,即剔出ai的影响。以案例1(file:5pa
13、nel02)为例得到的个体固定效应模型估计结果如下:输出结果的方程形式是 = 安徽+ x1t = (515.6 - 36.3) + 0.70 x1t (55.0) = 北京+x2t = (515.6 + 537.6) + 0.70 x2t 。 (55.0) = 浙江+x15t = (515.6 + 198.6) + 0.70 x15t (55.0) R2 = 0.99, SSEr = 2270386, t0.05 (88) = 1.98从结果看,北京、上海、浙江是自发消费(消费函数截距)最大的3个地区。图11 EViwes5.1个体固定效应回归模型的估计结果2.2.2 时点固定效应回归模型(t
14、ime fixed effects regression model)如果一个面板数据模型定义为, yit = gt + Xit b +eit, i = 1, 2, , N (7)其中gt是模型截距项,随机变量,表示对于T个截面有T个不同的截距项,且其变化与Xit有关系;yit为被回归变量(标量),eit为误差项(标量),满足通常假定条件。Xit为k 1阶回归变量列向量(包括k个回归变量),b为k 1阶回归系数列向量,则称此模型为时点固定效应回归模型。时点固定效应回归模型也可以加入虚拟变量表示为 yit =g0 + g1 W1 + g2 W2 + +g T WT + Xit b +eit, i
15、 = 1, 2, , N; t = 1, 2, , T (8)其中Wt =设定时点固定效应回归模型的原因。假定有面板数据模型 yit = g0 + b1 xit +g2 zt +eit, i = 1, 2, , N; t = 1, 2, , T (9)其中b0为常数,不随时间、截面变化;zt表示随不同截面(时点)变化,但不随个体变化的难以观测的变量。以案例1为例,“全国零售物价指数”就是这样的一个变量。对于不同时点,这是一个变化的量,但是对于不同省份(个体),这是一个不变化的量。上述模型可以被解释为含有T个截距,即每个截面都对应一个不同截距的模型。令gt = g0 +g2 zt,于是(9)式变
16、为 yit = gt + b1 xit +eit, i = 1, 2, , N; t = 1, 2, , T (10)这正是时点固定效应回归模型形式。对于每个截面,回归函数的斜率相同(都是b1),gt却因截面(时点)不同而异。可见时点固定效应回归模型中的截距项gt包括了那些随不同截面(时点)变化,但不随个体变化的难以观测的变量的影响。gt是一个随机变量。以例1为例得到的时点固定效应模型估计结果见图11,代数式如下: =0 +1996 +xi1 = (2.6 + 105.9) + 0.7789 xi1 , t = 1996 (0.04) (74.6)=0 +1997 +xi2 = (2.6 +
17、134.1) + 0.7789 xi2 , t = 1997 (0.04) (74.6) =0 +2002 +xi7 = (2.6 - 93.9) + 0.7789 xi7 , t = 2002 (0.04) (74.6) R2 = 0.9867, SSEr = 4028843, t0.05 (97) = 1.982.2.3 个体时点固定效应回归模型(time and entity fixed effects regression model)如果一个面板数据模型定义为, yit = a0 +ai +gt + Xit b +eit, i = 1, 2, , N; t = 1, 2, , T (
18、11)其中yit为被回归变量(标量);ai是随机变量,表示对于N个个体有N个不同的截距项,且其变化与Xit有关系;gt是随机变量,表示对于T个截面(时点)有T个不同的截距项,且其变化与Xit有关系;Xit为k 1阶回归变量列向量(包括k个回归量);b为k 1阶回归系数列向量;eit为误差项(标量)满足通常假定(eit Xit, ai, gt) = 0;则称此模型为个体时点固定效应回归模型。个体时点固定效应回归模型还可以表示为, yit = a0 +a1 D1+a2 D2 +aN DN + g1W1+ g2W2 +g TWT + Xit b +eit, (12)其中 Di = (13)Wt =
19、(14)如果模型形式是正确设定的,并且满足模型通常的假定条件,对模型(12)进行混合OLS估计,全部参数估计量都是不一致的。正如个体固定效应回归模型可以得到一致的、甚至有效的估计量一样,一些计算方法也可以使个体时点双固定效应回归模型得到更有效的参数估计量。以例1为例得到的截面、时点固定效应模型估计结果如下:图12 EViwes 5.1截面、时点双固定效应模型估计结果注意:对于第1个截面(t=1)EViwes输出结果中把(a +ai +g1), (i = 1, 2, , N)合在一起。第2, , T个截面以此类推。输出结果如下: =0 +1+1996 + x1,1996 = 681.9 - 68
20、.6 - 75.3 + 0.67 x1,1996 (安徽省) =0 +2+1996 + x2,1996 = 681.9 + 617.2 - 75.3 + 0.67x2,1996(北京市) =0 +1+1997 +x1,1997 = 681.9 - 68.6 +23.6 + 0.67 x1,1997 (安徽省) =0 +2+1997 + x2,1997 = 681.9 + 617.2 + 0.67x2,1997,(北京市) =0 +15 +2002+x15,2002 =183.39 +870.42+23.6 + 0.67x15,2002(浙江省)R2 = 0.9932, SSEr = 20456
21、70, t0.05 (83) = 1.98回归系数为0.67,这与个体固定效应回归模型给出的估计结果0.70基本一致。在上述三种固定效应回归模型中,个体固定效应回归模型最为常用。2.3 随机效应模型对于面板数据模型 yit = ai + Xitb +eit, i = 1, 2, , N; t = 1, 2, , T (15)如果ai为随机变量,其分布与Xit无关; Xit为k 1阶回归变量列向量(包括k个回归量),b为k 1阶回归系数列向量,对于不同个体回归系数相同,yit为被回归变量(标量),eit为误差项(标量),这种模型称为个体随机效应回归模型(随机截距模型、随机分量模型)。其假定条件是
22、ai iid(a, sa2)eit iid(0, se2)都被假定为独立同分布,但并未限定何种分布。 同理也可定义时点随机效应回归模型和个体时点随机效应回归模型,但个体随机效应回归模型最为常用。这里所说的个体随机效应回归模型其实是有别于真正的随机效应回归模型。对于个体随机效应模型,E(ai Xit) = a,则有,E(yit xit) = a + Xitb,对yit可以识别。所以随机效应模型参数的混合OLS估计量具有一致性,但不具有有效性。注意:术语“随机效应模型”和“固定效应模型”用得并不十分恰当,容易产生误解。其实固定效应模型应该称之为“相关效应模型”,而随机效应模型应该称之为“非相关效应
23、模型”。因为固定效应模型和随机效应模型中的ai都是随机变量。例1的个体随机效应模型估计结果如下:图13 个体随机效应模型估计结果3面板数据模型估计方法面板数据模型中b的估计量既不同于截面数据估计量,也不同于时间序列估计量,其性质随设定固定效应模型是否正确而变化。回归变量xit可以是时变的,也可以是非时变的。3.1 混合最小二乘(Pooled OLS)估计混合OLS估计方法是在时间上和截面上把NT个观测值混合在一起,然后用OLS法估计模型参数。给定混合模型 yit = a + Xit b +eit, i = 1, 2, , N; t = 1, 2, , T (19)如果模型是正确设定的,且解释变
24、量与误差项不相关,即Cov(Xit,eit) = 0。那么无论是N,还是T,模型参数的混合最小二乘估计量都具有一致性。对混合模型通常采用的是混合最小二乘(Pooled OLS)估计法。然而,在误差项服从独立同分布条件下由OLS法得到的方差协方差矩阵,在这里通常不会成立。因为对于每个个体i及其误差项来说通常是序列相关的。NT个相关观测值要比NT个相互独立的观测值包含的信息少。从而导致误差项的标准差常常被低估,估计量的精度被虚假夸大。如果模型存在个体固定效应,即ai与Xit相关,那么对模型应用混合OLS估计方法,估计量不再具有一致性。解释如下:假定模型实为个体固定效应模型yit = ai + Xi
25、t b +eit,但却当作混合模型来估计参数,则模型可写为yit = a + Xit b + (ai -a +eit) = a + Xit b + uit (20)其中uit = (ai -a +eit)。因为ai与Xit相关,也即uit与Xit相关,所以个体固定效应模型的参数若采用混合OLS估计,估计量不具有一致性。3.2平均数(between)OLS估计 平均数OLS估计法的步骤是首先对面板数据中的每个个体求平均数,共得到N个平均数(估计值)。然后利用yit和Xit的N组观测值估计参数。以个体固定效应回归模型yit = ai + Xit b +eit (21)为例,首先对面板中的每个个体求
26、平均数,从而建立模型= ai +b +, i = 1, 2, , N (22)其中=,=,=,i = 1, 2, , N。变换上式得= a +b +(a i - a +), i = 1, 2, , N (23)上式称作平均数模型。对上式应用OLS估计,则参数估计量称作平均数OLS估计量。此条件下的样本容量为N,(T=1)。 如果与(a i - a +)相互独立,a和b的平均数OLS估计量是一致估计量。平均数OLS估计法适用于短期面板的混合模型和个体随机效应模型。对于个体固定效应模型来说,由于ai和Xit相关,也即ai和相关,所以,回归参数的平均数OLS估计量是非一致估计量。3.3 离差变换(w
27、ithin)OLS估计 对于短期面板数据,离差变换OLS估计法的原理是先把面板数据中每个个体的观测值变换为对其平均数的离差观测值,然后利用离差变换数据估计模型参数。具体步骤是,对于个体固定效应回归模型yit = ai + Xitb +eit (24)中的每个个体计算平均数,可得到如下模型,= ai +b +其中、的定义见(22)式。上两式相减,消去了ai,得yit -= (Xit -)b + (eit -)此模型称作离差变换数据模型。对上式应用OLS估计,所得b的估计量称作离差变换OLS估计量。对于个体固定效应回归模型,b的离差变换OLS估计量是一致估计量。如果eit还满足独立同分布条件,b的
28、离差变换OLS估计量不但具有一致性而且还具有有效性。如果对固定效应ai感兴趣,也可按下式估计。=- (27)利用中心化(或离差变换)数据,计算回归参数估计量的方差协方差矩阵如下,() = ( Xit -) (Xit -)-1 (28)其中=。个体固定效应回归模型的估计通常采用的就是离差变换(within)OLS估计法。在短期面板条件下,即便ai的分布、以及ai和Xit的关系都已知到,ai的估计量仍不具有一致性。当个体数N不大时,可采用OLS虚拟变量估计法估计ai和b。离差变换OLS估计法的主要缺点是不能估计非时变回归变量构成的面板数据模型。比如Xit = Xi(非时变变量),那么有= Xi,计
29、算离差时有Xi -= 0。3.4 一阶差分(first difference)OLS估计 在短期面板条件下,一阶差分OLS估计就是对个体固定效应模型中的回归量与被回归量的差分变量构成的模型的参数进行OLS估计。具体步骤是,对个体固定效应回归模型yit = ai + Xit b +eit取其滞后一期关系式yit-1 = ai + Xit-1b +eit-1上两式相减,得一阶差分模型(ai被消去)yit -yit-1 = (Xit - Xit -1) b + (eit -eit-1) , i = 1, 2, , N; t = 1, 2, , T对上式应用OLS估计得到的b的估计量称作一阶差分OLS
30、估计量。尽管ai不能被估计,b的估计量是一致估计量。 在T2,eit独立同分布条件下得到的b的一阶差分OLS估计量不如离差变换OLS估计量有效。3.5 随机效应(random effects)估计法(可行GLS(feasible GLS)估计法)有个体固定效应模型yit = ai + Xit b +eiai,eit服从独立同分布。对其作如下变换yit -= (1-)m + (Xit -)b + vit (29)其中vit = (1-)ai + (eit -)渐近服从独立同分布,l = 1-,应用OLS估计,则所得估计量称为随机效应估计量或可行GLS估计量。当= 0时,(29)式等同于混合OLS
31、估计;当=1时,(29)式等同于离差变换OLS估计。 对于随机效应模型,可行GLS估计量不但是一致估计量,而且是有效估计量,但对于个体固定效应模型,可行GLS估计量不是一致估计量。面板数据模型估计量的稳健统计推断。在实际的经济面板数据中,N个个体之间相互独立的假定通常是成立的,但是每个个体本身却常常是序列自相关的,且存在异方差。为了得到正确的统计推断,需要克服这两个因素。对于第i个个体,当N,Xi的方差协方差矩阵仍然是TT有限阶的,所以可以用以前的方法克服异方差。采用GMM方法还可以得到更有效的估计量。EViwes中对随机效应回归模型的估计采用的就是可行(feasible )GLS估计法。4面
32、板数据模型设定的检验方法面板数据建模的一项重要任务就是判别模型中是否存在个体固定效应。以个体随机效应模型yit = ai + Xit b +eit,为例,无论是固定效应还是随机效应模型,ai都被看作是随机变量,并都有假定条件E(yit ai, Xit) = ai + Xit b 下面介绍两种检验方法,F检验和Hausman检验。4.1 F检验先介绍原理。F统计量定义为 F = (30)其中SSEr 表示施加约束条件后估计模型的残差平方和,SSEu 表示未施加约束条件的估计模型的残差平方和,m表示约束条件个数,T 表示样本容量,k表示未加约束的模型中被估参数的个数。在原假设“约束条件真实”条件下
33、,F统计量渐近服从自由度为( m , T k )的F分布。 F F( m , T k )以检验建立混合回归模型还是个体固定效应回归模型为例,介绍F检验的应用。建立假设H0:ai =a。模型中不同个体的截距相同(真实模型为混合回归模型)。H1:模型中不同个体的截距项ai不同(真实模型为个体固定效应回归模型)。F统计量定义为:F= (31)其中SSEr表示约束模型,即混合估计模型的残差平方和,SSEu表示非约束模型,即个体固定效应回归模型的残差平方和。约束条件为N个。k表示公共参数个数。以案例1为例,已知SSEr= 4824588,SSEu=2270386,个体数15。F= = 6.6 (32)F
34、0.05(15, 88) = 1.8因为F= 6.6 F0.05(15, 88) = 1.8,推翻原假设,比较上述两种模型,建立个体固定效应回归模型比混合回归模型更合理。以检验建立混合回归模型还是时点固定效应回归模型为例,介绍F检验的应用。建立假设H0:gt =g。模型中不同截面的截距相同(真实模型为混合回归模型)。H1:模型中不同截面的截距项gt不同(真实模型为时点固定效应回归模型)。F统计量定义为:F= (31)其中SSEr表示约束模型,即混合估计模型的残差平方和,SSEu表示非约束模型,即时点固定效应回归模型的残差平方和。约束条件为T个。k表示公共参数个数。以案例1为例,已知SSEr=
35、4824588,SSEu= 4028843,截面个数7。F= = 2.7 (32)F0.05(7, 96) = 2.1因为F= 2.7 F0.05(15, 88) = 2.1,推翻原假设,比较上述两种模型,建立时点固定效应回归模型比混合回归模型更合理。4.2 Hausman检验原假设与备择假设是H0: 个体效应与回归变量无关(个体随机效应回归模型)H1: 个体效应与回归变量相关(个体固定效应回归模型)例:=0.6976,s() = 0.0127(个体固定效应回归模型估计结果,对应图10);=0.7246,s() = 0.0106(个体随机效应回归模型估计结果,对应图13) H = = = 14
36、.89因为H =14.89 c20.05 (1) = 3.8,所以模型存在个体固定效应。应该建立个体固定效应回归模型。 注意:EViews 5.0可以直接进行Hausman检验(见案例9)。5面板数据建模案例分析案例1(file:5panel02):图14是混合估计对应数据的散点图。回归结果如下(EViwes输出见案例),CP = 129.63 + 0.76 IP(2.0) (79.7) 图14 混合估计散点图 图15 平均数估计散点图图15是平均值数据散点图。先对数据按个体求平均数和。然后用15组平均值数据回归,= -40.88 + 0.79(-0.3) (41.1) 图16 离差变换估计散
37、点图 图17 差分估计散点图图16是离差变换数据散点图。先计算CP、IP分别对、的离差变换数据,然后用离差变换数据计算OLS回归。CPM = 0.77 IPM (90)图17是一阶差分数据散点图。先对CP、IP各个体作一阶差分,然后用一阶差分数据回归。DCP = 0.71 DIP(24)由上一节知此问题应该建立个体固定效应回归模型,所以离差变换OLS估计方法是最有效的,参数估计值0.77最可信。案例2 美国公路交通事故死亡人数与啤酒税的关系研究(file:5panel01a)见Stock J H and M W Watson, Introduction to Econometrics, Add
38、ison Wesley, 2003第8章。美国每年有4万高速公路交通事故,约1/3涉及酒后驾车。这个比率在饮酒高峰期会上升。早晨13点25%的司机饮酒。饮酒司机出交通事故数是不饮酒司机的13倍。现有19821988年48个州共336组美国公路交通事故死亡人数(number)与啤酒税(beertax)的数据。 图18 1982年数据散点图(File: 5panel01a-graph01) 图19 1988年数据散点图(File:5panel01a- graph07)1982年数据的估计结果(散点图见图18)1982 = 2.01 + 0.15 beertax1982 (0.15) (0.13)1
39、988年数据的估计结果(散点图见图19)1988 = 1.86 + 0.44 beertax1988 (0.11) (0.13)图20 混合估计共336个观测值。估计结果仍不可靠。(file: 5panel01b)19821988年混合数据估计结果(散点图见图20)19821988 = 1.85 + 0.36 beertax19821988 (42.5) (5.9) SSE=98.75显然以上三种估计结果都不可靠(回归参数符号不对)。原因是啤酒税之外还有许多因素(如各州的路况、车型、交通立法等因素)影响交通事故死亡人数。从面板理论上说,不知混合回归模型是不是最优的模型形式。按个体固定效应回归模
40、型估计it = 2.375 + - 0.66 beertax it (24.5) (-3.5) SSE=10.35用F检验判断应该建立混合回归模型还是个体固定效应回归模型。H0:ai =a ,混合回归模型(约束截距项为同一参数)。H1:ai各不相同。个体固定效应回归模型(截距项任意取值)F= (以EViwes5.0计算自由度) = 50.8F0.05(48, 286) = 1.2因为F= 50.8 F0.05(14, 89) = 1.2,推翻原假设,比较上述两种模型,建立个体固定效应回归模型更合理。按双固定效应回归模型估计it = 2.37 + - 0.646 beertax it (23.3
41、) (-3.25) SSE=9.92用F检验判断应该建立混合回归模型还是个体时点双固定效应回归模型。H0:ai =a。gt =g。混合回归模型(约束截距项为同一参数)。H1:ai,gt各不相同。个体时点双固定效应回归模型(截距项任意取值)F= (以EViwes5.0计算自由度) = 45F0.05(55, 279) = 1.6因为F= 45 F0.05(55, 279) = 1.6,推翻原假设,比较上述两种模型,建立个体时点双固定效应回归模型更合理。以上两种模型回归系数的估计结果非常近似。F检验也说明,建立个体固定效应回归模型和双固定效应回归模型都要比混合回归模型合理。所以回归参数- 0.66
42、和- 0.646要比混合回归模型参数0.36合理。因为差分OLS估计也是估计固定效应回归模型的一种方法,下面讨论面板差分数据得到的估计结果。利用1988年和1982年数据的差分数据得估计结果(散点图见图21)。这个估计结果在符号上也是合理的。1988 -1982 = -0.072 - 1.04 (beertax1988 - beertax1982) (0.065) (0.36) 图21 差分数据散点图(File:5panel01a- graph08)因此问题应该建立个体固定效应回归模型,所以个体固定效应估计结果-0.66应当更可信。6面板数据模型的EViwes操作6.1 用EViwes 5.0
43、建立面板数据估计模型步骤。(file:5panel02)利用(例1)19962002年15个省级地区城镇居民家庭年人均消费性支出和年人均收入数据(不变价格数据)介绍面板数据模型估计步骤。(1)建立混合数据库(Pool)对象。首先建立年度工作文件(19962002)。在打开工作文件窗口的基础上,点击EViwes主功能菜单上的Objects键,选New Object功能(如图1),从而打开New Object(新对象)选择窗(如图2)。在Type of Object选择区选择Pool(合并数据库),并在Name of Object选择区为混合数据库起名Pool01(初始显示为Untitled)。点击图2中OK键,