Chapter受限因变量模型.docx

上传人:小飞机 文档编号:4219526 上传时间:2023-04-10 格式:DOCX 页数:11 大小:223.73KB
返回 下载 相关 举报
Chapter受限因变量模型.docx_第1页
第1页 / 共11页
Chapter受限因变量模型.docx_第2页
第2页 / 共11页
Chapter受限因变量模型.docx_第3页
第3页 / 共11页
Chapter受限因变量模型.docx_第4页
第4页 / 共11页
Chapter受限因变量模型.docx_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《Chapter受限因变量模型.docx》由会员分享,可在线阅读,更多相关《Chapter受限因变量模型.docx(11页珍藏版)》请在三一办公上搜索。

1、第1章 受限因变量模型这一章讨论响应变量仅仅被部分观测到的情况。引入被部分观测到的潜在随机变量y*,y*的实际观测变量为yi。引入二元指示变量Di,如果aiy*bi,Di=1;否则,Di=0。即Di表示变量y*是否可以被观测得到。(ai,bi)称为观测区间。如果对于Di=1和Di=0都有实际观测数据,当Di=1时,潜在变量与实际观测变量相等,当Di=0时,实际观测变量同样有取值,但不等于潜在变量,这时称数据被归并(censored),即小于ai的数据被归并为ai,而大于bi的数据被归并为bi。用数学符号表示为:。(1)如果只有当Di=1时实际观测变量yi才有观测数据,即:当Di=1时,潜在变量

2、与实际观测变量相等,而当Di=0时,yi没有观测值,这时称数据被截断(truncated),即小于ai的数据和大于ai的数据被截断了。因此截断数据与归并数据的区别在于,对于观测区间外的数据,归并数据将将其都归并为一点,而截断数据没有观测值。将潜在随机变量y*的基本模型设定为:。(2)其中?i为位置参数,?为刻度参数;vi为独立于xi的连续随机扰动项,均值为0,方差为1,其分布函数、密度函数分别为F、f。在这些假定条件下,yi*的均值为?i,方差为?2,分布函数为,概率密度函数为(证明请参见附录1)。aiyi*a),称之为从下面截断(truncationfrombelow)或者是从左边截断(tr

3、uncationfromleft);如果变量只有在低于某一门限值b时才被观测到(xb),称之为从上面截断(truncationfromabove)或者是从右边截断(truncationfromright)。如图所示。图一截断分布图(上面截断(左图)、下面截断(右图)下面分析截断数据的分布函数、密度函数、均值和方差。1 截断变量的分布函数和密度函数给定模型(1)及相应的观测概率(2),那么第i个观测变量yi的条件分布函数为(证明请参见附录2):(4)(注:此处及后面的的定义均与前面相同)密度函数为:(5)从截断数据的密度函数(4)式我们可以推出从下面截断或从上面截断的各种不同分布的变量的密度函数

4、。读者可以参阅下面介绍的几个例子。例1 截断均匀分布的密度函数和分布函数如果x*在区间a,b上服从均匀分布(uniformdistribution),那么,(6)如果在x*=c处截断,即实际观测值x=x*,如果x*?c;x=c,如果x*c。这是左截断的例子,即右截断点=b。根据(5)式,在x=c处截断的随机变量x的截断分布的密度函数为:(7)分布函数为:(8)例2 截断正态分布的密度函数模型设定为:,yi=yi*,如果(9)yi=ai,如果yi=bi,如果其中viN(0,1)。即yi*N(?i,?2),其中?i、?分布表示yi的均值和标准差。以?、?分别表示标准正态分布密度函数和分布函数。那么

5、:(10)其中,。根据截断正态分布的密度函数公式:可直接得到时yi的密度函数:(11)根据截断正态分布的分布函数公式:可直接得到时yi的分布函数:(12)图二截断正态分布变量的累积分布函数图(设潜变量y*N(0,1),图中虚线表示标准正态分布函数,实线表示截断正态分布函数,截断点为-1、1)2 截断变量的均值和方差截断随机变量的均值和方差称之为截断均值(truncatedmean)和截断方差(truncatedvariance),由下面的(5)、(6)式可以推出各种不同截断分布的均值和方差。给定模型(9),yi的均值为:(13)其中,yi的方差为:(14)其中,。(证明请参见附录3)。例3:均

6、匀分布的截断均值和截断方差给定模型(6),截断变量x的均值和方差分别为:(15)例4:正态分布的截断均值和截断方差给定模型(9),那么yi的均值和方差分别为:(16)其中,yi的方差为:(17)其中,。其中,?、?分别表示正态分布的密度函数和分布函数。(1) 如果ci?-?,即数据只是在右边截断,这时?(ci)=0、?(ci)=0,因此:0(18a)(18b)(17a)式中称之为InverseMillsRatio,将(18a)式中称之为风险函数(HazardFunction)。结论1 。即,如果变量为从上面截断,则截断变量的均值小于初始变量的均值;如果变量为从下面截断,则截断变量的均值大于初始

7、变量的均值。结论2 截断变量的方差低于初始变量的方差。图三截断分布的均值(左图)、方差(右图)(假定潜在变量y*N(2,2)1.1.2 截断回归模型估计下面以左截断模型为例说明截断回归模型的估计。设回归模型为:(19)其中,viN(0,1)。那么,。根据例4,我们可以得到截断随机变量yi的均值和方差。(20)其中,(21)其中,由(20)式可以看出,截断均值为?和xi的非线性函数。同一般的非线性模型一样,变量xk对y的边际影响不等于其系数:(22)因为,所以变量xk对y的边际影响要小于其系数。yi的方差也存在类似的缩减(attenuation):(23)注:对于yia的方差与ui的方差相同,由

8、可知,yi存在异方差,为:(25)它是xi的函数。2 ML估计对于模型(19),由截断随机变量的概率密度函数可得yi的密度函数为,(26)可以得到yi的对数似然函数:(27)对于N个观测值(y1,yN),其联合对数似然函数为:(28)通过最优化方法可以解得上式的参数?和?的值。1.2 归并数据模型计量经济学当中经常能碰到数据的归并问题,简单地说,归并数据即是被解释变量在某个区间的观测值都转化为同一个值。比如,研究电影院的座位需求情况,电影院总的座位是20000个。如果实际的需求量少于20000,那么观测到的需求量就等于实际需求量;但如果实际需求量大于(等于)20000,那么实际可观测到的需求数

9、量只能为20000。这时我们说需求量数据被归并,即所有大于20000的数据都被归并为20000。格林(Greene,2000)列举了经验文献中归并数据的应用。其中包括:1, 家庭耐用品消费支出Tobin(1958)2, 婚外情次数Fair(1977,1978)3, 劳动力市场中妇女工作的小时数QuesterandGreene(1982)4, 罪犯重新入狱的次数White(1980)等。下面分别介绍归并数据的分布特征和模型估计。1.2.1 归并数据的分布特征如前所述,归并数据与截断数据的区别在于,归并变量包含Di=1和Di=0两种情况下的数据。(29)或者写作:。即当时,所有值被归并为ai;当时

10、,所有值被归并为bi。归并数据按照归并点ai,bi是随机的还是确定的分为固定归并(fixedcensoring)和随机归并(randomcensoring)两种。如果ai,bi是确定性的,我们称之为固定归并;如果ai,bi是随机的,我们称之为随机归并。本章只介绍固定归并的情况。归并数据按照归并点与观测区间的关系还可以分为左边归并和右边归并。如果:称潜在变量y*被从下面归并(censoredbelow)或者从左边归并(censoredfromleft);如果:称潜在变量y*被从上面归并(censoredabove)或者从左边归并(censoredfromright)。图归并变量示意图1归并变量的

11、分布函数和密度函数给定基本模型(1)的假定,yi的分布函数为:(30)归并变量的分布函数为一种混合分布(连续型和离散型综合在一起)。在yi=ai和yi=bi两点的概率分别为和,因此对于同一个潜在变量,其归并变量和截断变量的分布函数不相同,在观测区间内,归并分布同潜在变量的分布重叠在一起。图四归并正态分布变量的分布函数图密度函数(概率分布)为:(31)例5:正态分布归并变量的密度函数。假定潜在变量(latentvariable)yi*服从均值为?i、方差为?2的正态分布,viN(0,1)。yi为实际观测变量:yi=a,如果yi*?a;yi=b,如果yi*?b;yi=yi*,如果aiyi*bi。的

12、概率密度函数为:当yi*?ai时,yi=ai。其概率为,当aiyi*ai。当yi*?ai时,yi=ai。其概率为,当yi*ai时,yi与yi*的概率密度函数相同,因此,可以将yi的密度函数综合写成:,当yi*ai时,Di=1;否则,Di=0。(2)当仅从右边归并时,即:yi=bi,如果yi*?bi;yi=yi*,如果yi*bi。当yi*?bi时,yi=bi。其概率为,当yi*ai时,Di=1;否则,Di=0。2归并变量的均值和方差归并随机变量的均值和方差,我们称之为归并均值(censoredmean)和归并方差(censoredvariance)归并均值为:(32)其中,(33)归并方差为:(

13、34)其中,Di服从0-1分布,。(证明请参见附录4)。设潜在变量y*N(0,1),下图显示了标准正态分布和归并正态分布的分布函数间的差异,虚线表示正态分布函数,实线表示归并正态变量分布函数,归并点为-1、1,在区间-1,1上实线和虚线重合。例6:正态分布归并变量的均值和方差如果。yi=a,如果yi*?a;yi=b,如果yi*?b;yi=yi*,如果aiyi*bi。那么yi的均值为:(35)(证明请参见附录5)。(1)如果ai?-?(仅从上面归并),那么=(37),(38)其中,(2)如果bi?+?(仅从下面归并),那么=(39)(40)其中,(证明请参见格林(Greene(2000)P907

14、)。由(37)式和(39)式可以推出:结论3 对于从上面归并的变量来讲,当归并点为bi=0时,(41)其中对于从下面归并的变量来讲,当归并点为ai=0时,(42)其中例7:以电影院的座位需求为例,我们来看一下如何利用归并数据模型通过实际观测到的变量来推断潜在变量的均值、方差。设电影院总共有20000个座位,平均售出的座位数为18000,有25%的时间全部售出。那么潜在的座位需求量和方差各是多少呢?图二座位需求图解:设潜在座位需求量为?,座位需求模型可以设定为:这是一个归并点为b=20000的右归并数据模型。根据已知信息,25%的时间全部售出,即归并点的累积分布函数值为0.75(见图示),即?(

15、43)因此,;又由平均观测到的需求量为18000,根据归并变量的均值公式可得:(44)综合(43)(44)可以解出潜在变量y*的均值和方差分别为?=2426、?2=18362。即,对电影院座位的平均需求量是2426个。1.2.2 归并模型的极大似然估计设归并回归模型中,潜在变量y*和实际观测变量y有:,如果,如果,其它设f(u)、F(u)为u的密度函数和分布函数。假定u是均值为0,方差为?2的连续随机变量,u与x不相关。由归并模型的概率密度函数可知其对数似然函数为:虽然它是离散分布和连续分布的总和,但Amemiya(1973b)证明,按照普通的最优化方式使得对数似然函数极大化,得到的估计量仍然

16、具有极大似然估计量的合意的性质。归并回归模型的边际影响为:(证明请参见Greene(2000)P909)。例:考察囚犯在释放后被再次被捕入狱的时间,共1445名调查者,其中只有552名被再次被捕入狱。(file:recid.raw)。例:妇女就业时间的案例(在0点截断)。(file:mroz.raw)1.3 Tobit模型1.3.1 Tobit模型的设定与估计Tobin在1958年第一次提出归并模型,因此归并模型又称为Tobit模型。设潜在变量y*的回归模型为:,潜在变量y*的期望值为:其中,因此,解释变量对被解释变量y*的边际影响为常数:实际观测变量y的期望值为:而,将其代入上式可得:解释变

17、量对实际观测变量的边际影响是非线性的。由可得:其中,=因此,Tobit模型的似然函数为:利用最优化方法可以求出参数估计量。例:考察不同变量对妇女工作时间的影响。(file:mroz.raw)。共753个观测值,其中325个为0。用Tobit模型进行估计。Tobit模型的一个重要局限是,与直接相关。xk对的边际影响与?k呈正比,xk对的边际影响与?k也呈正比,即xk对的影响和对的影响在方向上是相同的。在一些情况下,这一暗含的假定可能不合适。1.3.2 模型的设定分析衡量Tobit模型是否合适的一种方法是将Tobit模型的估计结果与Probit模型的估计结果相比较。由Tobit模型的设定,。因此,

18、如果将y降级为二元选择变量w(如果y=0,w=0;如果y?0,w=1),那么上述Tobit模型就转化为Probit模型。如果Probit模型估计的结果与Tobit模型的估计结果近似相同,说明Tobit模型设定合适;否则,Tobit模型的设定不合适。需要注意的是,在Probit模型中,;而在Tobit模型中,。因此,应该将Probit模型中的参数估计量与Tobit模型中的参数估计量进行比较。如果与符号不同,或者二者差异很大,都表明Tobit模型设定不合适。事实上,Tobit模型是截断模型和Probit模型的结合。对于Tobit模型:(A)设共有N个观测值,其中yi=0有N0个观测值,yi=1有N

19、1个观测值,N=N0+N1。其似然函数为对于截断模型(截断点为0):其似然函数为:对于Probit模型其似然函数为:因此,截断模型与Probit模型的似然函数之和为:与Tobit模型的似然函数相比较,可以发现,Tobit模型是Truncated模型和Probit模型之和的约束形式,约束条件为:。因此,检验Tobit设定是否合适可以利用似然比检验方法。具体步骤为:Step1:分别估计截断模型、Probit模型和Tobit模型;Step2:计算似然比统计量:LR=2(LLTrunc+LLProbitLLTobit),自由度为Tobit模型中未知参数的个数。例:考察不同变量对妇女工作时间的影响。(f

20、ile:mroz.raw)。分析Tobit模型的估计是否恰当。如果检验结果表明Tobit模型设定不恰当,那么可以利用Hurdle(或称之为Two-Part)方法。(略)注:1在EViews中,截断回归模型和归并回归模型中,对于随机扰动项可以设定为三种不同的形式:标准正态、Logistic分布和极值分布。对于模型vi服从标准正态分布:E(vi)=0,Var(vi)=?2。vi服从Logistic分布:E(vi)=0,Var(vi)=?2/3。vi服从标准正态分布:E(vi)?0.5772,Var(vi)=?2/6。2对于归并模型,归并点可以已知,也可以未知;但对于截断模型,截断点必须是已知的。附录:截断分布的矩1 随机变量的截断分布特征2 标准正态分布变量的截断分布特征

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号