微观计量经济学模型.ppt

上传人:仙人指路1688 文档编号:2900942 上传时间:2023-03-01 格式:PPT 页数:161 大小:1.76MB
返回 下载 相关 举报
微观计量经济学模型.ppt_第1页
第1页 / 共161页
微观计量经济学模型.ppt_第2页
第2页 / 共161页
微观计量经济学模型.ppt_第3页
第3页 / 共161页
微观计量经济学模型.ppt_第4页
第4页 / 共161页
微观计量经济学模型.ppt_第5页
第5页 / 共161页
点击查看更多>>
资源描述

《微观计量经济学模型.ppt》由会员分享,可在线阅读,更多相关《微观计量经济学模型.ppt(161页珍藏版)》请在三一办公上搜索。

1、第五讲 微观计量经济学模型Microeconometric Models,本讲内容,1 二元离散选择模型2 多元离散选择模型3 计数数据模型4 选择性样本模型5 持续时间数据模型,1 离散被解释变量数据计量经济学模型二元选择模型 Models with Discrete Dependent VariablesBinary Choice Model,一、二元离散选择模型的经济背景 二、二元离散选择模型 三、二元Probit离散选择模型及其参数估计 四、二元Logit离散选择模型及其参数估计,离散选择模型起源于Fechner于1860年进行的动物条件二元反射研究。1962年,Warner首次将它应

2、用于经济研究领域,用以研究公共交通工具和私人交通工具的选择问题。70、80年代,离散选择模型被普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策等经济决策领域的研究。模型的估计方法主要发展于80年代初期。,一、二元离散选择模型的经济背景,实际经济生活中的二元选择问题,研究选择结果与影响因素之间的关系。影响因素包括两部分:决策者的属性和备选方案的属性。对于单个方案的取舍。例如,购买者对某种商品的购买决策问题,求职者对某种职业的选择问题,投票人对某候选人的投票决策,银行对某客户的贷款决策。由决策者的属性决定。对于两个方案的选择。例如,两种出行方式的选择,两种商品的选择。由决策者的属性和备选

3、方案的属性共同决定。,二、二元离散选择模型,1、原始模型,对于二元选择问题,可以建立如下计量经济学模型。其中Y为观测值为1和0的决策被解释变量;X为解释变量,包括选择对象所具有的属性和选择主体所具有的属性。,左右端矛盾,由于存在这两方面的问题,所以原始模型不能作为实际研究二元选择问题的模型。需要将原始模型变换为效用模型。这是离散选择模型的关键。,具有异方差性,2、效用模型,作为研究对象的二元选择模型,第i个个体 选择1的效用,第i个个体 选择0的效用,注意,在模型中,效用是不可观测的,人们能够得到的观测值仍然是选择结果,即1和0。很显然,如果不可观测的U1U0,即对应于观测值为1,因为该个体选

4、择公共交通工具的效用大于选择私人交通工具的效用,他当然要选择公共交通工具;相反,如果不可观测的U1U0,即对应于观测值为0,因为该个体选择公共交通工具的效用小于选择私人交通工具的效用,他当然要选择私人交通工具。,3、最大似然估计,欲使得效用模型可以估计,就必须为随机误差项选择一种特定的概率分布。两种最常用的分布是标准正态分布和逻辑(logistic)分布,于是形成了两种最常用的二元选择模型Probit模型和Logit模型。最大似然函数及其估计过程如下:,标准正态分布或逻辑分布的对称性,似然函数,在样本数据的支持下,如果知道概率分布函数和概率密度函数,求解该方程组,可以得到模型参数估计量。,1阶

5、极值条件,三、二元Probit离散选择模型及其参数估计,1、标准正态分布的概率分布函数,2、重复观测值不可以得到情况下二元Probit离散选择模型的参数估计,关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。应用计量经济学软件。这里所谓“重复观测值不可以得到”,是指对每个决策者只有一个观测值。如果有多个观测值,也将其看成为多个不同的决策者。,例 贷款决策模型,分析与建模:某商业银行从历史贷款客户中随机抽取78个样本,根据设计的指标体系分别计算它们的“商业信用支持度”(CC)和“市场竞争地位等级”(CM),对它们贷款的结果(JG)采用二元离散变量,1表示贷款成功,0

6、表示贷款失败。目的是研究JG与CC、CM之间的关系,并为正确贷款决策提供支持。,样本观测值,CC=XYCM=SC,该方程表示,当CC和CM已知时,代入方程,可以计算贷款成功的概率JGF。例如,将表中第19个样本观测值CC=15、CM=1代入方程右边,计算括号内的值为0.1326552;查标准正态分布表,对应于0.1326552的累积正态分布为0.5517;于是,JG的预测值JGF=10.5517=0.4483,即对应于该客户,贷款成功的概率为0.4483。,输出的估计结果,模拟预测,预测:如果有一个新客户,根据客户资料,计算的“商业信用支持度”(XY)和“市场竞争地位等级”(SC),代入模型,

7、就可以得到贷款成功的概率,以此决定是否给予贷款。,3、重复观测值可以得到情况下二元Probit离散选择模型的参数估计,思路对每个决策者有多个重复(例如10次左右)观测值。对第i个决策者重复观测ni次,选择yi=1的次数比例为pi,那么可以将pi作为真实概率Pi的一个估计量。建立“概率单位模型”,采用广义最小二乘法估计。实际中并不常用。,对第i个决策者重复观测n次,选择yi=1的次数比例为pi,那么可以将pi作为真实概率Pi的一个估计量。,定义“观测到的”概率单位,V的观测值通过求解标准正态分布的概率分布函数的反函数得到,实际观测得到的,四、二元Logit离散选择模型及其参数估计,1、逻辑分布的

8、概率分布函数,Brsch-Supan于1987年指出:,如果选择是按照效用最大化而进行的,具有极限值的逻辑分布是较好的选择,这种情况下的二元选择模型应该采用Logit模型。,2、重复观测值不可以得到情况下二元logit离散选择模型的参数估计,关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。应用计量经济学软件。,Probit0.9999991.0000000.4472330.000000,3、重复观测值可以得到情况下二元logit离散选择模型的参数估计,思路对每个决策者有多个重复(例如10次左右)观测值。对第i个决策者重复观测ni次,选择yi=1的次数比例为pi,

9、那么可以将pi作为真实概率Pi的一个估计量。建立“对数成败比例模型”,采用广义最小二乘法估计。实际中并不常用。,用样本重复观测得到的pi构成“成败比例”,取对数并进行台劳展开,有,逻辑分布的概率分布函数,2 离散被解释变量数据计量经济学模型 多元选择模型 Models with Discrete Dependent VariablesMultiple Choice Model,一、多元离散选择模型的经济背景 二、一般多元离散选择Logit模型三、嵌套多元离散选择模型四、排序多元离散选择模型,一、多元离散选择模型的经济背景,1、经济生活中的多元选择问题,一般的多元选择问题 排序选择问题将选择对象

10、按照某个准则排队,由决策者从中选择。决策者对同一个选择对象的偏好程度。嵌套选择问题,2、社会生活中的多元选择问题,一般的多元选择问题 出行方式选择、职业选择、无预算约束的购买选择、无约束的迁移选择排序选择问题有预算约束的购买选择、有约束的迁移选择嵌套选择问题家电购买选择、选举问题,二、一般多元离散选择Logit模型,说明,在多元离散选择模型中,因为Probit模型需要对多元正态分布的整体进行评价,所以它的应用受到限制。逻辑分布更适合于效用最大化时的分布选择,所以应用最多的多元离散选择模型是Logit模型。Logit模型的似然函数能够快速可靠地收敛,当方案或者决策个体数量较大时,计算比较简便。,

11、一般多元选择Logit模型的思路,如果决策者i在(J+1)项可供选择方案中选择了第j项,那么其效用模型为:,如果(J+1)个随机误差项互不相关,并且服从类极值分布,选择j的概率,效用模型的解释变量中包括所有影响选择的因素,既包括决策者所具有的属性,也包括备选方案所具有的属性。备选方案所具有的属性是随着方案的变化而变化的。决策者所具有的属性中一部分是随着方案的变化而变化的,而一部分是不随着方案的变化而变化的。用Zij表示随着方案的变化而变化的那部分解释变量,Wi表示不随着方案的变化而变化的那部分解释变量。,实用的一般多元Logit选择模型又分3种情况。一是研究选择某种方案的概率与决策者的特征变量

12、之间的关系;二是研究选择某种方案的概率与决策者的特征变量以及方案的特征变量之间的关系;三是考虑到不同方案之间的相关性的情况。,Multinomial Logit Model多项式Logit模型名义Logit模型,Conditional Logit Model 条件Logit模型,Nested Logit模型嵌套模型,多元名义Logit离散选择模型及其参数估计,X中未包含备选方案所具有的属性变量,而参数向量B对不同的选择方案(即不同的方程)是不同的。,令B0=0,j=1,2,J,由对数似然函数最大化的一阶条件,利用Newton 迭代方法可以迅速地得到方程组的解,得到模型的参数估计量。,另一种估计

13、方法,可以计算得到相对于基准方案的对数概率比为:,两点注意:假设了原模型中(J+1)个随机误差项互不相关。对估计结果的解释不同。,如果对每个决策者进行重复观测,可以得到被解释变量的观测值。如果对每个决策者只进行一次观测,如何得到被解释变量的观测值?,多元条件Logit离散选择模型及其参数估计,选择某种方案的概率不仅与决策者的特征变量有关,而且也与方案的特征变量有关,模型为:,区别在于X的下标,由对数似然函数最大化的一阶条件,利用Newton 迭代方法可以迅速地得到方程组的解,得到模型的参数估计量。,三、嵌套多元离散选择模型,1、问题的提出,(J+1)个不同的选择方案之间具有相关性,而且必须考虑

14、这种相关性,表现为模型随机误差项相关。可行的思路是将(J+1)个选择方案分为L组,在每组内部的选择方案之间不具有相关性,而组间则具有相关性。就是将条件Logit模型中隐含的齐次方差性条件放松,允许方差在组间可以不同,但在组内仍然是同方差的。这样的模型被称为Nested Logit模型。,1、Nested Logit模型,表示对选择第l组产生影响的变量,表示在第l组内对选择第j种方案产生影响的变量,定义第l组的“内值”(Inclusive Value),3、估计方法,两阶段最大似然法,是一种有限信息估计方法。其具体步骤是:在组内,作为一个简单的条件Logit模型,估计参数;计算每组的“内值”;将

15、每组看成是一种选择方案,再进行简单的条件Logit模型的估计,得到参数和T的估计量。此时用到的贡献变量是Zl和Il。,完全信息最大似然法。将对数似然函数写为:,比两阶段最大似然法更有效,四、排序多元离散选择模型Multivariate Choice Modelfor Ordered Dada,1、问题的提出,作为被解释变量的(J+1)个选择结果本身是排序的,J优于(J1),2优于1,1优于0。决策者选择不同的方案所得到的效用也是排序的。一般多元离散选择模型中的效用关系不再适用。,2、效用关系,选择不同方案的效用关系:,3、模型,为了保证所有的概率都是正的,必须有:,假定服从正态分布,并且标准化

16、为服从期望为0、方差为1的正态分布。那么可以得到选择各个方案的概率,为正态分布的概率函数,4、估计,可以看作二元Probit模型的推广;采用最大似然法估计。,3 离散计数数据模型(Models For Count Data),一、问题的提出 二、泊松回归模型 三、泊松回归模型的扩展,一、问题的提出,1、经济、社会活动中的计数数据问题,发生事故次数的影响因素分析更换工作次数的影响因素分析婚姻问题研究,2、计量模型中的计数数据问题,通常计数数据模型的形式可以表示如下:,其中N代表被解释变量,通常为正整数,N和X之间的关系由经济理论决定。,该模型假定,通过调查能够得到一组代表被解释变量的数字(如0,

17、1,2,3)以及相应的解释变量的观察值。,建立模型的目的主要有两点:检验从数据中可以观察到的行为模式是否与理论预期相符;将N和X之间的内在联系用数量化的方式表现出来。从理论上讲,多元线性方程的参数估计方法也可以被应用来分析计数数据模型问题。但是很容易发现,计数数据中零元素和绝对值较小的数据出现得较为频繁,而且离散特征十分明显,利用这些特点,可以找到更合适的估计方法。,七十年代末以来,许多学者在计数数据模型的处理方法方面作出了较大贡献,包括:Gilbert(1979)提出了泊松回归模型,Hausman,Hall和Griliches(1984)提出了负二项回归模型和Panel方法,Gourier,

18、Monfort和Trogonon(1984)提出了仿最大似然法。其中,最先提出的泊松方法在研究计数数据模型问题中应用得非常广泛。,二、泊松回归模型,1、泊松回归模型,泊松回归模型假定,被解释变量yi服从参数为i的泊松分布,其中i同解释变量xi存在某种关系。该模型的初始方程为:,最常用的关于i的方程是对数线性模型,即,根据泊松分布的性质,2、泊松回归模型的ML估计,是一个非线性模型,最简单的方法是最大似然估计法。对数似然函数为:,可以利用Newton迭代法迅速地得到方程的参数估计值。,由于对数似然函数的Hessian矩阵对任何x和的取值是负定的。即LnL在稳定点有极大值,稳定点指满足一阶条件的。

19、,Newton-Raphson迭代:,3、拟合优度,由于泊松模型的条件均值非线性,且回归方程存在异方差,所以它不能产生类似于线性方程中的R2统计量。学者提出了若干个替代性的统计量,用以衡量该模型的拟合优度。,该统计量通过把泊松模型同只有一种观察值的模型相比较的方法,考察该模型的拟合优度。但是这个统计量有时为负,而且会随变量的减少而变小。,该统计量为各样本观察值的偏差之和。如果拟合达到完美状态,则该统计量为零。,分子和分母都衡量了模型在只有一种观察值的模型基础上的改进,分母为改进的最大空间。所以该统计量的数值在0到1之间。,“仿R2”统计量,4、假设检验,检验解释变量的约束。可以用三种标准的检验

20、方法来检验泊松回归模型的假设。,Wald统计量。其中为2受到限制的解释变量的参数,,LR统计量。分母描述受到限制后的方程的解释变量的似然概率。,三个统计量都服从2分布,自由度为受限变量的个数。如果统计值大于临界值,则拒绝原假设。,5、例题,轮船事故次数(accidents)与轮船型号(typea、b、c、d、e)、制造年份(year60、65、70、75)、投入使用年份(yearop60、75)和实际服务时间(servmonth)的关系研究。样本:34,注意入选的解释变量,部分参数的经济意义缺乏合理解释。只作为试例。,ACCIDENTS=EXP(1.645572184*TYPEA+2.3534

21、13299*TYPEB+0.4488787812*TYPEC+0.8131627072*TYPED+1.401045748*TYPEE-0.6726004217*YEAR60+0.3731874354*YEAR65+0.7675535312*YEAR70-0.6994767419*YEAROP60+6.388715642e-05*SERVMONTH),用LR统计量进行假设检验,0假设为:制造年份对事故次数无影响,拒绝0假设,预测结果与观测值的比较,OLS估计与计数数据估计拟合值的比较,三、泊松回归模型的扩展,1、不平均分布检验(Overdispersion),泊松模型假定被解释变量的均值等于方

22、差,这是一个非常强的假设,许多学者对此提出质疑,并且发展了一些新的方法放松这一假设。首先介绍该假设条件是否成立的检验。,基于回归的检验方法 Cameron和Trivedi在1990年提出,i是由泊松模型得出的被解释变量的预测值,拉格朗日乘子检验法基本思想也是放松泊松模型中均值等于方程的假设。泊松分布是负二项分布的一种特殊情况,当对负二项分布的某个参数加以一定的限制条件后,就能够得到泊松分布。在一般情况下,如果一个模型是在对另一个替代模型的参数加以限制的条件下得到的,那么就可以得到LM统计量。,wi的值取决于替代模型的分布函数。对负二项分布模型来说,这个权重为1。,2、负二项分布模型(Negat

23、ive Binomial Regression Model),由于泊松模型假定被解释变量的均值等于方差,人们提出了许多替代该模型的方法。其中应用得较多的是负二项分布模型。Cameron和Trivedi在1986年提出负二项分布的一种形式。,引入无法观察的随机影响来使泊松模型一般化,被解释变量的条件分布,被解释变量的分布,该分布是负二项分布的一种形式。其条件均值为i,条件方差为i(1+1/)i)。由概率密度可以求得最大似然函数,再通过迭代法求出参数估计。对于负二项分布假设可以用Wald或者LR统计量进行检验。,负二项分布回归模型,ACCIDENTS=EXP(1.520444133*TYPEA+2

24、.270100317*TYPEB+0.4581374106*TYPEC+0.6449816375*TYPED+1.358883951*TYPEE-0.8616385402*YEAR60+0.2032389361*YEAR65+0.9661619692*YEAR70-0.7020010667*YEAROP60+7.402025976e-05*SERVMONTH),拟合效果没有明显改善,3、零变换泊松模型(Hurdle and Zero-Altered Possion Models),在某些情况下,被解释变量为零值的产生过程与它取正值的过程差异很大。于是就有人提出了零变换泊松模型来描述这个事实。M

25、ullahey(1986)最先提出了一个Hurdle模型,用白努利分布来描述被解释变量分别为零值和正值的概率。,改变了被解释变量取零值的概率,但是所有取值的概率之和保持为1,Mullahey(1986),Lambert(1992)等人还分析了在hurdle模型的一种扩展情况,即假定被解释变量的零值产生于两个区域(regime)中的一个。在一个区域里,被解释变量总是零,而另一个区域里,被解释变量的取值符合泊松过程,既可能产生零,也可能产生其他数值。如Lambert对给定时间段内生产的次品数量建立的模型,在生产过程得到控制的情形下,次品产出为零,而生产过程不受控制时,产生的次品数量服从泊松分布,既

26、可能为零,也可能不为零。模型形式如下:,如果用z表示白努利分布的两种情况,事件发生在区域1时令z=0,发生在区域2时令z=1,并用y*表示区域2内被解释变量服从的泊松过程,则所有观察值都可以表示为z y*。于是这个分离模型可表示为(式中F为设定的分布函数):,Lambert(1992)和Greene(1994)考虑了许多方法,其中包括应用logit和probit模型描述两个区域各自的发生概率。这些修正的方法都改变了泊松过程,即均值和方差不再相等。关于分离模型的进一步探讨比较复杂,参考Greene的教科书和相关文献。,4 受限被解释变量数据模型选择性样本 Model with Limited D

27、ependent Variable Selective Samples Model,一、经济生活中的受限被解释变量问题 二、“截断”问题的计量经济学模型 三、“归并”问题的计量经济学模型,一、经济生活中的受限被解释变量问题,1、“截断”(truncation)问题,由于条件限制,样本不能随机抽取,即不能从全部个体,而只能从一部分个体中随机抽取被解释变量的样本观测值,而这部分个体的观测值都大于或者小于某个确定值。“掐头”或者“去尾”。消费函数例题:被解释变量最底200元、最高10000元。原因:抽样。离散选择模型的例题:银行贷款,实际上是选择性样本,通常表现为“截断样本”。原因:问题的局限。,能

28、够获得贷款的企业是全部有贷款需求的企业中表现良好的一部分,类似的实际问题很多,2、“归并”(censoring)问题,将被解释变量的处于某一范围的样本观测值都用一个相同的值代替。经常出现在“检查”、“调查”活动中,因此也称为“检查”(censoring)问题。需求函数模型中用实际消费量作为需求量的观测值,如果存在供给限制,就出现“归并”问题。被解释变量观测值存在最高和最低的限制。例如考试成绩,最高100,最低0,出现“归并”问题。,二、“截断”问题的计量经济学模型,1、思路,如果一个单方程计量经济学模型,只能从“掐头”或者“去尾”的连续区间随机抽取被解释变量的样本观测值,那么很显然,抽取每一个

29、样本观测值的概率以及抽取一组样本观测值的联合概率,与被解释变量的样本观测值不受限制的情况是不同的。如果能够知道在这种情况下抽取一组样本观测值的联合概率函数,那么就可以通过该函数极大化求得模型的参数估计量。,2、截断分布,如果服从均匀分布U(a,b),但是它只能在(c,b)内取得样本观测值,那么取得每一个样本观测值的概率,为随机变量分布范围内的一个常数,服从正态分布,是标准正态分布条件概率函数,3、截断被解释变量数据模型的最大似然估计,求解该1阶极值条件,即可以得到模型的参数估计量。由于这是一个复杂的非线性问题,需要采用迭代方法求解,例如牛顿法。,4、例题城镇居民消费模型-截断样本数据,将这组样

30、本看成是在4500的条件下随机抽取得到,将这组样本看成是在4000的条件下随机抽取得到,参数由 0.750072变化为,似然函数值由228.6718减小为,似然函数值为什么变小?,将这组样本看成是在11500、4500条件下随机抽取得到,参数由 0.750072变化为,似然函数值由228.6718增大为,似然函数值为什么增大?,将这组样本看成是在0条件下随机抽取得到,结果与OLS相同似然函数值减小,似然函数值最小,5、为什么截断被解释变量数据模型不能采用普通最小二乘估计,对于截断被解释变量数据计量经济学模型,如果仍然把它看作为经典的线性模型,采用OLS估计,会产生什么样的结果?因为yi只能在大

31、于a的范围内取得观测值,那么yi的条件均值为:,由于被解释变量数据的截断问题,使得原模型变换为包含一个非线性项模型。如果采用OLS直接估计原模型:实际上忽略了一个非线性项;忽略了随机误差项实际上的异方差性。这就造成参数估计量的偏误,而且如果不了解解释变量的分布,要估计该偏误的严重性也是很困难的。,6、Heckman两步修正法,Sample Selection Bias as a Specification Error,Econometrica 47(1),1979,P153-161,市场工资方程,工作倾向方程,如何估计该模型?第一步,用probit模型估计,利用全部样本;利用估计结果,计算i。

32、第二步,利用选择性样本,将(1)作为一个待估计参数,估计模型,得到1的估计。,三、“归并”问题的计量经济学模型,1、思路,以一种简单的情况为例,讨论“归并”问题的计量经济学模型。即假设被解释变量服从正态分布,其样本观测值以0为界,凡小于0的都归并为0,大于0的则取实际值。如果y*以表示原始被解释变量,y以表示归并后的被解释变量,那么则有:,单方程线性“归并”问题的计量经济学模型为:,如果能够得到yi的概率密度函数,那么就可以方便地采用最大似然法估计模型,这就是研究这类问题的思路。由于该模型是由Tobin于1958年最早提出的,所以也称为Tobin模型。,2、“归并”变量的正态分布,由于原始被解

33、释变量y*服从正态分布,有,3、归并被解释变量数据模型的最大似然估计,该似然函数由两部分组成,一部分对应于没有限制的观测值,是经典回归部分;一部分对应于受到限制的观测值。这是一个非标准的似然函数,它实际上是离散分布与连续分布的混合。如何理解后一部分?,为什么要求和?,如果样本观测值不是以0为界,而是以某一个数值a为界,则有,估计原理与方法相同。,4、例题城镇居民消费模型-归并样本数据,11123.84,11040.34,Censored(11000)估计,参数估计结果、似然函数值都与OLS估计差异较大。为什么似然函数值大于OLS估计?,Censored(12000)估计与OLS相同,5、实际模

34、型中的Truncation与Censored,时间序列样本,不考虑。截面上的全部个体作为样本,不考虑Truncation。按照抽样理论选取截面上的部分个体作为样本,不考虑Truncation。按照特定的规则选取截面上的部分个体作为样本,必须考虑Truncation。截面数据作样本,根据样本观测值的经济背景,决定是否考虑Censored。,5 持续时间数据模型Duration Data Model,一、计量经济学中持续时间分析问题的提出二、Hazard比率与Hazard比率模型,一、计量经济学中持续时间分析问题的提出,经济生活中的持续时间问题,以某项活动的持续时间作为研究对象的经济问题。失业问题

35、罢工问题设备运行时间问题,持续时间被解释变量的计量经济学问题,以失业的持续时间分析为例,看看这类计量经济学问题的特征。以失业的持续时间t 作为被解释变量,以年龄、受教育程度、家庭状况、工作经历、健康状况等作为解释变量,建立如下失业模型:,模型的个特点:失业已经持续的时间并不是失业持续时间的真实反映,不能作为失业持续时间的观测值。取得部分解释变量的样本观测值存在困难,因为它们在持续时间内是变化的。失业者关心的不是如何解释失业已经持续的时间,而是希望知道在观测值t时刻之后的最短时间内能够重新就业的可能性为多大。,首先从上述持续时间被解释变量计量经济学模型的第3个特征入手;并假设解释变量的样本观测值

36、在失业持续的时间内是不变化的,即忽略上述第2个问题;然后再扩展到两类样本数据,即第个问题。,二、Hazard比率与Hazard比率模型,Hazard比率,随机变量T具有连续的概率密度函数f(t),t是T的一个观测值,即事件已经持续的时间。应该有:,定义为生存函数,事件在t之后的一个短时间内结束的概率,称为Hazard比率。事件以该比率在已经持续t时间后结束。也称风险函数。,Hazard比率与t的概率密度函数f、条件分布函数F和生存函数S之间的关系,不考虑外生变量的Hazard比率模型,既然人们更关心事件在t之后的一个短时间内结束的可能性,而该可能性又可以通过Hazard比率来描述,那么可以直接

37、建立Hazard比率模型,估计Hazard比率的参数,然后再通过积分得到生存函数和条件分布函数。这就是持续时间被解释变量计量经济学模型的总的研究思路。如何构造和求解Hazard比率模型,首先通过两个简单的例子来说明。,Hazard比率为一个常数,假设Hazard比率为一个常数,即假设事件在t之后的一个短时间内结束的概率是相同的,与已经持续的时间无关。这种事件在实际中也是存在的,被称为“无记忆”的过程。那么即有:,微分方程的解,因为,得到K=1,这就是说t的生存函数S服从指数分布。如何估计常数?因为对于指数分布,有:,即为的最大似然估计量。其中的f由样本观测值计算得到,于是得到Hazard比率的

38、估计量。,Hazard比率为一个线性函数,由t的密度函数和样本观测值,利用最大似然法,可以得到参数、的估计量,进而得到Hazard比率的估计量,使该持续时间计量经济学问题得到解决。,如果得到参数的估计量为正,表示Hazard比率随着持续时间的增长而增大,也表示在t之后的一个短时间内结束事件的概率随着持续时间的增长而增大;如果得到参数的估计量为负,则反之。,几种常用的Hazard比率模型,在上面的描述中,首先对Hazard比率作出假设,导出生存函数和密度函数,然后利用最大似然法估计参数。如果人们并不首先对Hazard比率作出假设,而是直接对生存函数所服从的分布作出假设,然后直接估计该分布的参数,

39、结果是相同的。这就是实际中通常采用的思路。其过程如下:,下列分布经常被作为生存函数S(t)的分布。和p分别为location parameter和 scale parameter。,韦伯分布,对数正态分布,对数逻辑分布,对于生存函数的每种分布,都有对应的Hazard比率函数。,考虑两类样本数据的最大似然估计,必须将持续时间样本观测值分为两类,一类是对已经结束的事件进行的调查,一类是对仍处于持续过程中的事件进行的调查。对于前者,持续时间的观测值是真实的;而对于后者,样本观测值实际上是“归并”数据。Hazard比率模型的对数似然函数为:,考虑外生变量的Hazard比率模型,对事件持续进行因果分析,则要引入影响持续时间的各种因素。但是,人们并不建立以持续时间为被解释变量的模型,而是以Hazard比率为被解释变量,以影响持续时间的各种因素为解释变量建立模型,而且为了估计的方便,对模型的关系类型作出特定的假设。,例如,对于生存函数服从韦伯分布的情况,建立如下模型,并且假设在持续的时间内,Xi具有不变的观测值。,等价的线性模型,采用最大似然法估计等价的线性模型。考虑到持续时间样本观测值分为两类,令,利用,对简化的对数似然函数求极大,得到关于参数估计量的方程组,采用牛顿迭代方法求解方程组,即得到参数估计量。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号