受限数据模型.ppt_三一办公31ppt.com

资源描述

《受限数据模型.ppt》由会员分享，可在线阅读，更多相关《受限数据模型.ppt（33页珍藏版）》请在三一办公上搜索。

1、受限被解释变量数据模型选择性样本 Model with Limited Dependent Variable Selective Samples Model,一、经济生活中的受限被解释变量问题二、“截断”问题的计量经济学模型三、“归并”问题的计量经济学模型,一、经济生活中的受限被解释变量问题,1、“截断”（truncation）问题,由于条件限制，样本不能随机抽取，即不能从全部个体，而只能从一部分个体中随机抽取被解释变量的样本观测值，而这部分个体的观测值都大于或者小于某个确定值。“掐头”或者“去尾”。消费函数例题：被解释变量最底200元、最高10000元。原因：抽样。离散选择模型的例题：银

2、行贷款，实际上是选择性样本，通常表现为“截断样本”。原因：问题的局限。,能够获得贷款的企业是全部有贷款需求的企业中表现良好的一部分,类似的实际问题很多,2、“归并”(censoring)问题,将被解释变量的处于某一范围的样本观测值都用一个相同的值代替。经常出现在“检查”、“调查”活动中，因此也称为“检查”(censoring)问题。需求函数模型中用实际消费量作为需求量的观测值，如果存在供给限制，就出现“归并”问题。被解释变量观测值存在最高和最低的限制。例如考试成绩，最高100，最低0，出现“归并”问题。,二、“截断”问题的计量经济学模型,1、思路,如果一个单方程计量经济学模型，只能从“掐头”或

3、者“去尾”的连续区间随机抽取被解释变量的样本观测值，那么很显然，抽取每一个样本观测值的概率以及抽取一组样本观测值的联合概率，与被解释变量的样本观测值不受限制的情况是不同的。如果能够知道在这种情况下抽取一组样本观测值的联合概率函数，那么就可以通过该函数极大化求得模型的参数估计量。,2、截断分布,如果服从均匀分布U(a,b)，但是它只能在(c,b)内取得样本观测值，那么取得每一个样本观测值的概率,为随机变量分布范围内的一个常数,服从正态分布,是标准正态分布条件概率函数,3、截断被解释变量数据模型的最大似然估计,求解该1阶极值条件，即可以得到模型的参数估计量。由于这是一个复杂的非线性问题，需要采用迭

4、代方法求解，例如牛顿法。,4、例题城镇居民消费模型-截断样本数据,将这组样本看成是在4500的条件下随机抽取得到,将这组样本看成是在4000的条件下随机抽取得到,参数由 0.750072变化为,似然函数值由228.6718减小为,似然函数值为什么变小？,将这组样本看成是在11500、4500条件下随机抽取得到,参数由 0.750072变化为,似然函数值由228.6718增大为,似然函数值为什么增大？,将这组样本看成是在0条件下随机抽取得到,结果与OLS相同似然函数值减小,似然函数值最小,5、为什么截断被解释变量数据模型不能采用普通最小二乘估计,对于截断被解释变量数据计量经济学模型，如果仍然把它

5、看作为经典的线性模型，采用OLS估计，会产生什么样的结果？因为yi只能在大于a的范围内取得观测值，那么yi的条件均值为：,由于被解释变量数据的截断问题，使得原模型变换为包含一个非线性项模型。如果采用OLS直接估计原模型：实际上忽略了一个非线性项；忽略了随机误差项实际上的异方差性。这就造成参数估计量的偏误，而且如果不了解解释变量的分布，要估计该偏误的严重性也是很困难的。,6、Heckman两步修正法,Sample Selection Bias as a Specification Error,Econometrica 47(1),1979,P153-161,市场工资方程,工作倾向方程,如何估计该

6、模型？第一步，用probit模型估计，利用全部样本；利用估计结果，计算i。第二步，利用选择性样本，将(1)作为一个待估计参数，估计模型，得到1的估计。,三、“归并”问题的计量经济学模型,1、思路,以一种简单的情况为例，讨论“归并”问题的计量经济学模型。即假设被解释变量服从正态分布，其样本观测值以0为界，凡小于0的都归并为0，大于0的则取实际值。如果y*以表示原始被解释变量，y以表示归并后的被解释变量，那么则有：,单方程线性“归并”问题的计量经济学模型为：,如果能够得到yi的概率密度函数，那么就可以方便地采用最大似然法估计模型，这就是研究这类问题的思路。由于该模型是由Tobin于1958年最早提

7、出的，所以也称为Tobin模型。,2、“归并”变量的正态分布,由于原始被解释变量y*服从正态分布，有,3、归并被解释变量数据模型的最大似然估计,该似然函数由两部分组成，一部分对应于没有限制的观测值，是经典回归部分；一部分对应于受到限制的观测值。这是一个非标准的似然函数，它实际上是离散分布与连续分布的混合。如何理解后一部分？,为什么要求和？,如果样本观测值不是以0为界，而是以某一个数值a为界，则有,估计原理与方法相同。,4、例题城镇居民消费模型-归并样本数据,11123.84,11040.34,Censored(11000)估计,参数估计结果、似然函数值都与OLS估计差异较大。为什么似然函数值大于OLS估计？,Censored(12000)估计与OLS相同,5、实际模型中的Truncation与Censored,时间序列样本，不考虑。截面上的全部个体作为样本，不考虑Truncation。按照抽样理论选取截面上的部分个体作为样本，不考虑Truncation。按照特定的规则选取截面上的部分个体作为样本，必须考虑Truncation。截面数据作样本，根据样本观测值的经济背景，决定是否考虑Censored。,

展开阅读全文