计量经济学-理论和应用5-定性变量建模.ppt

上传人:牧羊曲112 文档编号:6376441 上传时间:2023-10-22 格式:PPT 页数:47 大小:259.50KB
返回 下载 相关 举报
计量经济学-理论和应用5-定性变量建模.ppt_第1页
第1页 / 共47页
计量经济学-理论和应用5-定性变量建模.ppt_第2页
第2页 / 共47页
计量经济学-理论和应用5-定性变量建模.ppt_第3页
第3页 / 共47页
计量经济学-理论和应用5-定性变量建模.ppt_第4页
第4页 / 共47页
计量经济学-理论和应用5-定性变量建模.ppt_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《计量经济学-理论和应用5-定性变量建模.ppt》由会员分享,可在线阅读,更多相关《计量经济学-理论和应用5-定性变量建模.ppt(47页珍藏版)》请在三一办公上搜索。

1、计量经济学理论和应用,张红霞,关于定性变量的建模,定性变量作为解释变量 虚拟变量模型定性变量作为被解释变量 离散选择模型,虚拟变量模型,虚拟变量的基本含义虚拟变量的引入虚拟变量的设置原则,虚拟变量的基本含义,许多经济变量是可以定量度量的,如:商品需求量、价格、收入、产量等但也有一些影响经济变量的因素无法定量度量,如:职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等等。为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”,,这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称

2、为虚拟变量(dummy variables),记为D。,例如,反映文程度的虚拟变量可取为:1,本科学历 D=0,非本科学历,一般地,在虚拟变量的设置中:基础类型、肯定类型取值为1;比较类型,否定类型取值为0。,虚拟变量的基本含义,概念:,同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型。一个以性别为虚拟变量考察企业职工薪金的模型:,其中:Yi为企业职工的薪金,Xi为工龄,Di=1,若是男性,Di=0,若是女性。,虚拟变量的基本含义,虚拟变量做为解释变量引入模型有两种基本方式:加法方式和乘法方式。,企业男职工的平均薪金为:,上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式。在该模型中,

3、如果仍假定E(i)=0,则 企业女职工的平均薪金为:,1、加法方式,虚拟变量的引入,几何意义:,假定20,则两个函数有相同的斜率,但有不同的截距。意即,男女职工平均薪金对工龄的变化率是一样的,但两者的平均薪金水平相差2。可以通过传统的回归检验,对2的统计显著性进行检验,以判断企业男女职工的平均薪金水平是否有显著差异。,0,2,虚拟变量的引入,例:在横截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。,教育水平考虑三个层次:高中以下,高中,大学及其以上,模型可设定如下:,这时需要引入两个虚拟变量:,虚拟变量的引入,在E(i)=0 的初始假定下,高中以下、高中、大学及其以上教育水平下个人

4、保健支出的函数:,高中以下:,高中:,大学及其以上:,假定32,其几何意义:,虚拟变量的引入,还可将多个虚拟变量引入模型中以考察多种“定性”因素的影响。,如在上述职工薪金的例中,再引入代表学历的虚拟变量D2:,本科及以上学历本科以下学历,职工薪金的回归模型可设计为:,虚拟变量的引入,女职工本科以下学历的平均薪金:,女职工本科以上学历的平均薪金:,于是,不同性别、不同学历职工的平均薪金分别为:,男职工本科以下学历的平均薪金:,男职工本科以上学历的平均薪金:,虚拟变量的引入,2、乘法方式,加法方式引入虚拟变量,考察:截距的不同,许多情况下:往往是斜率就有变化,或斜率、截距同时发生变化。斜率的变化可

5、通过以乘法的方式引入虚拟变量来测度。,例:根据消费理论,消费水平C主要取决于收入水平Y,但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。,虚拟变量的引入,这里,虚拟变量D以与X相乘的方式引入了模型中,从而可用来考察消费倾向的变化。假定E(i)=0,上述模型所表示的函数可化为:,正常年份:,反常年份:,如,设,消费模型可建立如下:,虚拟变量的引入,当截距与斜率发生变化时,则需要同时引入加法与乘法形式的虚拟变量。,例,考察1990年前后的中国居民的总储蓄-收入关系是否已发生变化。表中给出

6、了中国19792001年以城乡储蓄存款余额代表的居民储蓄以及以GNP代表的居民收入的数据。,虚拟变量的引入,虚拟变量的引入,以Y为储蓄,X为收入,可令:,1990年前:Yi=1+2Xi+1i i=1,2,n1 1990年后:Yi=1+2Xi+2i i=1,2,n2 则有可能出现下述四种情况中的一种:(1)1=1,且2=2,即两个回归相同,称为重合回归(Coincident Regressions);(2)11,但2=2,即两个回归的差异仅在其截距,称为平行回归(Parallel Regressions);(3)1=1,但22,即两个回归的差异仅在其斜率,称为汇合回归(Concurrent Re

7、gressions);(4)11,且22,即两个回归完全不同,称为相异回归(Dissimilar Regressions)。,虚拟变量的引入,这一问题可通过引入乘法形式的虚拟变量来解决。,将n1与n2次观察值合并,并用以估计以下回归:,Di为引入的虚拟变量:,于是有:,可分别表示1990年后期与前期的储蓄函数。,虚拟变量的引入,在统计检验中,如果4=0的假设被拒绝,则说明两个时期中储蓄函数的斜率不同。,具体的回归结果为:,(-6.11)(22.89)(4.33)(-2.55),由3与4的t检验可知:参数显著地不等于0,强烈示出两个时期的回归是相异的,储蓄函数分别为:,1990年前:,1990年

8、后:,=0.9836,虚拟变量的引入,3、临界指标的虚拟变量的引入,在经济发生转折时期,可通过建立临界指标的虚拟变量模型来反映。例如,进口消费品数量Y主要取决于国民收入X的多少,中国在改革开放前后,Y对X的回归关系明显不同。这时,可以t*=1979年为转折期,以1979年的国民收入Xt*为临界值,设如下虚拟变量:,则进口消费品的回归模型可建立如下:,虚拟变量的引入,OLS法得到该模型的回归方程为,则两时期进口消费品函数分别为:,当tt*=1979年,,当tt*=1979年,,虚拟变量的引入,虚拟变量的个数须按以下原则确定:每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1,即如果有m个定

9、性变量,只在模型中引入m-1个虚拟变量。例:已知冷饮的销售量Y除受k种定量变量Xk的影响外,还受春、夏、秋、冬四季变化的影响,要考察该四季的影响,只需引入三个虚拟变量即可:,虚拟变量的设置原则,则冷饮销售量的模型为:,在上述模型中,若再引入第四个虚拟变量,则冷饮销售模型变量为:,其矩阵形式为:,虚拟变量的设置原则,如果只取六个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则式中的:,显然,(X,D)中的第1列可表示成后4列的线性组合,从而(X,D)不满秩,参数无法唯一求出。这就是所谓的“虚拟变量陷井”,应避免。,虚拟变量的设置原则,习题下表给出了1965-1970美国制造业利润和销售

10、额的季度数据。假定利润不仅与销售额有关,而且和季度因素有关。要求对下列两种情况分别估计利润模型(1)如果认为季度影响使利润平均值发生变异,应如何引入虚拟变量?(2)如果认为季度影响使利润对销售额的变化率发生变异,如何引入虚拟变量?,二元离散选择模型,定性变量作为被解释变量时,就是离散选择模型。被解释变量只存在两种选择,就是二元离散选择模型。线性概率模型(LPM)Logit模型Probit模型,线性概率模型,Linear Probability Model,线性概率模型,线性概率模型的解释,线性概率模型,线性概率模型的问题 1、异方差 2、易出现无法解释的结果,异方差,易出现无法解释的结果,预测

11、时很难避免出现得到的Y值大于1或小于0的情况,为结果的解释带来困难。,解决思路,Logit模型,又称Logistic模型,该模型克服了线性概率模型的取值范围的弱点。,Logit模型,Logit模型,Logit模型,Logit模型,模型的解释,模型的解释,发生比和发生比率(Odds and Odd Ratio)发生比率是为了比较发生比而提出的指标,模型的解释,自变量为定量变量的解释,模型的解释,发生比的相对变化率,模型的解释,自变量为定量变量的解释 回归系数的指数表示在其他因素不变情况下,相应自变量增加1个单位,发生比变化的幅度与方向,即发生比率。价格上升1单位,发生比率为0.9564,即需求超过100的发生比下降,变化率为-4.36%,模型的解释,自变量为定量变量的解释 需要了解自变量发生一个离散的变化,如价格下降100元时,发生比的变化。,模型的解释,自变量为虚拟变量的解释,模型的解释,自变量为虚拟变量的解释,模型的解释,自变量为虚拟变量的解释 回归系数的指数表示在其他因素不变情况下,两种属性在发生比上的差异。高等级与低等级,发生比率为57.76,即高等级产品需求大于100的发生比为低等级的57.76倍,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号