《金融计量经济第五讲虚拟变量模型和Probit、Logit模型.ppt》由会员分享,可在线阅读,更多相关《金融计量经济第五讲虚拟变量模型和Probit、Logit模型.ppt(40页珍藏版)》请在三一办公上搜索。
1、金融计量经济第五讲,虚拟变量模型和Probit、Logit模型,第一节 虚拟变量的一般应用,一、虚拟变量及其作用1.定义:取值为0和1的人工变量,表示非量化(定性)因素对模型的影响,一般用符号D表示。例如:政策因素、地区因素、心理因素、季节因素等。2.作用:描述和测量定性因素的影响;正确反映经济变量之间的相互关系,提高模型的精度;便于处理异常数据。,二、虚拟变量的设置原则,引入虚拟变量一般取0和1。对定性因素一般取级别数减1个虚拟变量。例子1:性别因素,二个级别(男、女)取一个虚拟变量,D=1表示男(女),D=0表示女(男)。例子2:季度因素,四个季度取3个变量。小心“虚拟变量陷阱”!,三、虚
2、拟变量的应用,1、在常数项引入虚拟变量,改变截距。对上式作OLS,得到参数估计值和回归模型:(5.2)相当于两个回归模型:,2、在斜率处引入虚拟变量,改变斜率。作OLS后得到参数估计值,回归模型为:同样可以写成二个模型:可考虑同时在截距和斜率引入虚拟变量:,3、虚拟变量用于季节性因素分析。取原模型若为则引入虚拟变量后的模型为:回归模型可视为:,例题:美国制造业的利润销售额行为,模型:利用19651970年六年的季度数据,得结果:括号内为t统计值。显然,三季度和四季度与一季度差异并不明显,重新回归,仅考虑二季度,有结果:,4、引用虚拟变量处理“时间拐点”问题。常见的情况:a.若T0为两个时间段之
3、间的某个拐点,虚拟变量为:b.用虚拟变量表示某个特殊时期的影响;模型中虚拟变量可放在截距项或斜率处。,5、分阶段计酬问题。若工作报酬与业务量挂钩,且不同业务量提成比例不一样(递增),设S1、S2为二个指标临界点 工资模型为:,S1,S2,S0,D1=1,D2=1,作OLS得到参数估计值后,三个阶段的报酬回归模型为:,例子:佣金与销售额的关系:,模型:样本回归函数:,附录:Chow检验(邹氏检验),Chow检验有二个内容,断点检验和预测检验。和虚拟变量模型作用有相近之处的是断点检验(Chow Breakpoint Test)。步骤:在回归分析结果窗口,点ViewStabiliti TestCho
4、w Breakpoint Test注:邹氏应是邹至庄。,例1:储蓄余额与国民收入的关系,CXYE=-1878.817965+5.965038605*GMSR+812.1046287*D119521977:CXYE=-1066.71+5.965*GMSR19781990:CXYE=-1878.82+5.965*GMSR,GMSR,虚拟变量用于斜率,CXYE=-1217.425+5.209*GMSR+1.13*(D1*GMSR)19521977:CXYE=-1217.425+6.339*GMSR19781990:CXYE=-1217.425+5.209*GMSR,GMSR,CXYE,应用例题1:H
5、edonic住宅价格模型,也称特征价格模型。其核心认为住宅价格由若干hedonic(可享受的)特征构成,包括房屋建筑特征、区位特征、社区特征等。该模型常用于计算住宅价格指数。一般形式:,利用杭州市2004年二手房交易数据作一回归:,应用例题2:股息税削减对股价的影响,背景资料2005年6月14日,财政部、税务总局发文,规定对个人投资者从上市公司取得的股息红利所得,暂减按50%计入个应纳税所得额(红利税从20%降为10%)。利用事件分析法分析该政策对股价有无显著影响,即政策出台前后股票有无异常收益。时间窗口为发布日及前后各二天。模型:其中:表示第i个股票的日收益率,表示上证A股指数的日收益率。D
6、1-D5分别是时间窗口的虚拟变量。,复旦大学经济学院的研究生张立早*将普通股分为不受政策影响、受政策影响和未来有影响三组,发现股息税削减政策对第二、三组都有显著影响,且政策出台前二天的股价涨幅较大。说明什么问题?政策效应?!内幕消息?(用虚拟变量表示时间窗口,同样可以分析事件效应,比传统的事件分析法要简便。)*2006年10月28-29日南京财大会议论文。,例3:应用虚拟变量分析股市的“日历效应”,周内效应 周末效应 日内效应节日效应,离散选择模型(discrete choice models),以虚拟变量为被解释变量的模型被称之为离散选择模型。离散选择模型除了应用于主要的交通需求问题之外,教
7、育及职业的选择、消费者商品的需求,以及居住地点的选择等方面。国内常用的离散选择模型有Logit模型、Probit模型。2000 年度诺贝尔经济学奖获得者詹姆斯赫克曼(J ames Heckman)教授和丹尼尔麦克法登(Daniel McFadden)教授,其微观经济计量的成果的主要工具就是离散选择模型。,第二节 虚拟被解释变量模型,问题1:对于商业银行,企业贷款可能出现违约,也就是说一家企业贷款后有违约和不违约两种可能,如何甄别?(李萌,2005)问题2:证券投资者在特定时期内的投资选择是买或不买,如何确定这样的选择?(王冀宁等,2003)问题3:上市公司出现经营问题,可能成为ST、PT,是什
8、么原因导致这样的结果?,虚拟变量作为被解释变量,这类模型称离散被解释变量数据计量经济学模型(Models with Discrete Dependent Variables)或:离散选择模型(DCM,Discrete Choice Model)仅取0与1的离散选择模型称为二元选择模型,这是本讲需要介绍的主要内容。,原始模型:,其中Y为观测值取1和0的虚拟被解释变量,X为解释变量。模型的样本形式:因为,所以令:于是有:即有:,但因为模型具有明显的异方差性,故而用模型(5.8)直接进行参数估计是不合适的。另外,由于要求 亦难以达到。实际应用中,用效用模型来求参数估计值:其中:,效用模型的极大似然估
9、计,一般情况下离散选择模型用Probit或Logit模型,二者都是对称函数。假如Y的概率分布函数为,则有:,所以有似然函数:或者:对数似然函数为:对数似然函数最大化的一阶条件为 参数估计由上式求出。其中 为密度函数。,Probit和Logit模型,Probit模型中随机误差项服从标准正态分布,有概率密度函数是Logit模型将逻辑(logistic)分布作为随机误差项的概率分布而推导得到的,有,Probit和Logit模型的参数估计,李子奈书中将两类模型参数估计分为二种情况:“重复观测值不可以得到”和“可以得到”。前者的参数估计可以用模型(5.13)式来求得,用“完全信息的极大似然法”估计参数。
10、若重复观测值可以得到,则采用广义最小二乘法估计参数:其中 表示随机误差项的方差协方差矩阵,实际应用中一般用估计值来代替。,Probit和Logit模型的变量显著性检验,两种模型用于显著性检验的统计量为Wald统计量、LR统计量(最大似然比)和LM统计量(拉格朗日乘子),这几个指标软件包中均有。零假设为:备择假设为:Wald统计量:其中LR、LM统计量:其中 分别为零假设和备选假设情况下似然函数值的估计量。,logistic函数,logistic函数曲线,P=F(Z),Probit和Logit模型的参数估计,Eviews中,点quickEstimate Equation在Method中选择BIN
11、ARY,再在上方选择方法(probitlogitextreme value 三选一)在变量框中依次输入被解释变量、解释变量即可。,例:中国ST上市公司结构分析,利用上市公司公告信息讨论ST公司的影响因素。样本中有ST公司,也有非ST公司,另有ST*公司。,VariableCoefficientStd.Errorz-StatisticProb.C3.433275 1.315134 2.610590 0.0090X1-4.1141962.436005-1.688911 0.0912X2-1.2622740.385405-3.2751850.0011X3-0.5489980.615274-0.892
12、2810.3722Mean dependent var0.500000 S.D.dependent var0.504219S.E.of regression0.324276 Akaike info criterion0.710744Sum squared resid5.888658 Schwarz criterion0.850367Log likelihood-17.32233 Hannan-Quinn criter.0.765358Restr.log likelihood-41.58883 Avg.log likelihood-0.288705LR statistic(3 df)48.533
13、01 McFadden R-squared0.583486Probability(LR stat)1.64E-10Obs with Dep=030 Total obs60Obs with Dep=130,利用Probit模型回归的结果:,利用Logit模型回归结果:,Variabl Coefficient Std.Error z-Statistic Prob.X3-1.275613330131.29404037889-0.9857600666410.324250865967Mean dependent var0.5 S.D.dependent var0.50421948409S.E.of re
14、gression0.320813610998 AkaikeSum squared resid5.7635968880 Schwarz criterion0.856335961761Log likelihood-17.5013897284 Hannan-Quinn criter.0.77132721047Restr.log likelihood-41.5888308336 Avg.log likelihood-0.291689828807LR statistic(3 df)48.1748822104 McFadden R-squared0.579180530503Probability(LR stat)1.95459759489e-10Obs with Dep=030 Total obs60Obs with Dep=130,Many thanks,