《《分位数回归估计》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《分位数回归估计》PPT课件.ppt(25页珍藏版)》请在三一办公上搜索。
1、2.4 分位数回归估计Quantile Regression,QR,一、分位数回归的提出 二、分位数回归及其估计 三、分位数回归的假设检验 四、实例,一、分位数回归的提出,分位数回归由Koenker Roger和Bassett Gilbert Jr于1978年提出利用解释变量和被解释变量的条件分位数进行建模,试图揭示解释变量对被解释本来分布的位置、刻度和形状的影响。经典回归模型称为均值回归。建立了被解释变量的条件均值与解释变量之间的关系。,实例1Koenker和Machado(1999)分析了19651975以及19751985两段时间内世界主要国家的经济增长情况。模型选取了13个影响经济增长
2、的解释变量。通过分位数回归得出结论:对于初始单位资本产出这一解释变量,它的全部回归分位系数基本保持不变,这就意味着对于经济发展迅速与缓慢的国家而言,初始单位资本产出对于经济增长的影响基本相同;教育支出占GDP的比重以及公共消费占GDP的比重这两个解释变量对于经济发展缓慢的国家影响更加强烈。,实例2Chen(2004)使用分位数回归方法研究了美国8250名男性的BMI(身体质量指数,一种广泛用于测量偏胖还是偏瘦的指标)情况,并得出结论:在220岁这一快速成长期中,BMI迅速增加;在中年期间BMI值保持比较稳定;60岁以后,BMI的值开始减少。,分位数回归估计与经典模型的最小二乘估计相比较,有许多
3、优点。当数据出现尖峰或厚尾的分布、存在显著的异方差等情况,最小二乘法估计将不再具有优良性质,且稳健性非常差。分位数回归系数估计比OLS估计更稳健。最小二乘估计假定解释变量只能影响被解释变量的条件分布的均值位置,不能影响其分布的刻度或形状的任何其他方面。而分位数回归估计能精确地描述解释变量对于被解释变量的变化范围以及条件分布形状的影响。,二、分位数回归及其估计,1、分位数回归原理,分位数回归是对如上简单形式的扩展。,假定随机变量y的概率分布函数,定义y的分位数,给定y的n个观测值,相对应的分位数,等价地转化为求一个最优化问题,如果Y的条件分位数由k个解释变量X线性组合表示,即Y的条件分位数被定义
4、为:,分位数回归参数估计量为,2、分位数回归估计方法,参数估计方法有两类:一类是直接优化方法,例如单纯形法、内点法等;一类是参数化方法,例如结合MCMC(Markov Chain Monte Carlo)的贝叶斯估计方法。常用的计量经济和统计软件都可以实现对分位数回归模型的估计和假设检验,如stata、sas、r、eviews等。,3、分位数回归的扩展,如果被解释变量的条件密度非同质,可以采用加权的方法提高分位数回归估计的效率,权重与某概率水平下的局部样本密度成比例。加权分位数回归估计为:,将分位数回归应用Panel Data,构造Panel Data分位数回归模型。对于固定效应变截距Pane
5、l Data模型:,对应的Panel Data分位数回归参数估计为:,将分位数回归应用于归并数据(Censoring Data),构造归并数据分位数回归模型:,对应的“归并”数据分位数回归参数估计为:,凡是连续随机变量作为被解释变量的计量经济学模型,都可以进行分位数回归估计。,三、分位数回归的假设检验,分位数回归估计的检验包括两部分:一是与均值回归类似的检验,例如拟合优度检验、约束回归检验等;一是分位数回归估计特殊要求的检验,例如斜率相等检验和斜率对称性检验等。,1、拟合优度检验,分位数回归估计拟合优度检验统计量(Machado拟合优度)为:,最小化分位数回归的目标函数,回归方程中不包含任何解
6、释变量,只包含常数项情况下最小化分位数回归的目标函数,该统计量越大,说明拟合效果越好,2、约束回归检验,分位数回归约束回归检验似然比统计量,采用无约束和有约束情况下最小化分位数回归的目标函数值构造。,有约束情况下最小化分位数回归的目标函数值,无约束情况下最小化分位数回归的目标函数值,稀疏度,约束的数目,3、斜率相等检验,斜率相等检验,即检验对于不同的分位点,估计得到的结构参数(在线性模型中即为斜率)是否相等。原假设被设定为:,如果接受该假设,说明每个斜率对于不同分位点具有不变性,此时,应该采用普通最小二乘估计;如果拒绝该假设,说明模型应该采用分位数回归估计,以反映每个斜率在不同分位点的不同值。
7、斜率相等检验可以通过约束回归检验实现。原假设相当于对分位数回归估计施加了个约束(斜率中不包括常数项)。应用软件中给出了一些相应的检验统计量,例如,EVIEWS6.0中的Wald统计量可以实现该约束检验。,例:软件EVIEWS6.0使用手册中实例的斜率相等性检验结果,其中Y为家庭食物消费支出,X为家庭收入。,Wald统计量为25.22,应该拒绝斜率在tau=0.25、0.5和0.75相等性的假设,即斜率在不同分位点上的值是不同的。,4、斜率对称性检验,斜率对称性检验,即检验对于给定的X,Y的分布是否是对称的。原假设被设定为:,如果接受斜率相等性假设,就不必进行斜率对称性检验。如果拒绝斜率相等性假设,则可以进一步进行斜率对称性检验,若接受原假设,则认为斜率具有对称性,否则,则认为斜率不具有对称性。,例:软件EVIEWS6.0使用手册中实例的斜率对称性检验结果,其中Y为家庭食物消费支出,X为家庭收入。,Wald统计量为0.53,应该不拒绝斜率在tau=0.25和0.75对称的假设。,四、实例,