《基于Hedonic模型的成都住宅价格影响因素分析.doc》由会员分享,可在线阅读,更多相关《基于Hedonic模型的成都住宅价格影响因素分析.doc(8页珍藏版)》请在三一办公上搜索。
1、基于Hedonic模型的成都住宅价格影响因素分析 摘要:近年来,如何准确的对住宅项目定价,已成为受到各界普遍关注的热点。本文结合住宅市场的发展及影响其价格构成的因素,筛选出了影响筛选出影响最大的几个因素,又借鉴了现有关于Hedonic定价的理论方法和研究经验,尝试构建成都市商品住宅价格的Hedonic模型。并以成都市2005年春季房交会上提供的相关数据为基础,对模型进行了拟和分析,得出了相关计量经济学模型。一、 Hedonic模型简述Hedonic意即“享乐”,hedonic模型则是基于效用论的一个定价模型。该模型从消费者(生产者)的主观角度出发,通过对商品的属性的评估来定价。Hedonic模
2、型应用的对象是那些所谓的复杂的耐用商品,这些商品并不像平时在经济学教科书上讨论的商品那样简单,其价格由总的供求状况决定。而“复杂性”就体现在这类商品有着较多的属性,消费者必须通过对这些属性的综合评价而不是单一属性的评价来定价。该模型将这样的“复杂商品”视为一个“特征包”,也就是包含着n个特征的向量;每一个特征对应着一个隐含市场以及在这个隐含市场上由供求决定的隐含价格,最后通过这些属性的综合评价而得到的价格称为hedonic price(享乐价格)。二、解释变量的选择 结合2005年春季房交会上提供的相关数据,经过分析将其中的变量分为成本、消费者偏好、消费成本三类来考虑。(一)成本1、土地成本:
3、土地成本=土地单价占地面积。土地单价主要体现在所处的区位上,离市中心越近地价越高,因此我们选择“区位”这一变量。占地面积另作为一个解释变量考虑。2、建造成本:由于大多数房子使用的材料相近,所以建造成本也相对接近,此处暂未作考虑。3、设备成本:各种管道设备成本等。由于各同质住宅之间的配套设施基本相似,成本也接近,所以在模型中未作考虑。4、建筑面积:由于已考虑容积率和占地面积,建筑面积=容积率占地面积,所以这里不考虑建筑面积。(二)消费者偏好1、周边环境:消费者在购房时对周边环境如学校、医院、银行、商场、交通便利程度的重视度越来越高,因此把它作为考虑要素。我们按一定的标准把它分为好与不好,用虚拟变
4、量进行定性分析。2、绿化率:随着人们对生活环境和健康的关注,绿化率已成为一项重要的考虑因素;而且它也对开发成本有着多方面的影响,因此在模型中考虑这一因素。3、配套设施及装修状况:大多数房屋的配套设施如宽带接入状况、电信设施等都相似,装修状况都为毛坯房,所以这两个因素未作考虑。4、房屋建筑形式:这一因素在楼层有所反应,我们把它分为高层、小高层及多层,用虚拟变更量进行定性区分。5、容积率:是指一个小区的总建筑面积与用地面积的比率。对于发展商来说,容积率决定地价成本在房屋中占的比例,而对于住户来说,容积率直接涉及到居住的舒适度。容积率越大,房屋价格应该越低,反之亦然。所以其系数应该为负。6、户型:消
5、费者对房屋的户型结构都有自己不同的偏好,所以这里我们分列出室、厅、卫作为三个不同的解释变量。(三)消费成本1、交通费用:该因素主要表达的是消费者在生活便利方面的考虑,但它可以通过“区位”要素中的信息加以反映,因此未作单独处理。2、物业费用:由于大部分房屋的物业费用还没有正式定出,所以这里暂未作考虑。3、停车费用:与物业费用相似,都还未正式定价,所以不作考虑。三、模型的设定 Hedonic模型定价的一般形式为:Y=f(x1,x2,.xn),其中xi表示商品的某种属性。所以,我们的模型设定为:Y=0+1D1t+2D2t+3D3t+4D4t+5D5t+1X1+2X2+3X3+4X4+5X5+6X6+
6、ut其中,各解释变量意义如下:表一区位D1t二环内 1其他 0D2t二环外(除郊县) 1其他 0绿化率X1容积率X2占地面积(亩)X3室X4厅X5卫X6周边环境D3t好 1其他 0房屋建筑形式D4t多层 1其他 0D5t小高层 1其他 0四、模型的估计1、 参数估计直接进行OLS估计得:表二Dependent Variable: YMethod: Least SquaresDate: 06/12/05 Time: 14:28Sample: 1 95Included observations: 95VariableCoefficientStd. Errort-StatisticProb. C37
7、4.0264472.57000.7914730.4309D1T1417.927212.02626.6875070.0000D2T1328.929167.83747.9179550.0000X123.823179.4889992.5106090.0140X2263.823687.299753.0220430.0033X30.2087630.4505960.4633040.6444X4-95.61817113.5177-0.8423190.4020X5307.7563157.54221.9534840.0541X6-93.44759179.7801-0.5197880.6046D3T462.810
8、3172.49862.6829800.0088D4T-193.1167210.0490-0.9193890.3606D5T38.57189235.46780.1638100.8703R-squared0.789312 Mean dependent var3141.705Adjusted R-squared0.761390 S.D. dependent var1255.913S.E. of regression613.4853 Akaike info criterion15.79378Sum squared resid31238227 Schwarz criterion16.11638Log l
9、ikelihood-738.2048 F-statistic28.26799Durbin-Watson stat1.299372 Prob(F-statistic)0.000000初步估计方程为:Y = 374.0264255 + 1417.926924*D1t + 1328.928764*D2t + 23.82316551*X1 + 263.8236185*X2 + 0.2087631661*X3 - 95.61816974*X4 + 307.7562791*X5 - 93.44758689*X6 + 462.8102858*D3t - 193.1167471*D4t + 38.571886
10、02*D5t五、模型的检验1、经济意义的检验回归结果中,x4、x6与D4t的系数为负,x2的系数为正,与其经济意义相悖。所以剔除掉x2、x4、x6、D4t,再对剩余解释变量进行回归得:表三Dependent Variable: YMethod: Least SquaresDate: 06/13/05 Time: 11:14Sample: 1 95Included observations: 95VariableCoefficientStd. Errort-StatisticProb. C544.4782434.05951.2543860.2131D1T1707.733199.62658.554
11、6430.0000D2T1428.953172.49988.2837930.0000X116.408819.6372521.7026440.0922X3-0.1033390.446899-0.2312370.8177X5253.0170148.75811.7008620.0925D3T569.9176176.63523.2265230.0018D5T399.3092148.76842.6840990.0087R-squared0.756645 Mean dependent var3141.705Adjusted R-squared0.737065 S.D. dependent var1255.
12、913S.E. of regression643.9973 Akaike info criterion15.85372Sum squared resid36081727 Schwarz criterion16.06878Log likelihood-745.0516 F-statistic38.64321Durbin-Watson stat1.368045 Prob(F-statistic)0.000000得到新的方程为:Y = 544.4781988 + 1707.73299*D1t + 1428.952958*D2t + 16.40880665*X1 - 0.1033393232*X3 +
13、 253.0170077*X5 + 569.9175829*D3t + 399.3092053*D5t而解释变量X3的系数变为负数,不符合经济意义。我们对Y与X3进行OLS估计后,X3的值仍为负数,所以剔除X3。对剩余变量进行回归得:表四Dependent Variable: YMethod: Least SquaresDate: 06/13/05 Time: 11:17Sample: 1 95Included observations: 95VariableCoefficientStd. Errort-StatisticProb. C571.9814415.19481.3776220.171
14、8D1T1711.564197.86508.6501620.0000D2T1431.378171.25238.3582950.0000X115.310928.3413091.8355530.0698X5256.9192147.00081.7477410.0840D3T561.9200172.28203.2616300.0016D5T397.4907147.75932.6901230.0085R-squared0.756495 Mean dependent var3141.705Adjusted R-squared0.739893 S.D. dependent var1255.913S.E. o
15、f regression640.5245 Akaike info criterion15.83328Sum squared resid36103903 Schwarz criterion16.02146Log likelihood-745.0808 F-statistic45.56493Durbin-Watson stat1.375885 Prob(F-statistic)0.0000002、统计意义检验查表可得,F值=45.56493大于F0.05(k-1,n-k),说明回归方程显著;且排除x2、x3、x4、x6、d4t后,t值大部分大于2,再继续进行计量经济学检验。3、计量经济学检验(1)
16、多重共线性检验X解释变量两两的简单相关系数如下:表五X1X510.23360.23361可看出,相关系数很小;并且R2不是很大,F值也没有显著大于给定显著水平下的临界值,所以可以认为不存在多重共线性。(2)异方差检验因为我们的数据是截面数据,所以用White检验进行异方差检验如下:表六White Heteroskedasticity Test:F-statistic1.988622 Probability0.057339Obs*R-squared14.83042 Probability0.062528Test Equation:Dependent Variable: RESID2Method:
17、 Least SquaresDate: 06/13/05 Time: 11:20Sample: 1 95Included observations: 95VariableCoefficientStd. Errort-StatisticProb. C-148435.91095245.-0.1355280.8925D1T510503.4182654.12.7949190.0064D2T385781.4156606.22.4633860.0158X125891.4245897.930.5641090.5741X12-118.0080509.0727-0.2318100.8172X5-362270.0
18、605520.9-0.5982780.5512X5263996.95121911.80.5249450.6010D3T91101.43158982.50.5730280.5681D5T-192234.1135721.5-1.4163860.1603R-squared0.156110 Mean dependent var380041.1Adjusted R-squared0.077608 S.D. dependent var606559.0S.E. of regression582546.7 Akaike info criterion29.47815Sum squared resid2.92E+
19、13 Schwarz criterion29.72010Log likelihood-1391.212 F-statistic1.988622Durbin-Watson stat1.855904 Prob(F-statistic)0.057339因为Obs*R-squared对应的Probability值大于5%,且对应X解释变量的t值都小于2, 所以认为不存在异方差性。(3)自相关检验用D-W法检验自相关K=7,K=6 dl=1.535 du=1.802 DW=1.375885 dl =1.535,所以存在正自相关。下面再用Cochrance-Orcutt迭代修正自相关得如下结果:表七Dep
20、endent Variable: YMethod: Least SquaresDate: 06/13/05 Time: 11:22Sample(adjusted): 2 95Included observations: 94 after adjusting endpointsConvergence achieved after 8 iterationsVariableCoefficientStd. Errort-StatisticProb. C698.9290371.80681.8798180.0635D1T1725.492223.25747.7287110.0000D2T1209.58223
21、3.90925.1711610.0000X117.599597.3690882.3882990.0191X5257.4604124.24912.0721320.0412D3T374.9292149.45122.5087060.0140D5T287.2135132.60692.1659020.0331AR(1)0.4369030.1088224.0148450.0001R-squared0.789324 Mean dependent var3127.255Adjusted R-squared0.772176 S.D. dependent var1254.683S.E. of regression
22、598.8710 Akaike info criterion15.70923Sum squared resid30843594 Schwarz criterion15.92569Log likelihood-730.3340 F-statistic46.03009Durbin-Watson stat2.008528 Prob(F-statistic)0.000000Inverted AR Roots .44DW=2.008528(du,4-du)=(1.802, 2.198),所以成功消除自相关。自相关是cov(ut,us)0,ts。通常认为由截面数据得到的模型不存在自相关。而我们的模型采用截
23、面数据但依然存在自相关。结合所学习的产生自相关的原因我们认为:不同房产价格可能有互相参考对方价格的情况,在同一地区,后建的开发项目价格可能会参照周边已建房价格,这些行为都可能导致出现一些未知的或者一直的但无法估计的随机误差出现自相关。还有可能有一些偶然因素让房价的随机误差产生自相关。经以上修正,最终模型的形式为Y = 698.9290071 + 1725.5*D1t + 1209.6*D2t + 17.6*X1 + 257.5*X5 + 374.9*D3t + 287.2*D5t + AR(1)=0.4369025751+ut 六、经济意义浅析1、从表示区位的D1t,D2t的系数可以看出,二环
24、内的楼盘均价比二环至三环间的楼盘均价高500多元/m2,而比郊县的楼盘均价要高出2900多元/m2。 2、从表示绿化率的X3的系数可以看出,绿化率越高,楼盘的均价越高。3、从表示厅的X5的系数可以看出,现在消费者越来越注重对住房厅的要求,如果厅越多,该楼盘的均价也会越高。4、从表示周遍环境的D3t的系数可以看出,周遍环境越好,楼盘的均价越高。5、从表示小高层的D5t的系数可以看出,现在消费者更偏好于小高层的住房,有小高层的楼盘均价会比其他楼盘高200多元/m2。6、在最终模型中,影响房屋价格的重要因素有5个:区位、绿化、厅、周边环境、房屋建筑形式,这5个因素成为决定房屋价格的主导因素。七、模型
25、的局限1、通过hedonic模型与市场公开数据建立了成都住宅市场的hedonic定价模型,由于仅是从消费者对住宅的主观评价入手,而且将影响因素局限在商品的属性上,并没有考虑其他更多的因素(如:投机炒作、收入,教育程度,预期等),可能会使结果显得过于片面,但由于消费者对商品的选择决策本质上是在各种约束条件下的一个最优理性行为,所以实际上除住宅本身属性以外的那些因素也应该反映在购买决策中,还需要进一步的数据处理和分析将其挖掘出来;2、此次收集的数据是在公开市场上(出版物,网络)获得的信息,与实际情况不一定符合,比如价格就会与最终成交价格有一定差距,这也会直接影响到结果。完成计量论文过程的总结:感受
26、:1、最强烈的感受是体会到搜集数据的艰辛。此次数据搜集过程中,从房产局到开发商再到出版物、网络,我们都希望找到最准确、完整的数据,虽然尽了努力,但是实际成交价房产局要进行保密,我们对成交情况也不可能一一作调查,所以结果会有相当的误差出现。但是作为体验计量方法的使用,收获还是颇为丰富的。2、体会到集体的智慧。刚开始在数据搜集时我们就分工搜集,提高了效率。在做论文的时候,原本我们也分工合作,一人负责一个部分,但是每次汇总的时候总能发现别人想法欠完整的地方或者自己有新思路、方法的时候,这都会导致一次又一次推翻以前的结果。后来我们决定运用集体的智慧,用一段时间共同完成一个部分,提出各自的思路,讨论后选
27、出最好的,如果出现新问题就一起思考、找解决办法。这个合作的过程使得我们的思路更加完整清晰、效率也得以提高。经验:1、对模型的选择我们经历了诸多过程,开始我们没有引入虚拟变量时,模型的自相关、异方差都很严重,而且没有办法消除自相关性。然后我们又查阅参考资料调整模型,改变为对数形式的模型,但是模型拟合仍然不是很好。最后在助教的指导下,我们引入了虚拟变量。在论文中我们只体现了最终选择的最优模型引入虚拟变量后的模型。2、引入虚拟变量是我们面对更多的问题:对虚拟变量的性质划分、赋值、回归、检验每个看似简单的过程我们都遇到了不少的困难。由于我们模型所涉及的定性变量较多,引入虚拟变量就显得尤其麻烦,例如,原
28、本对区位我们划分为一环内,一环到二环,二环到三环,三环外,郊县共五项,仅区位就需引入四个虚拟变量,在讨论咨询后,我们把它分别划分为二环内,二环到三环外,郊县,扩大了定性的范围。在对模型进行检验时,刚开始我们不知道如何对虚拟变量的t值进行判断,经过老师的指导,我们知道在检验异方差时只需判断x的t 值,而不用考虑虚拟变量地t 值。我们按照在不违背经济理论的条件下运用计量经济学知识决定虚拟变量的取舍。不足:1、 此模型与经济理论的联系比较小。2、 这个模型是对耐用商品的一个内在价值估计,而忽略诸多外在因素,如对决定房地产价格非常重要的供求关系和投机因素的考虑就没有包括。3、 在引入虚拟变量的时候,我们只用了加法引入,没有使用乘法引入。因为虚拟变量和一般的解释变量太多,不知道应该如何正确使用乘法引入,所以最后就没有用这一方法。