《成都市05住宅市场定价模型.doc》由会员分享,可在线阅读,更多相关《成都市05住宅市场定价模型.doc(10页珍藏版)》请在三一办公上搜索。
1、成都市05年度住宅市场定价模型摘 要:本文通过计量统计的方法,将住宅价格的形成视作是其自身各方面属性综合作用的结果,并通过对成都市住宅市场2005年4月的楼盘公开信息数据建立基于成都住宅市场的房价模型,分析影响其价格的主要因素。关键词:逐步回归,显著性水平,SAS一、 引言“安居乐业”有史以来就是衡量社会福利的指标之一,不同国度、不同历史时期皆然如此。尤其在中国这样一个儒学底蕴深厚的国家,“寄身之所”的重要性关乎社会、经济、文化的方方面面。早在千余年前,就有“安得广厦千万间”的疾呼,而今,如火如荼的房产市场更是引来社会各界的关注。介于此,我们意图通过计量统计所学,为房价(成都房产市场)这一敏感
2、话题建立模型,揭开隐于其后的影响因素。二、计量经济模型通过考察,我们在诸多可能影响房价的因素中选取以下九个作为住宅均价的解释变量,并对区位、厨卫装修、周边环境、环境进行评分,详见下表:代码因素评分标准分值备注x1区位一环以内(河内)5一环以内4一二环间3二三环间2三环以外1郊区0.5x2绿化率x3容积率等于总建筑面积与用地面积的比率x4占地面积x5室x6厅x7卫厨卫装修标准精装修3初装修2清水房1x8周边环境有大型商场,超市2累加有大学、小学、中学、幼儿园2交通便利与否2运动设施2x9户型多层27层及其以下,无电梯小高层1.5y高层17层以上的电梯公寓(一)模型的建立:首先我们假定模型为线性形
3、式:即使用eviews对该模型进行回归分析(原始数据参见附件一)Dependent Variable: YMethod: Least SquaresDate: 07/06/05 Time: 15:49Sample: 1 46Included observations: 46VariableCoefficientStd. Errort-StatisticProb. X1330.3166158.94512.0781810.0449X235.7124018.361931.9449150.0596X3270.5117200.50991.3491190.1857X4-0.1459410.618733-0
4、.2358710.8149X5-75.59086209.5936-0.3606540.7205X6-201.6988314.9935-0.6403270.5260X7406.5982350.68531.1594390.2539X8555.8820129.37934.2965310.0001X9636.7978429.48781.4826910.1469C-2332.0101320.955-1.7653960.0860R-squared0.783368 Mean dependent var3184.696Adjusted R-squared0.729209 S.D. dependent var1
5、440.707S.E. of regression749.7082 Akaike info criterion16.26691Sum squared resid20234248 Schwarz criterion16.66444Log likelihood-364.1388 F-statistic14.46446Durbin-Watson stat1.097759 Prob(F-statistic)0.000000回归结果见上表,发现t统计量的p值明显大于0.05,无法通过检验,修正R2=0.729209较高,F值显著大于临界值0.05,我们认定模型中存在多重共线;与此同时,DW的值1.097
6、759在0.01显著性水平下落入无法判定区域(0.927 1.834)。鉴于回归结果不太理想,我们决定将模型进行对数变化。对数变换后模型中参数可以看作Y相对于X的百分比变化,可以降低数据中因为评分的人为因素造成的不利影响,而且还可以减少异方差的影响。即原表达式变化为:根据新的对数模型,我们采取逐步回归的方式不断的减少解释变量个数寻求最佳的log(y)表达式,即当模型中有i(i9、8、7.)个解释变量时,我们从个模型中选取F统计量的p值最优的一个,直至达到理想效果时(即F统计量的p值小于给定的临界值)停止减少变量。我们将这个F的p值取为0.05,应用统计软件SAS,我们可以直接得到逐步回归的最优
7、结果,如下:Step 1 当引入九个解释变量时的回归结果: VariableCoefficientErrorSum of SquaresFProbFc4.870083880.861217541.5197691231.980.0001LOGX10.571785640.089300261.9484601941.000.0001LOGX20.747594780.232611170.4909099610.330.0028LOGX30.006137600.155745480.000073810.000.9688LOGX40.038679100.043761930.037127030.780.3826LO
8、GX50.044340810.144569850.004470770.090.7608LOGX6-0.103417070.190909930.013946260.290.5914LOGX7-0.045819030.159050780.003944120.080.7749LOGX80.062661310.129374750.011148860.230.6311LOGX90.119580310.173489300.022578980.480.4951显然,LOGX3、LOGX4LOGX9的回归结果皆不尽如人意,其F的p值大于0.05。该模型达不到要求。因此,我们改用8个变量回归,并在个回归结果中选
9、出最优的一个(即下表)。有必要说明,这一选择过程由SAS软件完成,依据的标准已事先在程序内部设定。同理,以下7步皆照此处理,不再赘述。Step 2 引入8个解释变量的回归结果VariableCoefficientErrorSumofSquaresFProbFC4.879325000.817419621.6477045935.630.0001LOGX10.573466450.077390362.5391731954.910.0001LOGX20.747036700.229025560.4920009510.640.0024LOGX40.037857210.037949830.046017981.
10、000.3250LOGX50.044570360.142490090.004524520.100.7562LOGX6-0.100720910.175808330.015177850.330.5702LOGX7-0.046032750.156798870.003985640.090.7707LOGX80.062770690.127587840.011192970.240.6256LOGX90.116094800.147222730.028755820.620.4354 Step 3 引入7个解释变量的回归结果VariableCoefficientErrorSumofSquaresFProbFC4
11、.973617890.742581912.0245787544.860.0001LOGX10.567445550.073720742.6739146759.250.0001LOGX20.722978070.211274940.5284852011.710.0015LOGX40.036304480.037124860.043158790.960.3343LOGX50.017714620.107927390.001215850.030.8705LOGX6-0.101225970.173673260.015331920.340.5634LOGX80.066887400.125280850.01286
12、4640.290.5965LOGX90.114774510.145373900.028131740.620.4347 Step 4 引入6个解释变量的回归结果VariableCoefficientErrorSumofSquaresFProbFC4.979670320.732354972.0345260946.230.0001LOGX10.569597770.071634492.7822591663.230.0001LOGX20.721163610.208336840.5272794211.980.0013LOGX40.038203050.034834000.052929131.200.2795
13、LOGX6-0.086142090.145516500.015420970.350.5573LOGX80.061697460.119703010.011690410.270.6092LOGX90.122058090.136697530.035084650.800.3774Step 5 引入5个解释变量的回归结果VariablecoefficientErrorSumofSquaresFProbFC4.951270820.723544812.0228363446.830.0001Logx10.598675830.043737258.09354515187.360.0001Logx20.746880
14、040.200408810.5999656013.890.0006Logx40.038812080.034492900.054693111.270.2672Logx6-0.090585930.143921290.017113140.400.5327Logx90.109858990.133391390.029300420.680.4151Step 6 引入4个解释变量的回归结果 VariableCoefficientErrorSumofSquaresFProbFC4.908471220.715018222.0057313947.130.0001LOGX10.595743290.043166958
15、.10643953190.470.0001LOGX20.744190460.198882320.5959232514.000.0006LOGX40.035112080.033737070.046101261.080.3041LOGX90.113996070.132244620.031625560.740.3937Step 7 引入3个解释变量的回归结果VariableCoefficientErrorSumofSquaresFProbFC5.163838590.648766662.6798947863.350.0001LOGX10.578013970.037835899.87229985233.
16、380.0001LOGX20.689300270.187835670.5696527913.470.0007LOGX40.035039060.033633610.045910011.090.3035Step 8 引入2个解释变量的回归结果 VariableCoefficientErrorSumofSquaresFProbFC5.032046710.636944202.6454338362.410.0001LOGX10.574138140.037689879.83544281232.050.0001LOGX20.764632940.173530940.8229292419.420.0001通过对
17、8个模型中所有变量F的p值考察,当引入两个解释变量logx1、logx2时,p值明显小于0.05,此时逐步回归结束,是log(y)的最佳表达式。1、多重线性的检验考察X1、X2的相关系数矩阵:LOGX1LOGX2LOGX11-0.335175LOGX2-0.3351750.0344709416129显然二者协方差在显著小于0.8(经验值),LOGX1、LOGX2不存在多重共线性。 Dependent Variable: LOGYMethod: Least SquaresDate: 06/06/05 Time: 17:23Sample:1 46Included observations: 46V
18、ariableCoefficientStd. Errort-StatisticProb. LOGX10.5741380.03769015.233220.0000LOGX20.7646330.1735314.4063200.0001C5.0320470.6369447.9002940.0000R-squared0.843978 Mean dependent var7.949505Adjusted R-squared0.836721 S.D. dependent var0.509495S.E. of regression0.205876 Akaike info criterion-0.260094
19、Sum squared resid1.822547 Schwarz criterion-0.140835Log likelihood8.982172 F-statistic116.3011Durbin-Watson stat1.522128 Prob(F-statistic)0.000000由上表可见,logX1与logX2的p值显著,又由Adjusted R-squared0.836721同样可判断,两者间不存在多重共线。2、自相关检验:在0.01的显著水平下,4-Du=2.577DW1.522128Du=1.423,落入无自相关的区域,因此判定模型不存在自相关。3、异方差检验:用white
20、交叉检验,得到以下结果:White Heteroskedasticity Test:F-statistic0.450226 Probability0.810566Obs*R-squared2.450870 Probability0.783875Test Equation:Dependent Variable: RESID2Method: Least SquaresDate: 06/06/05 Time: 21:56Sample: 1 46Included observations: 46VariableCoefficientStd. Errort-StatisticProb. C-1.1396
21、873.203654-0.3557460.7239LOGX1-0.2073110.248592-0.8339390.4093LOGX120.0054360.0200890.2705770.7881LOGX1*LOGX20.0545620.0672280.8115840.4218LOGX20.6826471.7046570.4004600.6909LOGX22-0.0982180.226295-0.4340240.6666R-squared0.053280 Mean dependent var0.039621Adjusted R-squared-0.065060 S.D. dependent v
22、ar0.060492S.E. of regression0.062429 Akaike info criterion-2.588463Sum squared resid0.155896 Schwarz criterion-2.349945Log likelihood65.53465 F-statistic0.450226Durbin-Watson stat2.208109 Prob(F-statistic)0.810566Obs*R-squared的p值0.7838750.05,由此判定模型不存在异方差。综上所述,最终回归结果为:LOGY = 0.5741381393*LOGX1 + 0.76
23、46329432*LOGX2 + 5.03204671即:(二)模型解释:1、 当区位得分每上升1时,住宅均价y上升0.574138139;当绿化率每上升1时,住宅均价y上升0.76463294322、 从最终回归模型来看,绿化率对均价y的解释作用较大,说明现在都市人较为看重住宅小区的环境;住宅的区域位置则反应了成都房产市场中消费者依然倾向于城市中心区域给交通、娱乐、教育等带来的条件便利。3、 在剔除的变量中,包括室、厅、卫等因素,说明他们与住宅均价的相关性较小,推断可能是他们对消费者决策的影响程度有限。(三)模型检验 我们收集到04年住宅市场上的42个样本,(来源:04年成都市房地产交易会4
24、月数据 成都市房地产协会会刊),并根据模型进行推断,得到今年的可能的房价,并与去年的实际房价进行对比,由此进行模型检验。05年的数据得模型为LOGY = 0.5741381393*LOGX1 + 0.7646329432*LOGX2 + 5.03204671,04年的42个样本为:X1X2YX1X2Y5354800230400024330003333600353.53700330320054042002352500530400034235303423000230.540002302800240.5370033031502683000130.618683304200150132814020003
25、383600233330015527002303250130.562500138.23500238290033135002452950239395023023001703600240390013536002303000235.52800330280053040003403300555390024543005404100分别取对数得LOGX1 LOGX2 LOGY并做其描述统计如下将04年的LOGX1、LOGX2的均值代入得到的模型得:LOGY = 0.5741381393*LOGX1 + 0.7646329432*LOGX2 + 5.03204671 =0.5741381393*0.79821
26、1+0.7646329432*3.625849+ 5.032046710.4582833782.7724435925.032046718.26773681两边取指数E8.26773681得Y=3896.121343735即若代入LOGX1的均值0.798211、LOGX2的均值3.625849到由05年的数据得到的模型中,得到的每平方米的均价近似为3896元,而04年已知的每平方米的均价为Y=E8.079750 3228.426029241即近似为3228元。由成都房地产咨询查得05年的房价由于通货膨胀、成都环境整治、购房需求旺盛等原因比04年每平米大约涨了350750元左右。而我们由模型得到
27、的差价为Y=38963228668元,很符合实际。说明模型与成都房地产实际定价比较切合。再以“学林雅苑”楼盘为例进行个体分析,其区位得分1分,绿化率70%.最终以模型计算,得到价格约3946元,高出04年价格346元;同理,可以发现包括“汇夏花园”、“学府嘉苑”、“汇景樱桃季社区”、“天府长城”、“盛锦华庭”、“自由星城二期”、“东方桂苑”与“金港金海岸”等楼盘的价格差异均在350-750的范围内波动(详见下表)。可以肯定,模型的真实性在大部分个体数据中是经得起考验的。它所反映的变化状况也是与事实相吻合的。这个模型应该可以作为房地产价格评判标准进行实际运用。楼盘区位绿化模型推测价04年均价差价
28、学林雅苑10.73946.50803600346.5080汇夏花园30.313978.02923500478.0292学府嘉苑10.42572.63452000572.6345汇景樱桃季社区30.334172.81823600572.8182天府长城10.553281.92682700581.9268盛锦华庭30.33879.53133200679.5313自由星城二期20.33050.82102300750.8210东方桂苑30.33879.53123150729.5312金港金海岸20.3553496.05832800696.0583综上所述,我们通过对模型及其效果的检验,最终得到较为满意
29、的结果,证明了模型不但操作简单且具一定的可行性,可用以做相关分析预测。附表一:原始数据(来源:05年成都市房地产交易会4月数据 成都市房地产协会会刊)YX1X2X3X4X5X6X7X8X910880.5351.5316.92212.5214000.5361.733303222214500.5401.2253212221000.5451.2853221213000.534.61.7246.22211.5218000.5451.26263222210100.540.21.6557.53221.51.514000.5402182322.51.7524800.5621.540032231.516000
30、.535215.82211.5222000.5421.56104.42212.5219000.542.32724231.51.521000.5502331212126000.5650.8916002223119800.5311.822.483211.5215900.5411.7510032221.518000.550.11.351204221.5214680.5371.798432231.518600.537.82.1804221.51.515000.531.81.31204221.5248005355.3304324.514700430.52.2710111523650230.63.9382
31、215132002362.2596.632221.542002401.71003324.5235002352.79454225245003383.97111514200240.53.6443323.51.53900230.5427121416000360.64.06612225140002352.431703223239001351.33503221.5250003363.57533251.559602515.53033241.538003413.27212151.537002351.7703222.523300230.82.82432241.54000531.25.5422.83325145002372.69181322424500431.7533032241.545005354302214.51.556802481.85032261.52900232.561.778022232450053441004324.5143002351.7503224.524680237240022151参考书目:计量经济学西南财经大学出版社 庞皓等SAS 8.X经济统计北京希望电子出版社 作者:樊欣 邵谦谦 统计软件教程北京大学数学科学学院 作者:李东风