《恒通计算机自动评估技术标准(XXXX)09号.docx》由会员分享,可在线阅读,更多相关《恒通计算机自动评估技术标准(XXXX)09号.docx(21页珍藏版)》请在三一办公上搜索。
1、恒通计算机自动评估技术标准市场法模型之-神经网络知识指南(恒自评技009号)本指南对市场法中人工神经网络进行简单介绍。一、名词解释人工神经网络(ArtificialNeuralNetworks,简写为ANNs)也简称为神经网络(NNs)或称作连接模型(ConnectionistModel),它是一种模范动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。人工神经网络具有自学习和自适应的能力,可以通过预先提供的一批相互对应的输入输出数据,分析掌握两者之间潜在的规律,最终根据这些规律,用新的输入数据
2、来推算输出结果,这种学习分析的过程被称为“训练”。二、现行估价技术的缺陷现行房地产估价过程过于主观化,过于依赖房地产估价师的主观经验,客观依据支持不足。理论而言,同一估价对象,同一估价目的,在同一估价时点,应该得到相同的估价结果,这应该是房地产估价客观性、独立性、公正性甚至是房地产估价生命力所在,但是,现行的估价技术在实际估价业务中很难做到这一点。运用传统估价方法对房地产价格进行估算的过程中,很多关键参数的确定都缺乏科学、合理的理论指导,这就对估价人员经验丰富程度、数据处理能力等提出了较高要求,无形中增加了评估难度、提高了评估成本,而且估价人员的职业道德对“艺术”、“经验值”影响的风险更难以界
3、定,估价的客观性、公正性很大程度上受到估价师的个人影响。由于房地产价格的高低是由众多影响房地产价格因素综合作用的结果,价格与因素之间不是简单的函数关系,由于房地产价格与其影响因素之间存在着复杂的非线性关系,无法用一个具体的数学模型来准确地表达他们之间的关系,即各因素对价格的影响程度是未知的,这是现行估价技术不可逾越的技术障碍。三、人工神经网络的优势神经网络因其超强的自组织、自适应和自学习能力,特别擅长从事那些需要同时考虑诸多因素和条件、不精确和模糊的信息处理问题,对于这种常规数学方法无法解决或解决效果不佳问题人工神经网络便显示出巨大的优越性。人工神经网络这一数学工具能够发现影藏在房地产价格与价
4、格影响因素间的复杂关系。采用该方法进行房地产估价是通过对样本案例的学习,寻找房地产价格与其影响因素之间存在的客观规律。这种规律是非线性的,所以采用该方法进行估价,可以不用事先假设它们之间服从某种数学关系,故大大增强了估价客观性。网络通过样本学习,不需要人为给出权重,训练系统将求得每个影响因素与房地产价格之间关系的权数,而评估系统将训练得到的权值作为计算评估价格的依据,从而有效克服了传统方法在确定权重时的主观随意性,实际上是将神经网络的学习功能和非线性处理能力运用于评估系统以改善传统评估方法的随意性和不确定性。基于神经网络的房地产价格预测模型是通过对训练样本的学习,建立起房地产价格与其影响因素之
5、间的非线性关系,其实质就是市场比较法的人工智能化。由于房地产价格与其影响因素之间复杂的非线性关系,以及神经网络的独特优势,将神经网络引入房地产评估领域是可行的,这样在充分发挥神经网络优势的基础上,能够很好地克服传统评估方法的局限性。四、人工神经网络处理评估的基本思路通过大量市场调研,对房地产样本中的影响因素按照一定方法进行量化处理,得到的量化值作为神经网络模型的输入数据,样本价格作为网络的期望输出,通过样本学习获得有用的知识,从而确定网络的拓扑结构和有关参数,网络结构确定了,则房地产价格与其影响因素之间的非线性关系也就建立起来了,在应用训练好的网络模型进行预测时,只需要输入待估房地产影响因素的
6、量化值,输出端即可输出其预测价格。可以简单类比,求闭合曲线面积,传统方法为简单类比为矩形或圆形计算,而人工神经网络相当于用N个矩形来逼近,只要数量足够大其精度一定会比上一种方法更精准。五、人工神经网络用于评估的要求人工神经网络的成功使用有以下要求:第一,能科学的界定用途和空间范围,即科学合理分层;第二,要准确界定影响房价的因素,并能客观量化,或各项因素在市场域内能准确客观的比较;第三,训练要求高质量的样本,这些样本必须有足够的客观性和代表性,如果样本本身偏差较大,那么训练好的网络就很难得到准确的评估结果。价值是物的真实所值,是内在的,是相对客观和相对稳定的,是价格的波动“中心”;价格是价值的外
7、在表现,围绕着价值而上下波动,是实际发生、已经完成并且可以观察到的事实,它因人而异,时高时低。现实中由于定价决策、个人偏好或者交易者之间的特殊关系和无知等原因,时常会出现“低值高价”或者“高值低价”等价格背离价值的情况。因此,强调城市住宅估价本质上是评估城市住宅的价值而不是价格。虽然估价是评估价值,而且理论上是价值决定价格,但估价实践中一般是通过外表的价格来了解内在的价值。另外,价值和价格的内涵虽然在估价理论上有上述严格区分,但由于习惯等原因,有时并不对它们作严格意义上的区别。出现了两种替代真实价值的选择:一是实际成交价格;二是合格的估价师的重新估价结果。因为评估价值一般是在一系列正常交易假定
8、条件下最可能的价格,而实际成交时的交易情况不一定正常,实际成交价格不一定是正常市场价格,所以一般不能直接采用实际成交价格,而应采用合格的估价师对实际成交价格的重新审定结果。六、人工神经网络在经济领域的运用情况人工神经网络处理经济数据的三种显著的优势性能得到了使用者的一致认可,第一,它容易处理不完整的、模糊不确定或无规律的数据。第二,作为一种非参数方法,无需对数据的分布做事前假设。第三,对于复杂的非线性或近似连续的函数有很好的逼近能力。许多应用文献指出:当分析时间序列数据时,人工神经网络要比其它精致的统计分析方法略胜一筹。因为它能识别和模拟数据的非线性关系,而无需多变量正态分布或事先概率的假定。
9、另外,经济数据变量是处于经常变动的环境中的,因此模型的有效性就依靠于模型的泛化能力。过不断地再训练和再学习,人工神经网络本身不仅能基于经验对知识进行累积、存贮和模式识别,而且能不断地反映和适应新环境,学到隐含在样本中的有关环境本身的内在规律性。因此,它和传统的统计分析方法相比,人工神经网络具有更强的鲁棒性和精确性,较低的预测风险和较小的误差。现代经济理论认为,经济是一个复杂适应系统。复杂性系统的状态通常是非线性的,有时甚至是混沌的,应用传统的演绎、线性和定点的方法很难得到精确的分析结果。而从系统观点看,人工神经网络是由大量神经元通过极其丰富和完善的联接而构成的自适应非线性动态系统,这就足以构成
10、复杂性经济理论的模型基础。人工神经网络的网络整体和神经元之间的关系体现了经济系统的整体性和相关性思想。人工神经网络的大规模并行处理、自组织学习和自适应性、复杂非线性动态性等特征与经济系统非线性原理、经济系统的不可逆原理、经济系统的动态不平衡原理、经济系统的自组织原理、经济系统的内随机原理、经济系统的吸引子原理、经济系统的分形原理有相似的内涵。作为一种大规模并行的非线性动力系统,人工神经网络具有大量可供调节的参数、高度的非线性模拟运算能力,响应的自学习和自组织功能使得它在实际问题的处理过程中具有较强的适应性和泛化能力。用人工神经网络技术可以增强经济模型的分析、控制和预测功能。从人工神经网络的精确
11、性、适应性、鲁棒性、有效性和解决经济问题的效率看,将人工神经网络用于经济领域中的识别、分类和预测是颇具前景且有实际价值的,在西方发达国家,在对股市的短期预测、债券自动评估、企业价值评估、保险政策方针评估、抵押审查、会计报表风险识别、商业银行的信用风险分析、贷款评估等方面具有重要的广泛的运用。20世纪90年代以来,人工神经网络技术开始在国外大量被应用于自动评估。其中在房地产估价、房地产预警系统、房地产价值预测等方面有重要的运用。七、人工神经网络的缺陷第一、神经网络很难解释,目前还没有能对神经网络做出显而易见解释的方法学。第二、随着训练能力的提高,繁华能力也提高,但过度训练超过一定能力会出现过拟合
12、现象,网络学习了过多的细节,反而不能准确反映规律。第三、建立神经网络需要做的数据准备工作量很大。要想得到准确度高的模型必须认真的进行数据清洗、整理、转换、选择等工作,对任何数据挖掘技术都是这样,神经网络尤其注重这一点。第四、国内没有成功的经验可吸取。八、人工神经网络原理简析(一)一般神经元数学模型一个具有n个输入的通用神经元模型如下:u()和f()分别表示神经元的基函数和激活函数。基函数u(.)是一个多输入单输出的函数u = u (x,);激活函数的一半作用是对基函数输出u进行“挤压”:y二f(u),即通过非线性函数f()将u变换到指定范围内。常用基函数及激活函数类型:(l)基函数类型线性函数
13、绝大多数神经网络都采用这种基函数形式,包括BP网络。采用线性函数时,基函数输出u为输入和闭值的加权和,即距离函数此基函数输出为式中,常被称为基函数的中心。显然,u表示输入矢量x与权矢量之间的欧氏距离。该函数主要用于径向基函数神经网络(RBF网络)。(2)激活函数类型线性函数如果激活函数采用线性形函数,则神经元输出取基函数的输出u,即Y=f(u)= u该激活函数常用于实现函数逼近的神经网络的输出层神经元,如BP网络和RBF网络的输出层节点。S型函数这是一类非常重要的激活函数,无论神经网络用于分类、函数逼近或优化,S函数都是常用的激活函数。其表达式为:或式中,参数O,称为S函数的增益,其值决定了函
14、数非饱和断的斜率,几越大,曲线越陡。式中第一项函数为对数S型激活函数,式 中第二项为双曲正切S型激活函数。(二)B-P算法的运用举例以下为一个单隐层的网络结构示意图,隐含层采用S型函数作为传递函数,输出层采用线性函数作为传递函数。图一 单隐层B-P网络结构图假设收集某市场域内住宅楼盘价格及其影响因素判定划分如下表一:表一 各样本点的各项因素情况表样本编号公交便捷度居家配套完善度距离最近商业中心距离区域自然环境距离市中心位置建筑及设施品质建筑面积户型朝向楼层装修成新率实际成交价格14 4 4 5 4 1 3 2 5 2 3 4 264424 5 4 4 4 1 5 5 5 5 5 5 27413
15、3 4 4 4 4 1 2 2 5 4 3 4 254944 3 4 4 4 1 3 2 5 4 3 5 295852 3 3 4 3 1 2 2 5 4 3 4 191062 2 3 2 3 1 5 2 5 2 3 4 166772 2 3 2 3 1 2 1 5 1 1 3 154685 4 5 4 4 3 5 5 5 3 1 5 348194 5 5 5 4 3 4 3 5 5 5 5 3100105 4 5 4 4 3 5 5 5 7 3 5 4031115 4 4 3 5 3 4 2 5 6 5 5 3441123 3 3 3 4 1 3 2 2 2 3 4 2227132 5 3
16、4 4 1 3 4 2 1 3 4 1676144 5 4 5 4 3 3 3 4 1 1 5 2911153 4 3 4 3 3 4 3 3 2 5 5 2267163 3 3 4 4 1 5 5 3 2 5 5 2577173 4 3 3 3 3 2 2 3 4 1 4 2229184 4 4 5 4 3 3 4 4 5 1 4 2789194 4 4 4 3 1 5 5 5 3 3 5 2877203 3 3 4 4 3 2 2 5 3 1 4 2453215 4 4 5 4 3 4 3 3 3 5 5 3743224 4 5 5 4 3 3 2 2 8 1 5 2929234 5 3
17、3 2 1 3 4 5 4 3 5 2129244 5 5 4 4 1 4 3 5 3 3 4 2813254 4 4 4 4 1 5 5 4 3 1 4 2590264 4 4 4 4 1 2 2 5 3 3 5 2654275 4 4 4 4 1 2 2 5 2 1 5 2560284 4 5 3 4 1 5 5 5 3 3 5 2667294 5 4 4 4 1 4 2 5 4 3 5 2756304 5 5 5 4 1 3 2 5 3 1 5 3142314 4 4 3 4 1 4 3 5 2 3 4 2404324 5 4 3 4 1 3 3 5 3 3 4 2530334 5 4
18、4 4 1 4 3 5 3 1 5 2642344 4 4 4 4 1 5 5 5 1 3 4 2489354 4 5 5 4 3 3 3 2 6 1 5 2788364 5 5 5 4 3 4 3 5 7 5 5 3200373 3 4 4 4 1 3 2 2 3 3 4 2476382 4 3 3 3 1 5 2 4 2 3 3 1764394 4 5 4 4 3 5 4 4 5 3 5 3840404 5 4 3 4 3 4 4 4 4 5 5 3798因素最小值2 2 3 2 2 1 2 1 2 1 1 3 1546 因素最大值5 5 5 5 5 3 5 5 5 8 5 5 4031
19、首先对样本因素值及价格进行归一化,归一化计算公式表二 数据归一化后的数据样本编号公交便捷度居家配套完善度距离最近商业中心距离区域自然环境距离市中心位置建筑及设施品质建筑面积户型朝向楼层装修成新率实际成交价格10.333330.33333010.33333-1-0.3333-0.51-0.71400-0.11629820.33333100.333330.33333-11110.142911-0.0382293-0.33330.3333300.333330.33333-1-1-0.51-0.14300-0.19275740.33333-0.333300.333330.33333-1-0.3333-
20、0.51-0.143010.13641855-1-0.3333-10.33333-0.3333-1-1-0.51-0.14300-0.7070426-1-1-1-1-0.3333-11-0.51-0.71400-0.9026167-1-1-1-1-0.3333-1-1-11-1-1-1-1810.3333310.333330.333331111-0.429-110.557344190.333331110.3333310.33333010.1429110.25070421010.3333310.333330.3333311110.71430111110.333330-0.3333110.3333
21、3-0.510.4286110.525150912-0.3333-0.3333-1-0.33330.33333-1-0.3333-0.5-1-0.71400-0.45191113-11-10.333330.33333-1-0.33330.5-1-100-0.895372140.333331010.333331-0.333300.3333-1-110.098591515-0.33330.33333-10.33333-0.333310.333330-0.333-0.71411-0.41971816-0.3333-0.3333-10.333330.33333-111-0.333-0.71411-0.
22、17022117-0.33330.33333-1-0.3333-0.33331-1-0.5-0.333-0.143-10-0.450302180.333330.33333010.333331-0.33330.50.33330.1429-100.0004024190.333330.3333300.33333-0.3333-1111-0.429010.071227420-0.3333-0.3333-10.333330.333331-1-0.51-0.429-10-0.270022110.33333010.3333310.333330-0.333-0.429110.7682093220.333330
23、.33333110.333331-0.3333-0.5-11-110.1130785230.333331-1-0.3333-1-1-0.33330.51-0.14301-0.530785240.33333110.333330.33333-10.3333301-0.429000.0197183250.333330.3333300.333330.33333-1110.3333-0.429-10-0.159759260.333330.3333300.333330.33333-1-1-0.51-0.42901-0.1082492710.3333300.333330.33333-1-1-0.51-0.7
24、14-11-0.183903280.333330.333331-0.33330.33333-1111-0.42901-0.097787290.33333100.333330.33333-10.33333-0.51-0.14301-0.026157300.333331110.33333-1-0.3333-0.51-0.429-110.284507310.333330.333330-0.33330.33333-10.3333301-0.71400-0.309457320.3333310-0.33330.33333-1-0.333301-0.42900-0.208048330.33333100.33
25、3330.33333-10.3333301-0.429-11-0.117907340.333330.3333300.333330.33333-1111-100-0.241046350.333330.33333110.333331-0.33330-10.4286-11-0.000402360.333331110.3333310.33333010.7143110.331187137-0.3333-0.333300.333330.33333-1-0.3333-0.5-1-0.42900-0.25150938-10.33333-1-0.3333-0.3333-11-0.50.3333-0.7140-1
26、-0.824547390.333330.3333310.333330.33333110.50.33330.1429010.8462777400.3333310-0.33330.3333310.333330.50.3333-0.143110.8124748隐含层设定神经元数为15个,用MATLAB矩证软件运算,设定精度为0.05运算次数10000次,则模拟得出,输入层到隐含层权重、阈值如下表三:表三 迭代计算得出的输入层到隐含层权重、阈值每个因素权重123456789101112阈值神经元个数10.7741 0.2004 0.1921 -0.0437 0.6531 -0.3721 0.3518
27、0.0581 0.5296 -0.3089 -0.2501 0.2987 -0.2076 2-0.1330 0.2140 -0.4063 -0.1283 -0.1861 -0.2031 -0.3813 0.0603 0.5114 0.2879 -0.1901 0.1367 0.6215 3-0.2095 -0.1423 0.3805 0.5891 -0.2934 0.3452 -0.2358 0.2175 0.0778 -0.3955 0.0957 -0.3258 -0.5785 40.0452 -0.3859 -0.5795 0.2105 0.0684 0.5092 0.1917 0.456
28、0 0.0421 -0.0717 0.0195 0.1375 -0.4183 5-0.1956 -0.3391 0.0305 0.0876 0.0627 -0.4976 -0.3419 0.1913 -0.0777 0.1043 0.2616 0.2719 -0.7181 60.0929 0.1529 -0.0741 -0.1005 0.5131 0.3670 0.0353 -0.0594 -0.2743 0.2439 0.0168 -0.2345 0.0513 7-0.3228 0.2276 -0.1760 -0.4146 0.3042 0.2673 -0.4547 0.3612 -0.24
29、45 -0.2167 0.2012 -0.3444 -0.2049 80.2328 -0.1726 0.3251 0.3267 0.0313 0.3457 0.2204 0.0476 -0.2701 -0.2617 -0.0364 0.1966 0.7305 90.1493 -0.4319 -0.3514 -0.2878 0.1525 -0.6248 -0.0582 -0.2075 -0.4565 -0.0966 0.1021 -0.4123 0.5297 100.0788 0.2930 0.3033 0.0397 0.0344 -0.4395 -0.3514 0.1101 -0.1854 -
30、0.1768 -0.3023 0.4026 -0.4343 110.0126 0.2133 -0.4308 -0.4410 0.1677 -0.4049 0.1153 -0.0949 0.1010 -0.0012 0.3243 0.4871 -0.9505 12-0.1951 -0.1061 -0.2733 0.2222 0.2310 0.2897 -0.0022 -0.2095 -0.1003 0.4218 0.4008 0.1873 -0.9400 13-0.5381 -0.1558 -0.1606 0.3572 0.2882 0.2926 0.2729 0.1850 0.1083 -0.
31、1066 -0.2397 -0.2763 -0.1061 140.2226 -0.0654 -0.2927 0.3462 -0.0233 0.1500 0.1354 0.0547 0.3709 0.0269 0.5717 0.1294 0.5162 150.1916 0.1824 0.0056 -0.6209 0.3616 0.3157 -0.3620 0.6171 -0.1040 -0.3753 0.2201 -0.1131 0.4173 隐含层到输出层权值、阈值如下表四:表四 迭代计算得出的输入层到隐含层权重、阈值权值阈值神经元代码10.6048-0.33472-0.5253-0.6907
32、40.3388150.450860.3255670.70328-0.00719-0.416810-0.215211-0.670412-0.456213-0.4265140.2758315-0.5747训练的收敛效果如下图二图二 网络训练收敛示意图仿真拟合图如下:图三 仿真结果对比示意图输入层到隐含层的激励函数为双曲正切函数输出层到隐含层为线性输出。仿真对比如下表五表五 实际价格与仿真价格对比项目样本序号实际价格仿真值绝对误差相对误差训练样本126442645.70731.70728080.06%227412741.90330.90334570.03%325492543.9171-5.08289
33、8-0.20%429582954.0213-3.978675-0.13%519101900.1953-9.804681-0.51%616671679.317112.3171160.74%715461529.5114-16.48863-1.07%834813458.4724-22.52763-0.65%931003096.0256-3.974408-0.13%1040314016.9805-14.01955-0.35%1134413437.4837-3.51634-0.10%1222272233.20076.20069370.28%1316761695.209819.2097831.15%142
34、9112888.1968-22.80325-0.78%1522672286.630119.6301010.87%1625772585.97978.97966560.35%1722292227.5071-1.492887-0.07%1827892774.0744-14.92565-0.54%1928772874.2162-2.783756-0.10%2024532444.9004-8.099556-0.33%2137433727.1038-15.89618-0.42%2229292910.6558-18.3442-0.63%2321292125.9684-3.031573-0.14%242813
35、2810.4895-2.510474-0.09%2525902591.57441.57440790.06%2626542653.7304-0.269608-0.01%2725602549.0328-10.96721-0.43%2826672666.0629-0.937079-0.04%2927562747.1445-8.855479-0.32%3031423106.3308-35.66918-1.14%3124042407.59623.59621730.15%3225302539.03449.0343620.36%3326422617.2119-24.7881-0.94%3424892494.
36、47965.47955980.22%3527882772.7236-15.27639-0.55%3632003196.7942-3.20579-0.10%3724762474.4551-1.544928-0.06%3817641768.97724.97717380.28%3938403829.385-10.61495-0.28%4037983788.0754-9.924602-0.26%测试样本4124982669.7062171.706226.87%4222852236.032-48.96802-2.14%4326402543.5362-96.4638-3.65%4422162216.580
37、90.58094390.03%4517951752.9682-42.03182-2.34%4625862757.0634171.063456.61%4723442297.3437-46.65635-1.99%4826872486.4059-200.5941-7.47%4922312146.2905-84.70945-3.80%误差均在10%以内某估价对象12个因素情况如下表六表六 估价对象因素表及归一化数据项目交通条件生活配套教育配套区域环境所在位置建筑结构建筑面积户型朝向楼层装修成新率估价对象323443423534估价对象归一化后-0.3333-1-10.33330.333310.3333-0.5-0.33330.1428600其计算过程如下:输入层到隐含层u (x,)=第一个神经元权数乘以对应的12个因素及阈值之和=-0.3333*0.7741+(-1*0.2004)+(0*(-0.2987)+(-0.2076)=-1.1595作为激励函数输入值,激励后输出值(e(-1.1595)-e(-1.1595)/ (e(-1.1595)+e(-1.1595)=-0.8209同理十五个隐含层神经元激励后的输出值见下表