《企业信用评级模型(DOC58页).doc》由会员分享,可在线阅读,更多相关《企业信用评级模型(DOC58页).doc(66页珍藏版)》请在三一办公上搜索。
1、 WORD格式可编辑企业信用评级模摘要 社会信用体系是市场经济体制中的重要体系。当前,社会中商业欺诈,制假售假,非法集资等现象屡禁不止,这些社会信用问题归根到底都是企业信用的问题,因此,科学、合理、公正、权威的企业信用评级技术是当前紧要的任务。本文通过研究研究国内外企业信用评价方法,构建了一个企业信用评价平台。该平台提供了信用评价,信用等级,信用反馈等功能,是一个功能非常完备的信用评价平台。企业信用评级模型是评价企业信用等级的有效工具,随着全世界债券市场的迅猛发展、抵押品价值降低及其波动性增加,该模型将会得到更为广泛的关注,并将为我国各公司企业运用数学模型度量企业信用评级提供了重要参考意义。关
2、键词:数学模型 企业信用等级 企业信用评级模型 信用评价AbstractThe social credit system is an important system of market economy system. At present, commercial fraud in the society of counterfeit goods, the phenomenon such as illegal fund-raising, the social credit problems in the final analysis are enterprise credit problems
3、, therefore, scientific, reasonable, fair and authority of enterprise credit rating technology is the current urgent task.Through research the enterprise credit evaluation methods both at home and abroad, this paper builds a enterprise credit evaluation, credit rating, credit feedback, and other fun
4、ction, is a very complete credit evaluation platform. Enterprise credit rating model is an effective tool for evaluation of enterprise credit rating with the rapid development of bond markets around the world the value of collateral reduces and its volatility increases, the model will be more widesp
5、read attention, and the mathematical model for the companies in our country enterprise use metric enterprise credit rating provides an important reference significance.Key words: mathematical model Enterprise credit rating Enterprise credit rating model Credit evaluation目录摘要Abstract第一章 绪论1 1.1 选题背景和
6、意义1 1.2 国内外文献综述2 1.2.1 国外研究现状2 1.2.2 国内研究现状51.3我国研究现状及存在的问题9第二章 信用评级主要方法与模型综述102.1 专家评估法及其优缺点102.2 财务比率分析法及其优缺点122.3 多元判别分析(MDA ) 及其优缺点142.4 logistic分析及其优缺点152.5 非参数方法172.5.1 聚类分析及其优缺点172.5.2 K近邻判别及其优缺点192.6 Z模型和Zeta模型及其优缺点192.7 基于投影寻踪和最优分割及其优缺点212.8 模糊综合评判法及其优缺点262.8.1 确定评语集272.8. 2 确定指标权重集282.8.3
7、确定评判矩阵282.8.4 模糊综合评判292.8.5 模糊合成算子的选择312.9 遗传算法优化神经网络及其优缺点342.10 基于有序分类和支持向量机方法及其优缺点392.10.1 有序分类问题与内置空间法392.11 C4.5算法建立决策树模型及其优缺点422.12 kmv公司的kmv模型及其优缺点442.13 j.p摩根的credit metrics模型及其优缺点452.14 麦肯锡公司的credit portfolio view模型及其优缺点462.15 瑞士信贷银行的credit risk+模型及其优缺点46第三章 现代模型在中国应用的缺陷性及改进措施473.1对于现代模型的运用还
8、处于尝试阶段473.2 改进措施48第四章 对我国企业信用评级工作的建议50参考文献52 专业知识分享 WORD格式可编辑第一章绪论1.1项目背景及意义社会信用体系是市场经济体制中的重要体系。建立社会信用体系,是完善我国社会主义市场经济体制的客观需要,是整顿和规范市场经济秩序的治本之策。当前,社会中商业欺诈,制假售假,非法集资等现象屡禁不止,这些问题的源泉归根到底是社会信用出现了问题,因此加快建设社会信用体系,打击各种违法行为,处理各种信用问题不仅维护了正常的社会经济秩序,保护了群众权益,也进一步推进了政府更好的履行其公共服务、经济调节、以及市场监管的职能。市场经济条件下,社会信用体系由个人信
9、用、政府信用、企业信用融合而成。其中个人信用是社会信用的基础;政府信用是社会信用的基石;而企业信用是最关键,最活跃和最具影响力的。因为企业信用不仅在一般交易市场被多方重视更重要的是在金融市场被投资人或者贷款人所关注。随着市场经济的不断发展,企业信用将成为合作与交易的先决条件,因此当前我国企业信用体系建设是整个社会信用体系建设的重点。当前我国企业信用体系建设中存在的各种问题尽管表现形式各异,但从本质上讲,主要是企业信用信息的缺失,具体表现为企业信用信息的有效供给和有效需求的双重不足。一方面,由于企业体系建设滞后,使资信评估机构难以全面、准确、快速地获得企业信用信息,并通过评级技术确定其信用等级,
10、即资信评估机构难以有效地生产出能够满足市场需求的高品质的信用信息产品,形成有效供给。另一方面,由于缺乏高品质的,能够满足市场需要的信用信息产品,投资者或者企业在进行投资或参与市场交易时,虽然对信用产品有需求,但不能转化为现实需要,即潜在的需求不能转化为有效需求。正是这种有效供给与有效需求之间的矛盾,互相制约,恶性循环,严重制约了我国信用市场的健康有序发展。因此当前我们迫切的主要任务就是建立一套完整,可靠的企业信用体系,而企业信用体系的核心就是要有一种企业信用等级必须能够客观公正地反映企业信用的真实状况。因此,科学、合理、公正、权威的企业信用评级技术是成功地实施企业信用制度的关键所在,也是企业信
11、用体系的紧要研究课题。1.2国内外文献综述1.2.1国外信用评级研究概况国外信用评级的研究始于上世纪三十年代,分成四个阶段。第一阶段主要建模方法是基于传统的比例分析方法,如“SC , LAPP”和财务比率分析方法。第二阶段始于上世纪六十年代,这一阶段的主要方法包括多元判别分析法(MDA ),Logistic回归模型以及聚类分析等非参数方法。该阶段中关于财务信息与信用风险关系的研究主要以线性判别为主,在线性判别模型中又以Beaver的单变量模型和Altman的多元模型影响最为广泛。Beaver对30多个企业的财务比率进行了研究,运用单变量分析法对企业的违约进行研究,通过对样木的分析找到破产企业与
12、非破产企业单个财务比率的临界点,并利用该临界点对破产企业和非破产企业进行预测。Altman于1968年对“家美国制造业企业的经营情况进行了典型判别分析,提出了著名的Z-Score模型,1977年Altman本人又对Z-Score模型进行了修正和扩展,建立了ZETA评分模型。许多金融机构用它预测信用风险,并取得了一定的成效。Z-Score模型和ZETA模型,都是以会计资料为基础的多变量信用评分模型,由其计算的Z值可以反映贷款企业在一定时期内的信用状况(违约与不违约、破产与不破产),简单实用,很快成为了预测企业违约或破产的主流分析方法,被应用到世界上超过25个国家。类似的研究还包括Horrigan
13、, Pogue和Soldofsky, West, Horton等。但是多变量区别分析法有着严格的假设条件,如多元正态分布、等协方差矩阵等等,针对这些问题,Ohlson构建了假设条件较为宽松的Logistic识别模型,并将其应用于商业银行信用风险评估领域,Madalla采用Logistic模型区别违约与非违约贷款申请人的信用状况,Libby首次将主成份分析方法引入判别模型以克服变量多重共线性的问题。Zmijewski则引入Probit模型进行类似的研究。 由于统计模型有着比较严格的假设,同时线性技术又无法区分出随机噪声和非线性关系。因此依托迅速发展的计算机信息技术,运用数据挖掘方法进行建模在近年
14、来的信用风险评估领域得到了广泛的关注。也就是评级模型发展的第三阶段。该阶段的主要方法是人工智能方法,主要建模方法包括专家系统,人工神经网络、决策树算法、支持向量机和遗传算法等。Odom首次将神经网络引入企业破产领域,用BP神经网络预测了财务困境,结果显示神经网络模型优于判别分析模型。随后Tam和Kiang, Trippi和Turban, Coats和Fant, Bell等也都采用神经网络模型来对公司和银行的财务危机进行了预测,取得了一定的效果。Katiuscia Manzoni 利用神经网络对欧洲债券的信用评级和降级概率进行了研究。Makowsik是第一批倡导将决策树方法应用于信用评估的学者之
15、一,之后Carter, Catlett以及Boyleet al也对决策树方法用于信用评估的结果进行了分析。Tae K. S, Namsik C和Gunhee L.三人则应用决策树技术研究破产预测。Schebesch KB和Sleeking R用由一组高维数据组成的向量描述申请者,从而利用非线性SVM对信用卡申请者进行评级。Yong-Chan Lee使用支持向量机方法预测公司的信用等级取得了较好的结果。Sheng-Tun Lia, Weissor Shiue, Meng-Huah Huang利用支持向量技术对个人贷款信用评估问题进行了研究。相对方法研究而一言,更多的研究集中在基于不同方法、不同类
16、型模型之间的预测效果比较,这一部分的研究文献非常丰富。Altman等发现神经网络方法有时优于线性判别方法,但由于神经网络有时过度训练产生了不合理的权重,从总体上看线性判别方法要优于神经网络方法。Altman在对神经网络法和判别分析法的比较研究中得出结论“神经网络分析方法在信用风险识别和预测中的应用,并没有实质性的优于线性判别模型”。Coffman对决策树方法和判别分析进行了比较,认为两者各有千秋。Altman和Kao在现金流/总负债、保留盈余/总资产、总负债/总资产、现金流/销售收入等指标下分别建立了较高复杂度的分类树和较低复杂度分类树,与DA比较优劣,表明分类树是一种很有前途的方法。Mart
17、inelli E, Carvalho A D, Rezende S, Matias A对决策树和神经网络模型进行了对比研究。Hui-Chung Yeh等运用LDA,决策树,神经网络,以及LDA与神经网络相结合的模型分别对同一数据集进行了信用风险评估研究,结果显示决策树在四种方法中具有最高的分类准确率,线性判别分析准确率最低。第四阶段始于上世纪末,这一阶段主要是采用对信用风险组合计量的方法,主要模型有1995年KMV公司提出的信用监测模型;1997年J.P.Morgan银行提出的信用度量术模型,同期麦肯锡公司提出的Credit Portfolio View模型; 以及之后穆迪评级公司提出的Cre
18、ditCalc+模型,标准普尔提出的CreditModel和CreditPro模型等。1.2.2国内信用评级研究概况国内信用风险评估方法研究主要是引进国外模型或在其基础上进行改进,方法的进展路线与国外大致相同,典型的研究成果如下:陈静首次在国内运用统计方法和计量模型进行财务困境预警研究。陈瑜应用一元和多元分析对135家上市公司的财务状况进行了分类和预测。卢声、任若恩等利用Fisher判别分析法对我国上市公司的财务困境进行研究。施锡锉等人采用典型判别分析对1999年到2000年9月间的128家上市公司进行了经营失败的预测研究。梁琪运用主成份分析与判别分析相结合的方法预测企业财务困境。姜天和韩立岩
19、以6个财务指标作为输入变量,使用Logitic模型建立了我国上市公司财务困境预测模型。唐春阳、冯宗宪运用多元线性回归方法,利用逐步回归得到的5个指标(分别是资产负债率、成木费用利润率、主营业务利润率、全部资本化比率行业债务结构) 得到一个简明的企业违约率测度模型。郑建平采用概率统计方法构建了个人信用评分模型,康世赢采用关联分析法和模糊综合评价的方法对个人信用评估进行了研究,孙建政运用Logistic方法对个人信用评估模型进行了研究。张爱民等在借鉴Altman的多元Z值判定模型的基础上,采用主成分分析的方法建立了财务预警模型;杨淑娥和徐伟刚采用主成分分析法,建立了Y分数财务预警系统。庞素琳对10
20、6家上市公司进行两类模式分类,这两类模式是指按照公司的经营状况分为“差”和“正常”两个小组。对每一家上市公司,考虑其经营状况的4个主要财务指标:每股收益、每股净资产、净资产收益率和每股现金流量。仿真结果表明,Logistic回归信用评价模型对总体106个样本,判别准确率达到99.06%。宋冬梅,沈友娣也通过运用Logistic模型评价上市公司信用风险,也取得了较好的效果。樊锰汪媛雏等人从中小企业信用评级方法的比较和选择入手,以AHP分析法为核心,构建多级模糊综合评价模型,对中小企业信用状况做出评价。张目,周宗放提出一种基于投影寻踪和最优分割的企业信用评级模型。该模型运用投影寻踪对样本企业进行信
21、用综合评分,将信用综合得分由大到小排序,生成有序样品序列;利用最优分割法对有序样品进行聚类,得出明确的聚类结果;将最优分割点对应的信用综合得分作为划分信用等级的阈值,从而实现对样木企业的信用评级。人工智能方法中,王春峰等是国内较早采用神经网络模型预测企业信用风险状况的学者。庞素琳等人对基于BP算法的信用风险评价模型进行了研究。陈雄华等、章忠志等也都各自利用神经网络构建了商业银行信用风险评估模型取得较好效果。吴冲等、梁裸和吴德胜分别利用模糊神经网络对我国企业信用风险作了实证研究和分析。杨淑娥等构建了BP神经网络模型对上市公司的财务状况进行预测。李玉霜,张维将分类树应用于解决从业人员在进行贷款5分
22、类过程中分析判断能力欠缺的问题中,实证分析表明决策树方法比线性判别分析方法的准确率高。张维,李玉霜对基于分类树的商业银行信贷分类的数据处理问题进行了研究。姚靠华姚靠华等以上市公司作为研究对象,选取反映上市公司盈利能力、偿债能力、营运能力、成长能力和公司规模的17个财务指标,区别于传统的建模方法,应用决策树技术建立了中国上市公司的财务困境预警系统。实证结果表明该系统具有较好的预测性,在该领域有着良好的应用前景。吴德胜等人利用遗传算法辅助优化神经网络训练策略,建立了基于进化神经网络的信用评估模型。叶中行,余敏杰构建了一种分类树和遗传算法相结合的信用风险评估方法,先用分类树方法按照定性变量分类,然后
23、在每个叶结点上运用遗传算法按照定量变量分类。在个人信用评估方面,徐远纯等利用DONALD BREN SCHOOL OF INFORMATION AND COMPUTER SCIENCES(UNIVERSITY of CALIFORNIA.IRVINE)所提供的1986-1995年间的客户信用卡数据库,建立了信用卡欺诈风险分析决策树。冯铁军对基于遗传算法的神经网络技术在个人信用评估中的应用进行了研究,沈翠华等人对基于支持向量机的个人信用评估技术进行了研究,石庆众、靳云汇则对多种个人信用评估技术在我国应用进行了比较研究。姜明辉、王欢、王雅林将分类树与其它方法进行了比较研究,分析了其对个人信用评估的
24、实用性。鲁为,王极提出了一利,改进的ID3的决策树算法(E-ID3),E-ID3算法使用一种基于“统计出局部最优”的方法,获得比较好的启发式函数算法,并分析了E-ID3“算两步,走一步”的思想。实验证明,该优化算法对于构建决策树具有很好的效率。陆秋,程小辉针对ID3算法的多值偏向问题,提出一种基于属性相似度的、能够避免多值偏向问题的ID3改进算法。朱毅峰等在传统决策树模型的基础上引入卡方检测的方法,将个人信用评估过程中误判好坏客户的成本差异考虑在内,实证结果证明该精炼决策树模型在个人信用评估应用中可以提高判别坏客户的正确率。庞素琳等对C5.0算法进行了研究,并建立了基于C5.0算法的银行个人信
25、用评级模型,用来对德国某银行的个人信贷数据进行信用评级。郑也夫将数据挖掘方法引入信用风险预测问题中,全面比较决策树、神经网络和支持向量机算法在上市公司信息风险预测问题上的优劣,得出决策树具有良好的适用性。后来郑也夫等以我国上市公司作为研究对象,以因财务状况异常而被特别处理作为界定上市公司陷入财务困境的标志,采用交叉验证技术建立决策树模型,并与Logistic和K最近邻模型进行了比较分析。实证结果表明决策树模型能有效地预测上市公司的信用风险,且适用性较好。1.3我国研究现状及存在的问题 目前,国内已经建立了一些评级系统,作为加强企业信用管理、防范风险的一项基础工作和重要手段。但与国外同行业进行对
26、比,可以发现主要还存在以下几个问题:(1)评级模型适用性较差 评级模型是评级系统的重要技术基础,属于金融领域内的关键技术,其开发研究需要结合统计分析、风险计量、资产组合、期权定价等先进理论和技术,而我国由于经济发展程度不高,同时整体研究水平还相对欠缺,故在评级模型的建设方面有待加强。因此必须结合经济发展的实际情况,充分考虑利率市场化进程、企业财务欺诈现象、数据积累量不高、金融市场展不充分等现象,开发出适合自身特点的评级模型。(2)模型主要参数所需的数据不足 评级系统建设的核心资源是数据。近年来信用评级工作建立了基本数据库和反映信用风险特征的微观指标体系。但是,与评级法对数据的要求相比,现有的数
27、据积累远远不够,数据储备严重不足目而且质量不高、缺乏规范性,严重制约了评级系统的应用和发展;为满足建设评级系统需要的数据样本,还需要大量而细致的数据积累工作,通过数据整合、挖掘等技术,形成有价值的信息,为建立相关模型奠定良好的基础。(3)评级支持工具和系统落后 原有的评级工具为简单的EXCEL报表,属于单机分散操作,只是简单地进行手工操作,不能实现网络化操作与管理。评级结果只是简单的EXCEL表格,数据的汇总程度、集中程度、共享性很低,同时也不利于对评级情况进行有效的监控。同时通过原有的评级工具采集的客户资料也相对简单,无法支持客户评级数据的需要。评级系统应与业务流程系统紧密结合,成为一个嵌入
28、式的管理工具,最大限度地发挥监管和决策支持的作用,实现企业评级、授信审批的全流程计算机管理。(4)评级指标体系落后原有的评级指标体系中存在与经济发展、企业发展不相适应的指标,比如指某些指标权重太大、某些指标己不能反映企业的特点、有些指标设置较粗、某些指标缺乏等。第二章 信用评级主要方法与模型综述2.1 专家评估法 专家评估方法是指通过专家对影响企业经营业绩的有关经营要素进行分析评分,使信用定量化,然后求加权平均得出企业信用等级的一种方法。该方法依赖于专家主观判断,而且评级结果主要应用于信贷决策。比较有代表性的专家评估法有“5C”,“5P”,“LAPP”等方法。 5C分析法中5C是指:品格、资本
29、、能力,经营环境、担保品。 品格主要是评价客户的品行是否诚实可信、其偿还贷款的主动性如何。对于公司而言,品格是指其主要领导人的经营能力与经营作风,公司文化及其伦理,也包括企业在同行业中的信誉、地位等。 资本是反映企业资金实力的一个重要方面,也间接反映了企业的资金积累情况。资本充足、资金积累多,则企业信用状况就好。 能力主要包括经济上的借款与偿还能力和法律上的借款能力。从经济上看,信用评价应着重评价企业的偿债能力、盈利能力和营运能力,与财务比率分析法所强调的因素完全一致,从法律上看,信用评价应着重评价企业是否具备法定的资格和权利,通过对政府法规以及公司章程的调查分析可以获得此类信息。 经营环境是
30、企业的内在坏境和所处的外在环境。内在环境主要是指企业的经营特点、经营方式、技术设备状况、劳资关系等企业自身能够控制的方面;企业外在环境主要是指国家经济状况、行业竞争状况、行业发展趋势、市场状况等。环境条件有利,则信用程度将提高。 担保品是指企业可以用为信用担保如抵押)的物品。担保品丰富且价值良好,则信用相对就高,信用一旦发生危机则发生损失的可能性也相应少。但在评价时也应注意担保品的所有权、担保品的价值状况等。 5P分析法中5P是指:个人因素、资金用途因素、还款来源因素、债权保障因素,企业前景因素。 个人因素主要分析企业经营者品德、能力,是否诚实守信,还款意愿等。 资金用途因素主要包括生产经营、
31、还款缴税、替代股权等三个方面。 还款来源因素主要有两个来源一是现金流量,二是资产变现。 债权保障因素主要包括内部保障和外部保障两个方面。 企业前景因素主要分析借款企业的发展前景,包括产业政策、竞争能力等。 LAPP法是以Liquidity(流动性)、Activity(活动性)、profitability(盈利性)、Potentialities(潜力)四个词的第一个字母命名,从这四个方面评价企业的信用。专家评估方法的主要缺陷是一个主观性问题,该方法的因素权重完全取决于专家的主观判断,衡量标准因人而异,导致结果大相径庭。或者说,这种方法会使专家在进行评判时造成思维定势,人为因素致使评判结果有失公允
32、。这一方法的特点是主观定性判断,主要依靠专家的专业判断和经验综合各个方面的情况对企业的信用进行评估,但是不可避免的主观性因素会对评级过程产生影响,由于是人工评级,其成本较高,评级周期长,在效率上,无法满足企业对信用评级的要求。2.2 财务比率分析法该方法在1966年被引入预测企业破产领域,经过多年的发展形成了一系列财务比率分析方法,总体上讲就是对企业各项财务指标作一个全面、系统和综合的分析,从而对企业的经营状况和财务状况进行剖析、解析和评价。在实际应用中这是一种简单的加权方法,即给每个财务比率确定相应的权重和计算标准,将企业与标准值进行对比后给出个体的得分,然后加权求和得出该企业的信用得分并进
33、行等级划分。这类方法的主要代表有杜邦财务分析体系和沃尔比重评分法。杜邦财务分析体系的基本原理是将财务指标作为一个系统,将财务分析与评价作为一个系统工程,全面评价企业的偿债能力、营运能力、盈利能力及其相互之间的关系,在全面财务分析的基础上进行全面评价,使评价者对公司的财务状况有深入而相互联系的认识,有效地进行决策。其基本特点是以净值报酬率为龙头,以资产净利润率为核心,将偿债能力、资产营运能力、盈利能力有机结合起来,层层分解,逐步深入,构成了一个完整的分析系统,全面、系统、直观地反映了企业的财务状况。沃尔比重法选定7项财务比率作为分析指标,即:流动比率、自有资产对固定资产比重、自有资产对负债比率、
34、应收账款周转率、存货周转率、固定资产周转率、自有资本周转率。将指标的行业先进水平作为标准值,并将指标用线性关系结合起来,分别给定各自的分数比重,通过实际值与标准比率的比较,确定各项指标的得分及总体指标的累积分数,从而得出企业财务状况的综合评价,继而确定其信用等级。财务比率分析法克服了要素分析法的主观性使得评价独立于评估人员的主观努力并使计算机的使用成为可能,但是其指标权重和与标准分对比后得出的财务比率得分有明显的主观性,使得评价结果与企业的实际情况有很大的出入。2.3 多元判别分析(MDA ) 多元判别分析(MDA)是除美国外的其它国家使用最多的统计方法.多元线性判别分析法,可以具体分为一般判
35、别分析(不考虑变量筛选)和定量资料的逐步判别分析(考虑变量筛选).我国在1993年7月1日起正式实施与国际会计准则基本适应的、统一的企业会计准则,由此奠定了企业信用评估研究的基础和前提,随着国内会计人员的业务水平(如对准则的掌握、理解和应用水平等)和会计报表水平的不断提高,所产生的会计报表开始基本符合准则要求,因此,近年来的财务数据已具备建立企业信用判别模型的基本条件.应用多元判别分析(MDA)有以下三个主要假设:(1)变量数据是正态分布的;(2)各组的协方差是相同的;(3)每组的均值向量、协方差矩阵、先验概率和误判代价是已知的。 多元判别分析(MDA)的优点:对财务变量的正态假设已成为通常惯
36、例.由于线性判别函数(LDA)在实际使用中是最方便的,如在距离判别和贝叶斯判别中,在正态总体等协方差时,均导出一个线性判别函数,所以一般只研究线性判别函数.在满足上述3个假设的条件下,该判别函数使误判概率达最小。多元判别分析(MDA)的不足之处:多元判别分析(MDA)要求样本数据服从正态分布和等协方差,而现实中大量数据并不服从这些假定。2.4 logistic分析logistic分析是基于累积概率的判别方法,该方法对包括有二值相关的变量比较适用,和MDA比较,Collins和Green宣称Logistic分析方法能够降低第一类错误(即将破产的企业判为非破产的企业),但不能显著地提高总体判别的准
37、确性,此外他们还指出MDA对于模型假设错误有着很强的鲁棒性。如果第一类错误的代价不是特别巨大,比之于MDA模型,Logistic分析方法带来的复杂的计算是不值得的。 Chesser分析模型就是logistic分析方法一个很有代表性的判别模型。 Logistic回归分析方法也是目前为止应用最为广泛的一种信用评分模型。1977年,Martin采用一系列财务比率变量来预测公司破产及违约概率,建立了Logistic回归模型,并逐渐成为衡量公司信用风险的一种常用方法,它对于误差项没有正态分布要求,对判别虚拟变量问题有良好的效果,在违约概率计算中有很好的适用性,还可以降低犯第一类错误的概率。Logisti
38、c模型适用于因变量是非连续的且为二分类选择模式,目的是找出被解释变量与一组自变量之间的线性关系,核心思想是将这些自变量拟合成一个可以预测违约概率的被解释变量,即违约概率。我们知道,一般的线性回归模型如下: 若对分类因变量直接拟合违约事件发生的概率,自然而然地我们想到了下面形式的回归模型: 该模型等式右边取值范围为,而左边作为违约概率,其取值范围为,因此该模型存在漏洞,为了更加合理,1970年,Cox引入了人口学领域的Logit(Logit Transform),成功对模型进行优化,得到了Logistic模型: 也即: Logit变换导致了模型中的参数含义比较复杂,但是实用性得到了提高,这里将一
39、些基本概念解释如下:(1)其中为企业公司的概率,为信用风险评定中的指标变量,为技术系数,可以通过极大似然法求解。通过样本回归估计出系数后,一可计算出概率,将其归纳为相应的信用等级。(2)优势比(odds):分析中常常会把某种情况发生的概率与不发生的概率的比称为比值,即:。两个比值之比称为优势比(或比值比,Odds Ratio,简称OR),因此OR是否大于1意为两种情况概率情况的比较:当时,则当时,则当时,则缺点:Logistic回归模型不仅对中间区域的差别敏感性较强,而且当样本点完全分离时,模型参数的最大似然估计可能不存在。因此在正态的情况下不满足其判别正确率高于判别分析法的结果。另外该方法对
40、中间区域的判别敏感性较强,导致判别结果的不稳定。2.5 非参数方法(Non-parametricMethod)2.5.1 聚类分析(Cluster Analysis)聚类分析的基本思想是认为我们所研究的样本或指标(变量)之问存在着不同程度的相似性。于是根据一批样本的多个观测指标,找出一些能够度量样本或指标之问相似程度的统计量,以这些统计量为划分类型的依据,把一些相似程度较大的样本或指标聚为一类,把另外一些彼此之问相似程度较大的样本又聚为另一类,关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到把所有样本或指标都聚合完毕,形成一个由小到大的分类系统。常见的聚类分析方法有层次
41、聚类和一均值聚类。其核心思想是:给定一个包含个数据对象的数据库,以及要生成的簇的数目,随机选取个对象作为初始的个聚类中心,然后计算剩余各个样本到每一个聚类中心的距离,把该样本归到离它最近的那个聚类中心所在的类,对调整后的新类使用平均值的方法计算新的聚类中心,如果相邻两次的聚类中心没有任何变化,说明样本调整结束且聚类平均误差准则函数已经收敛。在每次迭代中都要考察每个样本的分类是否正确,若不正确,就要调整,在全部样本调整完后,再修改聚类中心,进入下一次迭代。如果在一次迭代算法中,所有的样本被正确分类,则不会有调整,聚类中心也不会有任何变化。在算法迭代的过程中准则函数的值在不断减小,最终收敛至一个固
42、定的值。总之,一均值聚类是一个反复迭代的分类过程。在聚类过程中,样本所属的类会不断改变,直到最终达到稳定为止。 聚类分析属于非参数统计方法.信用风险分析中它根据由借款人的指标计算出的在样本空间的距离,这种方法一个主要优点是不要求知道总体的具体分布;可对变量采用名义尺度,次序尺度,因此该方法可用于定性研究,也可对现实中的无法用数值精确表述的属性进行分析.这很适用于信用风险分析中按照定量指标(盈利比、速动比等)和定性指标(管理水平、信用等级等),对并不服从一定分布特性的数据信息进行分类.例如,Lundy运用该方法对消费贷款申请者的典型信用申请数据及年龄、职业、婚否、居住条件进行处理分成6类并对每类
43、回归评分,它不仅将借款人进行有效的分类而且还帮助商业银行确定了贷款方式策略.优点:聚类分析具有不要求样本数据服从具体分布、可对变量采用名义尺度和次序尺度等优点,适于信用风险分析中按照定量指标和定性指标对并不服从一定分布特性的数据信息分类的要求。我国信用数据表现出明显的非正态分布特征,因而将聚类分析应用于我国企业信用评级具有较强的针对性和适应性;不足之处:我国信用数据又具有高维性,当数据维数较高时,聚类分析会遇到很大的困难。因此,聚类分析应用于企业信用评级的基本思路目前仍然是基于“降维”的思路,即首先采用评分法、因子分析法等对样本企业进行信用评分,然后,运用系统聚类、- 均值聚类等算法对信用得分
44、序列进行聚类,从而获得企业信用评级结果。然而,在实际应用过程中,系统聚类、- 均值聚类等算法并不能给出明确的信用等级阈值,这给模型的检验和推广带来了困难。2.5.2 K近邻判别(K Nearest Neighbor)近邻判别(K Nearest Neighbor),简称KNN,是另一种非参数方法,它在一定距离概念下按照若干定量变量从样本中选取与确定向量距离最短个样本为一组,适用于初始分布和数据采集范围限制较少和情况.另外,KNN通过将变量在样本整体范围内分为任意多决策区间,而近似样本分布.Tam将之用于信用风险分析,取马氏距离,从流动性、盈利性、资本质量角度选出的19个变量指标,对样本分类,经比较,其分类结果的准确性不如LDA, Logistici。以及神经网络。原因在于在同样的样本容量下,若对具体问题的确存在特定的参数模型并可能找出时,非参数方法不及参数方法好。2.6 Z模型和Zeta模型以模型和Zeta模型为代表的系列统计判别方法目前仍然是西方国家商业银行对客户信用等级评定的重要模型之一。模型(Altman, 1968)的建立过程包括四步:(1)选取一组反映借款人财务状况和还本付息能力的财务