《大数据时代银行数据价值变现之路.pptx》由会员分享,可在线阅读,更多相关《大数据时代银行数据价值变现之路.pptx(54页珍藏版)》请在三一办公上搜索。
1、大数据时代银行数据价值变现之路,大数据时代银行数据价值变现之路,银行大数据应用现状,数据资产管理现状,大数据应用现状,成熟:传统数据仓库和新型大数据在技术、框架、平台和工具基本成熟,且需要的硬件成本更加廉价,资产:“数据是资产”的概念已普及,但是“如何管理数据资产”仍然缺乏成熟的理论、方法、工具和成功实践,探索:大数据应用处于摸索阶段,更多的是在引入大数据技术优化底层IT技术架构,在业务应用上缺乏实际有价值的应用,更缺乏“杀手级”应用,土壤:银行业是数据产生最为庞大的行业之一,且非结构化数据增长迅速,应用场景丰富,可以为大数据应用落地提供肥沃的土壤,银行需要在大数据资源获取,数据资产管理,应用
2、落地和场景入口上亟需解决和完善起来!,银行大数据应用现状 数据资产管理现状 大数据应用现状成熟:传,互联网金融时代贷款风险更严峻,随着普惠金融的到来,在缺乏有效金融大数据的情况下,要做好小微和零售贷款的难度非常的大,近年来小微和零售贷款遇到了增速下滑,不良率迅速上升的尴尬,贷款逾期潜在风险巨大,贷款损失急剧增加。 当前,银行更多关注的是在授信评级,还有没有更好的办法管理贷后风险,尤其是零售业务的贷后风险,基于大数据预测分析的贷款客户风险预测分析将颠覆银行传统的风险管理手段,可以具备“先知”能力一样的采取决策和行动!,某银行20102014小微贷款增速及不良率走势(来源:平安证券研究所),迫于竞
3、争压力贷前审批放宽贷后管理滞后贷款损失增加,互联网金融时代贷款风险更严峻 随着普惠金融的到来,3.场景为王,1.数据为根,0,减少风险损失,增加营销收益,三类数据价值变现,提高管理效能,解决之道:数据资产管理和价值变现,2.人才为核,数据资产管理(数据治理+数据管理+数据应用)+数据资产运营,直接服务单体,通过区域服务单体,服务区域,100,100,3.场景为王1.数据为根0减少风险损失增加营销收益 三类数据,何为数据资产管理?,数据治理,数据管理,数据应用,数据资产管理,完整,安全,一致,准确,及时,数据资产增值,数据资产变现,定义:数据资产管理是为了保证数据资产的完整、安全、一致、标准、准
4、确、及时等因素(PS:“数量、质量和安全”),使数据能够合理配置和有效利用,从而采取的各种管理活动。目标:是让数据变成资产,使数据资产增值和变现。,数据资产运营,何为数据资产管理?数据治理数据管理数据应用数据资产管理完整安,数据治理(1/3),定义:数据治理是对数据资产管理活动行使权力和控制的活动集合 (规划、监控和执行),是指导数据管理活动如何执行。目标:是制定正确的原则、政策、流程、操作规程, 确保以正确的方式对数据和信息进行管理。,数据治理(1/3)数据战略数据资产数据治理组织和角色数据政策,数据管理(2/3),数据架构管理,数据安全管理,数据标准管理,元数据管理,数据质量管理,数据生命
5、周期管理,管而不乱,让数据变成资产,数据管理核心内容,定义:数据管理是规划、控制和提供数据和信息资产,让数据变成资产,发挥数据和信息资产的价值。,数据管理(2/3)数据架构管理数据安全管理数据标准管理元数据,数据应用(3/3),人才为核数据为根场景为王,业务洞察业务场景设计数据来源分析算法模型实现试点单位验证投产价值回报,单体,区域应用演进区域应用验证数据来源优化算法模型优化投产价值回报,区域,概述:在合理有效的数据管理和管理的基础上,实现对数据资产的保值增值,真正实现数据带来的业务价值回报。,直接服务单体,通过区域服务单体,直接服务区域,应用主体,数据应用(3/3)单体人才为核区域业务洞察单
6、体 区域应,数据价值变现的演进过程,应用的价值,能力演进,过去发生了什么?具体情况如何?,现在是什么情况?发生的原因是什么?,决策优化,未来会发生什么?我们应该怎么做?最好的情况是什么?,统计报表,即席查询,多维分析,定制查询,统计分析,模型查询,模型监测,风险预警,数据挖掘,机器学习,深度学习,预测建模,大数据决策,信息BI时代,知识BI时代,数据价值变现的演进过程应用的价值能力演进过去发生了什么?现在,数据资产运营,观点:数据资产管理和价值变现是一个过程,需要将产品、工具、方法和实施经验与企业的业务逻辑和实际需求紧密结合;需要企业的实际历史数据来训练验证和测试,且数据源的范围和要素在不断演
7、进,算法模型和特征项也需要不断优化演进;这个工作需要机器和人协同作战,缺一不可!目标:实现“数据、信息、知识、价值”的实践提升闭环。,单击此处添加文字,数据治理数据管理应用提出历史数据,业务经验机器学习预测建模,数据积累算法积累应用积累,正式投产决策支持价值回报,业务经验业务场景深入分析,试运行真实数据,数据资产运营,数据资产运营观点:数据资产管理和价值变现是一个过程,需要将产,目录,数据资产管理和价值变现,贷款客户风险预测分析应用,我们可以提供的支撑,目录数据资产管理和价值变现贷款客户风险预测分析应用我们可以提,业务分析目标,缩小预测范围方法,提高精确率 主要通过资金链健康度(资金来源、资金
8、去向、资金交易金额)、客户脉脉圈的优良情况(黑名单户多少,交易频繁度)、 客户额度合理性、客户画像中客户存款余额、客户财务指标合理性等重点标签分析识别逾期名单。发现潜在风险,识别风险客户 授信额度合理性、资金交易动向风险性、资金活动频繁性、客户行业 变动性、客户信用变化优良性、客户脉脉圈的优良性。,算法预测,业务分析,决策支持,业务分析目标缩小预测范围方法,提高精确率算法预测业务分析决策,总体业务纵深拓展,客户脉脉圈分析,客户经理管户圈分析,黑名单户关联分析,资金活动相关客户情况分析客户保证人情况分析客户圈行业情况分析客户资金用途分析客户圈信用评级分析,管户总体风险分析管户资金活动情况管户客户
9、脉脉圈分析管户总体风险暴露及缓释分析,其它客户与黑名单户资金情况黑名单脉脉圈情况分析黑名单户资金来源与去向分析可疑客户圈建立,客户资金链分析,资金活动情况分析资金全在风险分析资金来源及去向分析资金活动频繁度资金投向分析,总体业务纵深拓展客户脉脉圈分析客户经理管户圈分析 黑名单户关,总体业务纵深拓展,客户画像,客户资金链情况客户贷款情况客户存款情况客户授信情况客户还款情况,以客户为中心、以资金活动及客户关系为向导,对预测客户进行全方位整体分析。得出客户在我行的总体画像。深层次挖掘客户价值、实现风险全面监控,分析潜在客户风险,找出相应的解决策略。,风险计量分析,全行总体风险及缓释情况各分支机构风险
10、及缓释情况预计风险损失估算风险暴露情况重点客户追朔分析,总体业务纵深拓展客户画像客户资金链情况以客户为中心、以资金活,贷款逾期预测,贷款逾期预测,解决思路,行业经验,人工处理,事后处理,传统方法,大数据技术,人工智能,提前预测,我们方法,基于客户的贷款信息和交易流水等行内数据;结合征信、工商、法院等外部数据;整合社交媒体、电商购物、衣食住行等行为数据;运用大数据预测技术,挖掘潜在高风险客户,预测未来可能会出现逾期的客户。,由事后变成事先提前预知!有人工变成机器智能!,提前预测,解决思路行业经验人工处理事后处理传统方法大数据技术人工智能提,实现方式,特征指标: 贷款信息相关特征:卡上余额、应还款
11、金额、放款利率、当月放款利率与上月放款率差值、执行利率、已罚利息总额、额度下最差十级分类代码、十级分类代码、小微采录行业种类代码、小微贷款申请人分类代码、担保方式细分代码、零售贷款品种代码、交易流水相关特征:收入总金额、收入总笔数、收入总平均额、支出总金额、支出总笔数、支出总平均额、我行对手收入金额、我行对手收入笔数、我行对手收入平均额、我行对手支出金额、我行对手支出笔数、我行对手收入笔数-他行对手收入笔数、我行对手支出金额-他行对手支出金额、我行对手支出笔数-他行对手支出笔数、还款卡号余额/本月应还款金额、收入总金额/支出总金额、收入总笔数/支出总笔数、我行对手收入金额/我行对手支出金额、我
12、行对手收入笔数/我行对手支出笔数、他行对手收入金额/他行对手支出金额、他行对手收入笔数/他行对手支出笔数、我行对手收入金额/他行对手收入金额、我行对手收入笔数/他行对手收入笔数、我行对手支出金额/他行对手支出金额、我行对手支出笔数/他行对手支出笔数、,基于银行提供数据提取近百维度特征,多种分类算法组合:One-class SVMRandom Forest,实现方式数据准备/特征分析样本整定机器学习网络模型检验结果反,模型测试示意,5月份以前数据,6月份预测结果,模型预测,6月份真实结果,对比,Input,Output,测试指标:准确性:逾期用户命中个数/逾期用户总个数过滤比例:正常用户命中个数
13、/正常用户总个数,逾期客户,正常客户,预测7月份结果,投产,模型测试示意5月份以前数据6月份预测结果模型预测6月份真实结,数据范围,银行内部数据,法院查询数据,车辆查询数据,征信数据,工商查询数据,房产查询数据,社交网络数据,客户交易数据、交互数据和行为数据:基于客户的贷款信息和交易流水等行内数据;结合征信、工商、法院等外部数据;整合社交媒体、电商购物、衣食住行等行为数据。基于大数据平台下的分布式存储和分布式计算,可以处理结构化、半结构化和非结构化的多种类型的数据,电商购物数据,数据范围银行内部数据法院查询数据车辆查询数据征信数据工商查询,使用效果和价值体现,XX银行内部方法准确率为46.7%
14、,我们方法的准确率为88.0%,传统方法需要在所有客户中查找逾期客户,我们方法只需要在11.2%的客户中查找逾期客户。,只需花费10%的成本和人力,达到接近90%的预测准确率,价值回报为9倍!预测结果和准确率只是第一步,关键的是要依据预测结果进行决策和行动,这里将由客户资金链分析、客户圈分析、风险客户分析等进一步的应用场景来支撑。,使用效果和价值体现XX银行内部方法准确率为46.7%,我们方,客户资金链分析,客户资金链分析,主要对于贷款逾期预测客户进行资金链全方位分析,以贷款客户为中心,在本行或是他行之间的资金往来情况,主要分析以客户资金链健康度、资金活动频繁度、资金流向风险度、资金额度可控度
15、等情况反应客户所带来的资金问题。资金链健康度资金来源客户状态正常性,客户信用度优良性,客户归属黑名单、客户在征信系统归属于可疑交易的客户或是非法组织等、或是客户对账户状态不正常,如客户与本类客户发生交易,可能带来资金链健康问题资金活动频繁度 对于客户资金活动频繁度分析,主要体现在客户在一个月或是一个季度资金交易发生频率分析,一般良性客户,在流动资产方面比较活跃,对于一般经济状况不太好的客户、资金活动频度很慢,从而分析客户经济状况。可能会给银行带来经济损失。,客户资金链分析主场景,主要对于贷款逾期预测客户进行资金链全方位分析,以贷款客户为中,资金流向风险度 对于资金流向风险度,主要分析客户资金去
16、向,是否为非法组织,是否参与股票、期货、期权、大量资金出现跨境支付等投资业务交易。通过交易资金去向分析安全性,可能给客户带来直接经济损失,从而影响还贷能力,造成银行经济损失。资金额度可控度 对于我行贷款户,在资金交易过程,存在大量资金流出,而资金回扰现象很少,客户在我行的存款业务量远远小于还本金及利息的额度时,这类客户会直接给银行带来经济损失,客户资金链分析主场景,资金流向风险度客户资金链分析主场景,理财,代付,存款,贷款,票据,委托,贴现,委贷,代收,代理,投资,基金,签发,兑付,消贷,商贷,房贷,定期,活期,客户资金链分析主页面,资金流向,资金交易频繁度,客户持有产品,客户发生交易类型,交
17、易对像范围,交易金资金额,资金来源,交易资健康度,理财代付存款贷款票据委托贴现委贷代收代理投资基金签发兑付消贷,客户“脉脉圈”分析,客户“脉脉圈”分析,客户脉脉圈主场景,客户脉脉圈的广泛度广泛度主要体现贷款客户与之相关联客户的数量,通过客户广泛度能区分体现客户资金活动的范围度,客户关系区域度,客户行业分布度。客户脉脉圈的健康度健康度主要分析客户关系链中,是否我行白名单客户存在关系,是否与黑名单存在关系,还是一些知名公司及一些可疑客户,或是客户信用度底或高的客户来分析客户脉脉圈的健康度。客户脉脉圈的信誉度主要通过客户脉脉圈分析与之相关客户的信誉度,来总体评价本客户圈的信誉情况。,客户脉脉圈主场景
18、客户脉脉圈的广泛度,客户脉脉圈主画面,脉脉圈联系紧密度,脉脉圈客户数,脉脉圈重点数,脉脉圈资产情况,脉脉圈风险数,脉脉圈白名单数,脉脉圈信用评分值,客户脉脉圈主画面脉脉圈联系紧密度脉脉圈客户数脉脉圈重点数脉脉,客户经理“管户”分析,客户经理“管户”分析,客户经理“管户”分布图 客户经理进入系统,能清晰的目前本客户经理下管户分布情况、各管户的信用情况、管户资金情况、与管户关系的客户情况客户经理“管户”资金链分析 客户经理能清晰分析出,各管理资金链情况,管户下的资金健康情况,资金活动情况,资金流入情况、资金流出情况客户经理良性优客户分析(营销) 客户经理通过资金链及客户信誉情况分析出优质客户,为后
19、期营销准备,客户经理“管户”主场景,客户经理“管户”分布图客户经理“管户”主场景,客户经理“管户”主画面,管户,管户,管户,管户,管户,管户,管户,管户,管户,管户,管户,管户,管户,管户,管户,管户,管户,管户,管户,客户经理,管户,管户,管户,管户,管户,管户,管户,管户,管户,管户,管户,管户,管户,管户,管户,管户,管户分布,管户脉脉圈,管户资金链,客户关系紧密度,客户关系健康度,管户关系资金情况,管户人数,客户经理“管户”主画面管户管户管户管户管户管户管户管户管户管,额度风控管理,额度风控管理,额度合理 主要结合贷后以贷前总体情况,对贷款的额度进行分析,贷款不良是否额度不合理、额度范
20、围评估真实性、贷款违规性等行为情况分析额度规范性 主要分析贷款从授信、评审、审批等过程中是否存在违规行为分析,额度风控管理主场景,额度合理额度风控管理主场景,额度风控管理主页面,授信额度风控中心,授信总金额,缓释总金额,还款总信息,变更总记录,授信总金额,授信可用总金额,总借据金额,循环授信协议数,单授信协议数,还款总金额,贷款总金额,逾期总金额,逾期总客户数,展期总借据数,担保总金额,押抵总金额,质抵总金额,保证人总金额,抵债资产总金额,变线资产总金额,资产化总金额,期限变更,额度变更,冻结变更,型态变更,方式变更,额度风控管理主页面授信额度风控中心授信总金额缓释总金额还款总,点击逾期客户数
21、,查看哪些机构,哪些客户经理的管户存在逾期,同时分析这些客户圈及资金链,客户信授总额与缓释金额的差别,额度风控管理子页面,逾期贷款户,客户经理,授信总金额,缓释总金额,客户圈分析,资金链分析,贷款发放次数,累计发放金额,贷款余额总和,逾期金额总和,额度不合理性分析图,点击逾期客户数,查看哪些机构,哪些客户经理的管户存在逾,风险客户链分析,风险客户链分析,风险客户管理主场景,黑名单资金链主要对于黑名单户或是一些贷款核销户进行资金链分析,查看黑单名与我行哪些户存在资金链关系,从而分析出目前正常或是逾期贷款户是否存在欺诈现象,还款意愿不高的客户。黑名单也有生命周期管理。聚类分析体现出物与类聚、鸟与群
22、居的思想。黑名单脉脉圈客户经理或是信贷部经理查看黑名单户。通过历史数据深层次挖掘分析。找出我行贷款户现阶是否存在欺诈现象,对这些贷款户要重点关注。,风险客户管理主场景黑名单资金链,贷款户与黑名单关系,逾期与逾期客户关系,逾期客户与黑名单资金额度,逾期客户与黑名单客户数,风险客户名单管理主画面,黑名单户是否存在担保关系,黑名单客户黑名单客户B正常客户正常贷款客户逾期客户A逾期客户,贷款风险评测,贷款风险评测,贷款风险评测主场景,全行总体评测贷款风险评测主要是对本行逾期贷款户的风险进行总体评测,估计预算损失,对重点客户进行重点追搠。从而分析出我行重点风险分布情况。分支行各自评测风险评测可以根据分行
23、情况,支行情况评测,以可以按客户经理评测,查看风险分布情况,进行总体跟踪。客户经理管户评测客户经理可能对其管户进行总体风险评测,分析所有管户的风险情况,预计所带来的损失情况。,贷款风险评测主场景全行总体评测,逾期本金,抵押物,质押物,担保人,计量规则,评测方法,抵债变线,损失估算,担保金,风险暴露,风险缓释,风险计量,风险评测,预计损失,敞口总风险,缓释总金额,预计总损失,追搠重点,总体评测,查看本行总体风险情况,同时可以按分行、支行、客户经理评测查看风险分布情况。针对风险进行总体跟踪。,贷款风险评测主画面,逾期本金抵押物质押物担保人计量规则评测方法抵债变线损失估算担,客户画像,客户画像,客户
24、画像特征跟踪主场景,产品跟踪 客户在我行所使用的产品情况,在各产品上的余额情况,在各产品上账务发生情况的统计分析。各产品在同不时期的占比情况资金链跟踪 通过客户在我行的资金往来情况,资金交易频率情况,资金交易对手信用情况,资金来源情况等跟踪客户的资金链。分析资金链的健康度。客户脉脉圈跟踪 通过客户资金交易关系,客户关联关系,担保合同关系,委托代理关系等来划分客户的脉脉圈。通过历史数据深层挖掘,来分析客户圈价值等。,客户画像特征跟踪主场景产品跟踪,欺诈现象跟踪通过资金链及客户圈,分析本客户是否存在与一个或多个黑名单名发生资金往来。交易次数是否频繁,交易金额是否大额,黑名单户是否存在担保或是互保关
25、系。还款信息跟踪 通过客户历史还款信息,分析其资金来源正当性,还款日期准确性、结算账户资金活动性,逾期次数,罚息金额等情况,客户画像特征跟踪主场景,欺诈现象跟踪客户画像特征跟踪主场景,客户画像展现主画面,贷款总金额,其中短期贷款金额,其中中长期贷款金额,长期贷款金额,授信总金额,累计发放金额,累计还款金额,授信可用额度,担保总金额,其中抵押金额,其中质押金额,其中保证人保证金额,逾期贷款总金额,本金逾期总额,利息逾期总金额,应收利息总金额,实收利息总金额,存款总额,其中定期存款,其中活期存款,其中保证金金额,其中使用产品数,资金链键康度,客户脉脉圈人数,是否存在欺诈,与黑名单累计交易次数,与黑
26、名单交易累计金额,存款利息总收入金额,近期存入金额总计,近期支出金额总计,罚息总额,是否VIP客户,客户信用评级,本行客户脉脉圈数,它行客户脉脉圈数,客户财务指标信息,客户画像展现主画面贷款总金额其中短期贷款金额其中中长期贷款金,目录,数据资产管理和价值变现,贷款客户风险预测分析应用,我们可以提供的支撑,目录数据资产管理和价值变现贷款客户风险预测分析应用我们可以提,新型的数据服务&合作模式,产品:大数据平台、挖掘分析应用平台、数据管控平台、算法模型、具体应用产品等服务:数据治理、MAST数据验证、数据处理服务、解决方案等咨询:算法和模型落地咨询、数据专家咨询、业务专家咨询运营:数据资产管理运营
27、、数据价值变现过程运营新型合作模式:大数据实验室,新一代数据服务将是:围绕着银行数据资产管理和业务应用价值变现的持续优化演进的过程。首先实现数据作为企业资产的管理和运营,然后逐步实现数据资产带来的真正应用价值,这个过程需要数据使用方和数据服务方紧密配合,是一个不断持续演进和提升的过程。,新型的数据服务&合作模式产品:大数据平台、挖掘分析应用平台、,超强的资源整合能力,“肩膀”产品支撑落地经验,“MAST”外在驱动力区域,“风口”DT时代,“科学家”科研力量业务力量数据力量,“根据地”数据土壤应用摇篮,“场景验证”试点客户,整合能力,整合资源,聚集人才,依托“根据地”和外部推动力,持续合作,循环
28、递进!,超强的资源整合能力“肩膀”“MAST”“风口”“科学家”“根,共建大数据应用实验室,背景:大数据时代,需要一种新型的合作模式,整合价值链主要环节的资源,共同打造银行大数据生态圈,银行业在大数据应用发展上处于摸索的阶段,需要在互信互利的前提下,采用战略合作的模式,以建立银行“大数据应用实验室”的方式来实践前行。目标:旨在海量数据的智能挖掘分析技术、算法和模型的研究和应用落地,合作各方在数据源、算法、应用场景和大数据平台技术上通力协作,并最终服务于金融行业的大数据价值变现,推动大数据在金融行业的应用落地。主要合作方:银行、实验室运营团队,大数据算法和模型团队,应用场景设计团队、专业的IT技
29、术团队等。 合作各方共享人才资源,共同运营大数据实验室,共享大数据实验平台,共享大数据价值变现回报,并将大数据实验室打造成一个人才聚合的平台,并以此为契机,形成不同商业模式的协同发展,建立金融大数据生态环境!,Big Data,阿里小贷之所以成功的根本原因在于阿里巴巴帝国的庞大生态圈!,共建大数据应用实验室背景:大数据时代,需要一种新型的合作模式,助推区域应用服务单体机构,定标准,建平台,服务监管,实施标准和规范基础物理通道基础数据产品基础应用管理平台运行机制,阶段性成果,治理数据,价值变现,服务银行机构,大数据分布式平台数据验证工作区域级数据价值变现应用单体和区域应用的互通运行机制,演进提升
30、,助推区域应用服务单体机构定标准,建平台,服务监管实施标准和规,应用展现,数据挖掘,数据分析(OLAP),固定报表,指标引擎,多维建模,分类回归,聚类分析,时间模式,关联规则,异常检测,即席查询,经营管理,历史查询,监管报送,领导查询,经营报表,风险防范,风险指标,逾期预测,流失预测,风险监测,市场营销,精确营销,行为分析,推荐系统,产品定价,信息门户和用户统一登录(PC终端/移动终端/自助终端),高价值密度数据(结构化数据),低价值密度数据(结构/半结构/非结构),数据来源,数据采集存储,数据加工,数据资产应用,业务数据互联网数据社交媒体物联网第三方数据,预测建模,DW,报表展现,灵活查询,
31、多维分析,监测预警,预测分析,决策支持,互联网金融,数据生命周期管控,标准体系,元数据管理,数据质量管理,知识库,数据资产管理,数据白盒,运维监控,提供平台产品支撑,应用展现数据挖掘数据分析(OLAP)固定报表指标引擎多维建模,业务总流程,银监合规效验,内部风险管理,内外兼顾,业务总体目标,贷款逾期预测,数据共享,银监EAST规则,银监MAST规则,银监客户风险规则,合规性风险,信用风险规则,操作风险规则,算法演练,预测分析,风险跟踪,特征共存,规则共享,贷前,合规性原则,合理性原则,合法性原则,规范性原则,资金链分析,脉脉圈分析,风险计量,客户画像,贷中,贷后,348条件共规则,业务总流程银监合规效验内部风险管理内外兼顾业务总体目标贷款逾,合规性业务流程,规则定义,银监准上报数据,合规性规则,合法性规则,合理性规则,规范性规则,规则评审,规则发布,规则周期,业务人员规则梳理,业务规则管理,提前预警,数据调整,上报确认,源系统完善,预处理上报数据、发现问题数据,合规性业务流程规则定义银监准上报数据银监规则交集规则合规性规,致力于数据资产管理和价值变现增值,致力于数据资产管理和价值变现增值,感谢聆听,感谢聆听,