数据挖掘案例客户信用度分析.ppt

上传人:仙人指路1688 文档编号:2908104 上传时间:2023-03-02 格式:PPT 页数:24 大小:323KB
返回 下载 相关 举报
数据挖掘案例客户信用度分析.ppt_第1页
第1页 / 共24页
数据挖掘案例客户信用度分析.ppt_第2页
第2页 / 共24页
数据挖掘案例客户信用度分析.ppt_第3页
第3页 / 共24页
数据挖掘案例客户信用度分析.ppt_第4页
第4页 / 共24页
数据挖掘案例客户信用度分析.ppt_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《数据挖掘案例客户信用度分析.ppt》由会员分享,可在线阅读,更多相关《数据挖掘案例客户信用度分析.ppt(24页珍藏版)》请在三一办公上搜索。

1、TeradataTM Warehouse MinerTraining Workshop案例-4 客户信用度分析,专题概要,客户信用度是指根据客户在网时间、缴费情况、客户积分等相关要素对集团客户和个人客户进行评分,用于衡量客户缴费行为的好坏。它由两部分组成:历史信用度下月缴费可能性。历史信用度根据用户近6月的欠费情况(欠费天数、欠费次数)和缴费情况(是否及时缴费、未及时缴费次数)来计算下月缴费可能性则是考察其它相关因素,利用回归方法来计算客户下月及时缴费的可能性这两部分的加权求和就构成了客户的信用度评分客户信用度分析专题主要用于制定合适的催欠策略,对于信用度高的客户适当延长催欠时间,对于信用度极

2、低的客户则及时停机以避免更大的损失,同时客户信用度也是计算客户价值时的要素之一,业务问题定义,客户信用度模型与客户价值模型类似,信用度由两部分组成:历史信用度下月及时缴费可能性客户信用度评分=历史信用度*系数X下月及时缴费可能性*系数Y目标客户范围非特殊客户(公免、测试、员工等)当前状态为在网,业务问题定义(续),历史信用度从不欠费1.0 近6月从不欠费(近6月平均欠费天数0)欠费后及时交费(0.6,0.9)(近6月平均欠费天数0且近6月未及时缴费次数=0)0.9-0.3*(R6M_OWE_DURATION/30)欠费后不及时交费(0.3,0.6)(近6月平均欠费天数0且近6月未及时缴费次数0

3、)0.6-0.3*R6M_OWE_CNT欠费后逃费(这批客户已经被排除)0(当前状态=b,本月被局拆)下月缴费可能性则是通过数据探索,选取与客户缴费行为有关的各种属性,然后用回归方法计算得到客户下月缴费的可能性历史信用度,数据准备,数据准备阶段包括:数据清洗和预处理建立物理数据模型(PDM)数据的抽取转换和加载(ETL)选择与抽样使用物理数据模型作为选取和测试数据的依据,从数据仓库收集全部的各类数据,更好地了解客户.,物理数据模型设计,基表-总表(All items table)客户基本资料客户缴费资料客户投诉资料客户帐单资料客户通话资料根据客户编号和帐务年月进行连接形成总表。派生变量-总表视

4、图在总表的基础上,进一步派生出比率字段形成视图。在此基础上,一方面利用公式计算出客户的历史信用度,另一方面用回归方法计算出客户下月缴费的可能性,数据的抽取、转换与加载,尽管数据仓库中已经对原始的业务数据进行了清洗、转换和集成,仍然需要按照挖掘任务的要求生成挖掘专用的数据集市,并将数据从数据仓库抽取过来。,选择与抽样,选择和信用度分析有关的信息组成客户价值分析总表。从总表中各抽取600000作为训练和测试集合,抽样比例约为总样本的28%左右。,探索型数据分析,采用可视化的工具或统计分析等方法来展示及探索各个变量对客户流失的影响,包括:柱状图频数分析相关分析值分析,探索型数据分析,值分析:通过值分

5、析对数据进行基本的探查,包括空值数目、唯一值数目、空字符串数目、零值、最大值、最小值的统计,舍弃一些几乎全部是零值的变量。相关分析:通过相关分析发现并找出与客户欠费标志(目标变量)相关性较强的客户属性,去掉和客户欠费标志相关的变量和相关系数小于0.1的变量,剩下的变量作为回归客户下月缴费可能性时的自变量。,建模,通过探索型数据分析,把所有数据准备好之后,就可以选用适当的数据挖掘工具及数据挖掘技术来建立客户信用度分析模型。,历史信用度的定义,从不欠费1.0 近6月从不欠费(近6月平均欠费天数0)欠费后及时交费(0.6,0.9)(近6月平均欠费天数0且近6月未及时缴费次数=0)0.9-0.3*(R

6、6M_OWE_DURATION/30)欠费后不及时交费(0.3,0.6)(近6月平均欠费天数0且近6月未及时缴费次数0)0.6-0.3*R6M_OWE_CNT欠费后逃费(这批客户已经被排除)0(当前状态=b,本月被局拆),首先把客户进行适当的分群,即下月欠费天数少于30天的客户定义为及时缴费客户,高于该值为未及时缴费客户;定义及时缴费客户为回归时的目标客户群对目标客户群使用回归算法建立预测模型,抽取600000条记录作为训练数据集采用所得回归模型计算每位客户下月缴费可能性的概率得分值,下月缴费可能性,合并客户的历史信用度和下月缴费可能性,计算出最终的客户信用度评分:客户信用度评分(1000*历

7、史贡献度)*0.8+(QUANTILE(1000,下月缴费可能性)+1)*0.2通过上面的计算即可得到每位客户的信用度评分在11000之间,客户信用度评分,对客户信用度分析模型在2003年5月的评分结果进行评估,评估内容包括:信用评分和下月客户状态(正常、局拆、预拆)的关系信用评分和信用额度的关系,模型评估,客户信用评分和下月客户状态的对照表,客户信用评分和下月客户状态的对照表,客户信用评分和下月客户状态的对照表,从图中可以看出,信用度评分和客户下月状态为正常的客户数之间存在明显的正比关系,即信用度越高则缴费行为就越好,因此就不容易因欠费而导致状态异常,符合业务规则。信用度评分和局拆状态也存在明显的依赖关系,被局拆的用户基本上都是信用度评分低于600的用户。而对于预拆来说,由于目前预拆体现在当月,即月底出帐时预拆的客户,其预拆状态是作为月底的状态而非下月的状态,因此它和信用度之间没有明显的相关性。,客户信用度评分和信用额度的对照表,客户信用度评分和信用额度的对照表,客户信用度评分和信用额度的对照表,从图中可以看出,信用额度小于0的人数远远少于信用额度大于等于0的客户人数。,模型发布,钻取结果,Questions?,Open Discussion,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号