中高端保有(卡类流失到50元以下)_模型分析报告.ppt

上传人:仙人指路1688 文档编号:2698326 上传时间:2023-02-22 格式:PPT 页数:23 大小:123KB
返回 下载 相关 举报
中高端保有(卡类流失到50元以下)_模型分析报告.ppt_第1页
第1页 / 共23页
中高端保有(卡类流失到50元以下)_模型分析报告.ppt_第2页
第2页 / 共23页
中高端保有(卡类流失到50元以下)_模型分析报告.ppt_第3页
第3页 / 共23页
中高端保有(卡类流失到50元以下)_模型分析报告.ppt_第4页
第4页 / 共23页
中高端保有(卡类流失到50元以下)_模型分析报告.ppt_第5页
第5页 / 共23页
点击查看更多>>
资源描述

《中高端保有(卡类流失到50元以下)_模型分析报告.ppt》由会员分享,可在线阅读,更多相关《中高端保有(卡类流失到50元以下)_模型分析报告.ppt(23页珍藏版)》请在三一办公上搜索。

1、卡类中高端用户价值降低预警模型分析报告,主要内容,背景介绍分析目标模型定义数据分析与探索模型构建模型评估,背景,2008年底,运营商重组基本完成,随着全业务运营时代的来临,移动市场上客户争夺越演越烈,尤其是中高端客户市场硝烟四起,战火纷飞。,为了赢得这场战争,集团公司把中高端客户保有作为09年的战略目标之一,为各省公司下达了相应的中高端保有任务,而省公司也对市公司下发锁定中高端考核指标。,分析目标,利用客户近期通信行为,建立中高端客户的价值流失预警模型,预测集团公司下发的客户以及最新的中高段客户的价值下降的情况,使中高端客户保有更有针对性,更有效地支撑客户挽留活动,实现集团公司中高端客户保有的

2、目标。,模型定义,分析用户群:集团公司下发的拍照用户中的卡类用户:08底在网且10、11、12月三个月累计ARPU不低于360元,且客户年底状态正常且12月是通话的卡类客户。中高端客户:最近三个月账单总金额不小于360元的卡类用户,模型目标:预测哪些客户的在预测窗口的ARPU将会低于50元,将此类用户定义为流失用户。时间窗口:,构建模型时的时间窗口:分析窗口:2008年10月至12月,选择拍照用户此窗口内的通信行为进行分析预测窗口:2009年2月,用此窗口内的ARPU来打流失标签,主要内容,背景介绍分析目标模型定义数据分析与探索模型构建模型评估总结,数据分析与探索,目标:通过对数据质量的检查、

3、各个变量关系的探索,选取进入逐步逻辑回归模型的变量对象:用户:944029个卡类拍照用户数据:本地、长途、漫游通话,交往圈,ARPU等方法:值分析:对数据质量进行检查,处理缺失值直方图分析:直观的看到该变量和流失的关系。相关性分析:对于相关性比较大的变量,只选取其中一个进入模型。,数据分析与探索:直方图分析,通过直方图,我们可以直观的看到该变量和流失的关系。我们按照等频分箱的方法,将用户分成10个箱,计算每个分箱内的流失率。如右图所示,是按照网内主叫号码数将用户分成10个箱(尽可能使得每个箱里面的用户数相等)。红柱子是该分箱内2009年2月ARPU小于50元的用户(即流失的用户),紫柱子是该分

4、箱内2009年2月ARPU大于等于50元的用户。黄线是各个分箱的流失比率。蓝线是全体用户中的流失率。观察第十个分箱的网内主叫号码数区间,可以发现此区间内包含比较异常的数据,而等频分箱的方法可以降低这类数据对分析的影响。,生成该直方图的数据,按照外内主叫号码数的多少将用户分成10个箱,用户数,流失率,网内主叫号码数,数据分析与探索:国内漫游,左图:有国内漫游被叫的人群流失率较高,其中被叫次数多的流失率又偏小右图:由国内漫游带来的价值增长不太稳定,容易流失,本月国内漫游网内主叫次数,本月国内漫游网内主叫次数与最近三个月平均值的比值,数据分析与探索:国内与省内漫游,从上面两图比较,省内漫游和国内漫游

5、的情况有较大区别:国内漫游的流失偏高大部分用户省内漫游的流失偏低,本月国内漫游网内主叫次数,本月省内内漫游网内被叫次数,数据分析与探索:国内与省内长途,比较上面两图,国内长途和省内长途的区别:在有国内长途的人群中,呼叫多的流失风险偏高省内长途呼叫多的流失少,最近三个月国内长途主叫时长的平均值,有国内长途的人群,最近三个月省内长途主叫时长的平均值,数据分析与探索:网内通话占比,网内通话占比过高或者过低的人群,流失率都偏大。当此比值是0.63到0.68时流失率最小,最近两个月网内通话占比的平均值,数据分析与探索:变量筛选,直方图分析的结果还可以用于变量筛选:如果流失率曲线与变量的关系比较复杂,我们

6、可以简单的将其排除在模型输入变量之外,或者利用分箱结果,生成一些标志变量。,本月被叫联通gsm号码数与最近三个月平均值的比值,本月ARPU与最近三个月平均值的比值,数据分析与探索:ARPU波动,在当本月ARPU波动较大的人群中,流失率较大在模型构建时,我们有可以利用这一性质,生成新的变量,标识该用户的ARPU是否在本月波动较大,2.1793=本月ARPU与最近三个月平均值的比值=3,本月ARPU与最近三个月平均值的比值,本月ARPU与最近三个月平均值的比值,主要内容,背景介绍分析目标模型定义数据分析与探索模型构建模型评估,模型构建:建模工具,该业务问题是一个二元预测问题,并且从数据探索的结果来

7、看,与之相关的数据大都是数值型的数据,因而适合用逻辑回归的方法来建模。,Teradata Warehouse Miner能够方便的建立逻辑回归模型,并且能够很好的配合Teradata数据库进行大量数据的计算,是建模工具一个较好选择。,模型构建:建模流程,模型输入变量,训练集,测试集,LG模型,我们将944029个用户按照6:4的比例分成训练集(566417个用户)和测试集(377612个用户)来构建、评估模型。,模型结果,通过用训练集来建模,我们得到用户在下下个月arpu低于50元的概率为:,其中Y=常数+变量1*系数1+变量2*系数2+变量3*系数3+。,注:1.系数是正的,说明该变量和流失

8、是正相关。2.如果从系数得出的相关性和直方图分析的结果不一致,应当对模型进行调整(比如去掉某些变量、合并某些变量)。3.标准化系数消除了量冈的影响,可以用其绝对值大小来比较各个变量对流失的影响。,模型结果分析,主要内容,背景介绍分析目标模型定义数据质量分析数据探索模型构建模型评估,模型评估,我们使用命中率(Response%)、提升率(Lift)、覆盖率(Capture Respones%)来对模型进行评估:命中率=提取的客户中流失的数目/提取的人数提升率=命中率/总体的流失率覆盖率=提取的客户中流失的数目/总体的流失的人数,模型评估,测试集评估结果:前3%(约1.1万用户)的命中率为35%,提升率为4.1,覆盖率为12.3%前5%(约1.9万用户)的命中率为31%,提升率为3.6,覆盖率为18%,模型部署,在模型建立好之后,我们将每月按照模型的打分公式给客户打分,并提供得分在前3%或者5%的客户名单。为了保证模型的正确性,还将定期对模型进行评估,当模型退化严重时必须重新建模。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号