《流动人口识别监控与精准营销系统.doc》由会员分享,可在线阅读,更多相关《流动人口识别监控与精准营销系统.doc(11页珍藏版)》请在三一办公上搜索。
1、成果上报申请书成果名称流动人口识别监控与精准营销系统成果申报单位 广东 省(自治区/直辖市)公司成果承担部门/分公司广东省业支分析室 部门 / 分公司项目负责人姓名项目负责人联系电话和Email成果专业类别*业务支撑所属专业部门*成果研究类别*其他省内评审结果*(按填写说明4)关键词索引(35个)流动人口识别,逻辑回归,精确营销应用投资万元(指别的省引入应用大致需要的投资金额)产品版权归属单位 对企业现有标准规范的符合度:(按填写说明5)依据总部的中国移动省级经营分析系统流动人口市场分析应用业务技术方案V1.0的标准规划,作出了以下的本地化提升与优化:1,提升了流动人口的内涵和客户群,从外来工
2、扩展为学生、商务人士等群体。2,不仅仅从“两城一家”业务作为外来工识别的信息基础,扩展到了广东本地的针对流动人口的业务,例如“老乡网”、“我爱我家”、“定向长途”、“新佛山人俱乐部”等。3,实现了算法的优化。4,实现了与精准营销系统、客户标签库的相结合,经分切实支撑一线营销。如果该成果来源于研发项目,请填写研发项目的年度、名称和类型(类型包括:集团重点研发项目、集团联合研发项目、省公司重点研发项目、其他研发项目),可填写多个:成果简介:简要描述成果目的和意义,解决的问题,取得的社会和经济效益。随着经济体制改革推进,中国的流动人口迅速扩大,规模超过2.6亿,成为一个不可忽视的特殊群体。而广东作为
3、外来工输入第一大省,流动人口逾2300万,如何为流动人口提供优质的移动信息服务,吸引并保有这一客户群体,是建设和谐社会的重要内容,也是激烈市场竞争的需要。与校园客户、VIP客户对比,外来工客户群体分布区域复杂,实名制登记比例低,且覆盖了社会各类人群,其内部差异大、流动性高、稳定性不强以及需求分散等特征,对移动公司用户和收入的分析与统计带来较大的影响。如何对这部分客户展开监控、吸纳、关怀、保有和潜力挖掘,是提升流动市场客户满意度和客户价值的关键。为了降低流动人群返乡期间的漫游及长途费用,激发流动客户话务量,满足家庭沟通、亲情联系的需要,培养客户忠诚度,同时为了避免假期期间各公司之间互相争夺同一目
4、标客户而浪费营销资源的现象,提升营销效率,降低营销成本,提高企业效益,广东公司决定对流动人口通过智能分析,对其进行精确化营销。本项目利用社交网络分析技术,结合其漫游、长途等电信特征,建立起客户的省内外交往圈结构分析模型,识别出外来的流动人口。通过基站信息,再结合其ARPU、品牌等电信特征的基础上,建立流动人口识别模型,对流动客户进行类型识别,细分出学生流动客户、外来务工人员两类流动客户。提升对外来工的认识,挖掘他们的深度移动服务需求,贴近他们的生活,提供合适的移动信息服务。识别外来工中的求职者,对他们进行相应的关怀和服务,帮助他们顺利务工。流动人口识别监控与精准营销系统应用以来,取得了显著的社
5、会和经济效益,对外来工针对性的开展“我爱我家”免费打长途优惠营销活动,受到广大外来工的欢迎。经营分析系统解决方案辅助流动人口市场营销,通过精确营销准确定位“两城一家”目标客户,协助稳定存量市场,带来新增效益 1362 万元。 截止至2011年3月底,广东公司在“两城一家”与“非常假期”营销活动发展的用户总数达到375.2万。同时,通过价值评估体系和客户细分进行客户差异化服务,从多方面多层次对客户进行关怀,打造客户归属感,例如佛山的“新佛山人俱乐部”,并且发布外来工招聘信息,我们不仅关注自己的业务,也关注社会焦点问题,充分体现广东移动一贯的“懂得感恩 回报社会”的企业理念。省内试运行效果:描述成
6、果引入后在本省试运行方案、取得的效果、推广价值和建议等。流动人口识别监控与精准营销系统应用以来,取得了良好的效果,模型很好的识别了外来务工人员和外来学生群体。省公司充分利用流动人口模型,结合流动人口通信需要,向其开展营销活动。目前已开展“两城一家”,“我爱我家”,“非常假期”等营销活动,取得的效果如下:1. 精确营销准确定位“两城一家”目标客户,协助稳定存量市场,带来新增效益 1362 万元;2. 截止至2011年3月底,全网“两城一家”与“非常假期”营销活动发展的用户总数达到375.2万;3. 对外来工针对性的开展“我爱我家”免费打长途优惠活动,受到广大外来工的欢迎,提升了用户归属感。文章主
7、体(3000字以上,可附在表格后):根据成果研究类别,主体内容的要求有差异,具体要求“着力提升客户服务能力”是中国移动2011年的重点工作要求;李跃总裁在2011年的工作会议上提出6个狠抓之一“狠抓质量与服务提升,夯实竞争与发展的基础”的全年工作方向。广东公司提出在“客户为根,服务为本”的理念下,通过服务创新,实现三高(服务品质高、客户满意度高、服务效率高)。而广大的流动人口特别是农民工,是社会的弱势群体,在此背景下,广东公司希望通过对流动人口进行识别,对这群长途话务需求高的人群提供合适的服务产品,使这群远离家乡的人们得到更多的关怀,激发流动客户话务量。如何对这部分客户展开监控、吸纳、关怀、保
8、有和潜力挖掘,是提升流动市场客户满意度和客户价值的关键。一、 项目背景随着经济体制改革推进,中国的流动人口迅速扩大,规模超过2.6亿,广东超过2300万,成为一个不可忽视的特殊群体。为流动人口提供优质的移动信息服务,是建设和谐社会的重要内容。亿万流动人口市场庞大,消费旺盛,月通信消费在50元以上的约占45%,富含商机,但市场竞争也日渐加剧。我公司流动人口市场营销缺乏统筹,大规模人口流动的春节期间两地重复营销,内耗严重,造成巨大资源浪费。客户流动弃卡,离网率高;重复入网带来酬金成本增加、号源浪费;高漫游单价导致话务量未能充分释放。庞大而复杂的流动人口对公司的统筹规划影响较大,如何准确甄别出流动人
9、口,识别出目标客户的需求,为各级市场部门提供较好的支撑服务,为各级市场部门提供精细化营销所必需的支撑服务。二、 实现方案流动人口识别监控与精准营销系统的核心是流动人口识别模型。本方案旨在描述如何在现有经营分析系统中建立流动客户识别模型,通过对流动客户的识别,为流动人口市场营销提供支撑。通过建立流动客户多维分析,建立流动给客户监控应用,全面提升公司整体应对流动市场特别是外来工市场的响应速度和把控能力,确保流动人口市场的竞争优势,提升公司核心竞争力。主要分析思路和步骤如下:1. 对流动人口样本选取基于业务分析及相应的数据分析,我们将通过构建分类预测挖掘模型来实现上述业务需求。此挖掘问题的主要业务定
10、义包括: 分析用户定义10月老乡网活跃用户数、2月有漫游通话,但全年其他时期(3、4、6、7月)皆无漫游的用户和定向话务与短信次数占比大于等于0.15,同时ARPU小于等于200的用户作为目标客户。 预测用户定义统计期有帐单且金额大于0的用户。 目标变量:是否外来工求职者。其中外来工指的是来自外省的蓝领阶层的工人主要从事体力劳动的人群,收入相对较低;求职者是指目前处于失业状态,正在寻找工作的人; 还有一部分是外地来求学准备毕业的学生,这部分用户面临毕业正在寻找工作。 时间窗口定义分析窗口:2011年4月2. 流动人口建模变量数据探索数据分析(业务特征描述):外来客户群体在地域分布、通话特征、资
11、费特点、消费能力和节假日消费上与本地客户存在明显区别,可以根据这些区别来判别客户有多大的可能性是外来工。因此,首先要基于对现有的外来工进行分析,提炼和概括其信息、消费行为特点,然后选定和构造相应的变量,为后续的数据挖掘做准备。这里选取变量时主要基于省际流动人口,在进行省内流动人口识别时,可以根据自身外来工特点进行变量增减和数据预处理,进行调整。在数据分析全过程中,我们通过可视化(Visualization)工具及统计分析等方法来展示及探索(Explore)各个变量的效能,从而最终获得模型的输入变量。通过数据探索进行变量筛选的分析方法很多,因为业务目标是分类数据,此处主要针对每个变量绘制折线图(
12、line graph)进行数据探索。包括两部分:(1). 均值比较:比较各种变量在外省求职者的均值与其它用户的差异。初步了解外来求职者的特征。(2). 图形分析:用图线全面展示变量在不同取值下,用户群中外省求职者的比例,发现变量值与外省求职者的更深层的相关联性。u 探索分析结果1) 新入网13个月用户是外省求职者的可能性较高;2) ARPU在23到54之间的用户是外省求职者的机会就较大了;3) MOU在360分钟以内的用户是外省求职者的可能性较高;4) 省内长途多的用户是外省求职者的可能性较低;5) 省际长途多的用户外省求职者的可能性都较高;6) 本地交往圈号码少,省内交往圈号码数少、省际交往
13、圈号码数多的用户,是外省求职者的可能性较高;7) 定向通话次数多、定向交往圈大、定向短信条数多的用户是外省求职者的可能性高;8) 发送外省的SMS条数在14条以上的的用户是外省求职者的可能性较高。条数多于32条的,则这个可能性很高;9) 首10次通话中外省通话次数多的用户,是外省求职者的可能性很高;10) “我爱我家”业务用户是外 省求职者的可能性较大;11) 集团客户成员是外省求职者的可能性较小。3. 流动人口模型的构建本项目主要目的是对客户是否外来求职者进行推理,属于二元分类预测问题。对于二元分类预测问题,可以选用决策树、神经网络、逻辑回归、判别分析等数据挖掘算法进行分析建模。此处我们选用
14、Logistic回归模型寻找用户类别的规则。Logistic回归模型是一种概率分类模型, 它以用户是外省求职者的概率为因变量, 客户属性、通信行为等因素为自变量建立回归模型。以p 表示用户是外省求职工的概率,函数p 对Xi 的变化在p=0 或p=1 的附近是不敏感的、缓慢的,且非线性的程度较高。按照Logistic 变换(或称为p 的Logit 变换),即(p) 对Xi 就可以是线性的关系了,即可以表示为:u 建模流程:1. 样本切分:按外省求职者标志随机分层抽样:80%作为训练集,20%作为测试集。2. 模型训练:用训练集以分步Logistics回归训练,自动选择最有用的变量,拟合出变量的参
15、数。3. 模型评估和优化:用测试集评估模型的准确率,不断优化模型。4. 模型构建后得到外省求职者概率的计算公式,用于识别外省求职者。5. 流动人口识别模型通过用户的基本信息特点和消费行为进行建模挖掘,然后通过收集的流动人口数据进行数据验证,进行模型调整,最后在个人客户统一视图中通过标签的形式予以体现。变量的选择和构造、关键性阈值调整,各省可以根据自身情况进行选择或者补充。建议的模型识别流程如图 3所示:图 31流动人口(外来工)识别模型流程u 模型结果解释外省求职者识别变量及参数:变量参数值Wald Statistic标准化参数(常数项)-4.538305950.7058首十次通话省外次数0.
16、164047224.98090.1585定向交往圈人数0.08442127.85290.1754在网时长(天)-0.00086980.3789-0.3861上行省外短信次数0.00529973.79410.2632主叫交往圈号码数-0.02936770.075-0.3572珠三角用户0.62581740.65510.1546省际主叫次数占比3.60569740.03860.9211非漫游费用0.00645630.78480.1926定向短信量-0.00421529.0053-0.2046ARPU-0.00511524.6581-0.2483国内漫游MOU占比0.74728810.73340.0
17、607定向漫游时长3.00E-057.9330.0541省际主叫占比-1.4369066.6362-0.37省际定向mou占比-0.3594026.5786-0.0826上行省内短信次数0.0019935.82920.0664说明:Wald Statistic:反映变量区分外省求职者的能力,越大则区分力越显著。标准化参数:反映变量在以标准差为单位变化时,外省求职者概率变化的程度。绝对值越大则表示影响越大。根据建模结果,用户是外省求职者的概率p的公式为:其中 X -4.538305 + 0.164047 * 首十次通话省外次数 + 0.08442 * 定向交往圈人数 - 0.000869 * 在
18、网时长(天) + 0.005299 * 上行省外短信次数 - 0.029367 * 主叫交往圈号码数 + 0.625817 * 珠三角用户 + 3.605697 * 省际主叫次数占比 + 0.006456 * 非漫游费用 - 0.004215 * 定向短信量 - 0.005115 * ARPU + 0.747288 * 国内漫游MOU占比 + 3.00E-05 * 定向漫游时长 - 1.436906 * 省际主叫占比 - 0.359402 * 省际定向mou占比 + 0.001993 * 上行省内短信次数4. 模型评估u 模型评估方法建立测试数据集对模型进行测试,使用准确率、LIFT值分别对模
19、型进行评估。其中: 准确率=准确预测某类的人数 / 被预测为某类的人数 LIFT值=模型预测准确率 / 随机抽取准确率LIFT值刻画了选用模型预测名单比随机选取时的提升倍数,当LIFT值大于1时,说明模型有实用价值,且LIFT值越大,其价值越大。另还需考虑测试时的准确率与训练时的差异程度,差别较大说明所构建的模型稳定性较差,需要调整参数或增加新变量以增强模型稳定性。u 模型结果解释在测试集上评估模型准确率:分数在前5%的用户,命中了全部外省求职者的28.5%,LIFT值为5.2分数在前10%的用户,命中了全部外省求职者的42.7%,LIFT值为4.2三、项目的主要创新点u 主要技术创新点建立流
20、动人口识别模型时,除了用户基本属性、通信特征、数据业务特征之外,在模型中加入了用户通话地点(基站信息),通过基站信息,建立移动轨迹分析模型,再结合其ARPU、品牌等电信特征的基础上,同时,加入了用户省外交往圈、省内交往圈的大小等变量,能够更精确的识别流动人口类别,对流动客户进行类型识别,细分出高校学生流动客户、外来务工人员三类流动客户。其一,客户位置信息。通过客户通信基站信息可以获取客户的位置信息,而位置信息背后蕴藏丰富的客户特征数据,建立移动轨迹分析模型。其二,客户交往圈信息。流动人口因地缘等关系自然而然成组成群,外来务工人员、高校学生圈子内部的通信交流较多,通过客户交往圈信息可以作为流动人
21、口的辅助判定依据。对流动客户进行局部交往圈的群体划分,然后分析群体的共性特征,量化客户在群体内的影响因子,推断群体各成员的业务偏好、渠道偏好、影响能力,为营销活动提供有力的支撑。其三,数据挖掘技术和客户特征知识标签库。经营分析系统建立外来务工人员、高校学生和流动高端人士等三类客户数据挖掘模型,将逻辑回归应用到了流动人口识别中,并为客户打上知识标签。u 主要管理创新点其一,建立流动人口监控预警机制和智能精准营销流程:系统建立监控预警机制,监控全省外来人口的返乡与回流趋势,并能根据特定群体流动趋势的情况,实现智能化的服务营销推送功能。其二,实现流动客户的流失倾向评估与保有营销模式:通过流动客户的流
22、失倾向评估模型,自动判断高流失倾向模型,并根据预先制定的客户保有营销措施,实现智能化的营销激活功能。其三,建立流动人口GIS营销管理模式:基于GIS地理信息系统,监控各个外来工微区域,制定本地个性化的外来工服务策略与精准营销活动。四、社会和经济效益流动人口识别监控与精准营销系统应用以来,取得了显著的社会和经济效益,营销活动效果突出,优服务、精管理、促发展,确保企业价值化运营得以体现。还为客户提供招聘信息,充分体现广东移动一贯的“懂得感恩 回报社会”的企业理念。一是提升区域存量市场,针对外来工开展了多个长途话务业务,如“我爱我家”免费打长途优惠活动,受到广大外来工的欢迎。经营分析系统解决方案辅助
23、流动人口市场营销,通过精确营销准确定位“两城一家”目标客户,协助稳定存量市场,带来新增效益 1362 万元。 截止至2011年3月底,全网“两城一家”与“非常假期”营销活动发展的用户总数达到375.2万。 二是充分扩大营销人群,抢占区域蓝海市场。通过学生和外来工客户识别模型不仅有助于了解学生客户、外来工客户和本地客户的消费特征,制定差异化的营销服务策略;更有助于将相关方应用于其它细分市场,推进公司精细化营销跨越式。 三是节能降本,挖掘企业资源增效最大化。通过对学生和外来工市场的区域化支撑,可以节约大量的人力和物力,特别是在客户信息调查和收集上,预计每年可以节约人力15人/年,以一个员工一年人力
24、成本为8万元计算,大约可以节省人力费用120万元 。将合理的资源投放到合适的客户群体,不仅让客户得到针对性的服务,同时有助于公司节约大量的人力和物力,使公司资源增效最大化,节能降本,实践科学发展。 四是全方位客户关怀,打造客户归属感。通过价值评估体系和客户细分进行客户差异化服务,从多方面多层次对客户进行关怀,打造客户归属感,并且发布外来工招聘信息,我们不仅关注自己的业务,也关注社会焦点问题,充分体现广东移动一贯的“懂得感恩 回报社会”的企业理念。五是强化移动社会责任感,提升企业影响力。通过外来工客户识别模型识别更多的外来工客户,通过保单提醒促进更多的外来工参与外来工保单活动,充分体现移动社会责任感。通过学生客户识别模型识别学生客户针对性开展G3体验,提升G3影响力。