《流动人口识别监控与精准营销系统.ppt》由会员分享,可在线阅读,更多相关《流动人口识别监控与精准营销系统.ppt(52页珍藏版)》请在三一办公上搜索。
1、中国移动科技创新成果推广材料,完成单位:广东公司业务支持中心经营分析室,成果名称:流动人口识别监控与精准营销系统,01,成果研究类别:现有业务优化,省内评审结果:,成果专业类别:业务支撑,目录,项目背景实施方案应用案例项目的主要创新点社会和经济效益,项目背景市场竞争日益激烈,市场趋于饱和,针对市场细分的精细化营销显得日趋重要,通信行业全业务竞争的加剧、市场趋于饱和、产品和业务发展的“长尾化”等等因素要求我们必须利用客户的各种信息,进行市场细分,开展精细营销,实现低成本高效率的运营。,项目背景流动人口庞大,外部环境带来机遇,内部问题制约发展,项目背景外来工是广东移动重点关注的细分市场,在精准营销
2、方面亟待深入研究,广东现有的外来工占到常驻人口的比重较大,是非常重要的细分市场,由于系统数据不全不精,难以准确识别该群体,因此以往针对这个群体的市场营销不够精准。,由于识别准确率低,存在以下问题:营销效果受到一定的影响 该细分市场的客户需求和消费习惯尚未较为全面的掌握 市场潜力有待进一步挖掘,解决思路提升外来工识别的准确性,深入分析客户需求,从而实现外来工市场的精耕细作,基础模型,应用模型,分析,应用,外来工客户识别模型,高影响力人物识别,外来工市场细分,产品交叉销售,提供群体内通话优惠长途通话套餐12582务工易,种子营销、病毒营销红缎子短信营销,外来工关键人营销,针对外来工市场特点,设计个
3、性化产品和营销方案进行外来工关怀活动,外来工产品营销,提供个性化服务,将外来工市场根据不同特征(如区域特征)分割成不同群体,进行针对性营销。,分析外来工对新增值业务产品的倾向程度。,根据其交往圈大小、短彩性发送等特性,分析影响力,判断其在外来工群体中的重要性。,基于基站、消费特征、交往圈等行为轨迹建立客户识别模型 外呼模型修正 特定资费等针对模型预测的结果进行修正与补充。全网各运算结果的整合,家庭,商务,初中(54%),小学(21%),单身,(半)文盲(3%),客户特征(客户识别),20-29岁(70%),客户需求(需求细分),20岁以下(10%),30岁以上(20%),高中及以上(22%),
4、解决思路客户类型多样,需求差异大,需要开展客户行为研究,提升市场工作的针对性(以外来工客户为例),目录,项目背景实施方案应用案例项目的主要创新点社会和经济效益,总体分析思路(以外来工客户为例),以下以外来工客户为例,介绍特定流动人口精确识别的模型构建。,口径,目标变量,是否流动人口:指的是来自外省的蓝领阶层的工人主要从事体力劳动的人群,收入相对较低;外地学生。,以用户最近四个月的行为预测下个月是否为流动人口,分析用户群,时间窗口定义,神州行、动感地带用户。其中包括两城一家、定向长途以及移动提供的曾呼叫12582客户;,M=2011年4月,具体做法目标客户定位精准化,Text,Text,Text
5、,根据数据挖掘模型生成外来人口客户三类知识标签流动高端人士标签、外来务工人员标签和高校学生标签,客户知识标签汇入客户特征知识库。,外来务工人员(高校学生)长途通话集中度60%工业区(校园)通话时长占比 32%春节期间定向漫游、长途通信入网时长 33%数据业务数量4,经常漫游通话长途通话占比较大白天工业区通话学校附近通话集中寒假暑假定向漫游某省经常使用飞信,1、收集客户行为特征,2、构建客户识别模型,3、建立客户特征知识库,对客户需求进行研究和细分内容偏好业务使用偏好增值业务影响力,构建客户需求模型,学生群体及外来工群体识别,(1)基于基站和交往圈等行为轨迹建立客户识别模型(2)外呼模型修正(3
6、)特定资费等针对模型预测的结果进行修正与补充,识别客户,1,(1)日常外呼及营销活动进行客户社会属性完善(2)基于关联分析算法的编码技术完善客户社会属性,社会属性完善,2,3,客户需求细分,学生及外来工社会属性收集,助力关爱外来工服务营销活动的开展与跟踪日常外来工群体稳定性及规模发展(占有率)跟踪分析,外来工客户服务营销应用,4,助力高校营销活动的开展与跟踪日常学生规模发展的跟踪分析增值业务影响力应用到高校增值业务发展个人与群体的相互影响短信、彩信的病毒营销体验营销刺激、激励营销,学生客户服务营销应用,4,应用思路,基于基站和交往圈等行为轨迹建立学生、外来工客户甄别模型,学生标识,群体识别模型
7、变量因素探索,模型初步建立,交往圈数据修正模型,通过用户业务使用情况修正模型,模型修正结果,最终模型修正结果,外呼结果用于修正模型,步骤一,步骤二,步骤三,外来工标识,根据特定群体活动特征初步寻找目标用户结合以往活动市场营销活动,获取目标用户清单,通过目标用户的分析构建特定群体的初步模型对于模型结果进行外呼调研利用外呼的结果同时结合特定用户群体交往圈的分析方法进行模型的修正,结合群体的用户特征,对模型进行再次修正,最终得到模型结果,行为轨迹,交往圈规则,决策树、逻辑回归,先应用建模方法对学生和外来工客户进行识别建模,模型结果标识,模型初步构建与修正,群体标识与指标探索,外来群体的识别模型的变量
8、设计,外来群体识别特征变量考虑,项目模型流动人口样本选取,无法取到二月老乡网指定的定向地漫游,故只能判断2月有无漫游通话;由于5月五一长假,漫游人较多,不具有代表性,故此处剔除,且8、9、10月份作为建模月份,故也不加入。,经探索,经条件二 筛选后的客户80%以上ARPU小于100,为避免ARPU100成为流动人口的硬性条件,此处选用200切除部分极值点便可,项目模型非流动人口样本选取,17,样本选取效果评估,根据8、9、10月份客户定向长途话务的定向地,统计客户三个月中定向地相同的月份数:,指长途话务通话次数占比最大的地方,从表中可以看出,流动人口长途话务的定向地比较集中,70%以上的用户三
9、个月向同一个地方定向长途通话;非流动人口长途话务较为零散,三个月不同长途话务定向地的客户占接近45%;样本效果较好。,数据探索方法与过程,比较各种变量在外省求职者的均值与其它用户的差异。初步了解外来求职者的特征。,用图线全面展示变量在不同取值下,用户群中外省求职者的比例,发现变量值与外省求职者的更深层的相关联性。,1.均值比较,2.图形分析,均值比较,在网时长:新入网13个月用户是外省求职者的可能性较高。1年以上的老客户是外省求职者的可能性较小。,品牌:动感地带中外来求职者的占比是各品牌中最高的。大众卡则非常低。,外省求职者占比,客户属性,在网时长(天),客户地区,珠三角地区的用户中外省求职者
10、的比例较大。一类城市中,深圳、东莞的外省求职者占比高,而广州、佛山较低。,客户价值 ARPU,ARPU在23到54之间的用户是外省求职者的机会就较大了。而ARPU高于120的用户是外省求职者的可能较小。,MOU在360分钟以内的用户是外省求职者的可能性较高。MOU很高的用户是外省求职者的可能性较低。,ARPU,MOU,但从ARPU和MOU区分外省求职者的能力很弱,通话行为 长途,省内长途多的用户是外省求职者的可能性较低。,主叫省内长途MOU,主叫省际长途MOU,省际长途多的用户外省求职者的可能性都较高。,通话行为漫游,漫游较多的用户是外省求职者的可能性较低。,省内漫游MOU,省际漫游MOU,本
11、地交往圈号码少,省内交往圈号码数少、省际交往圈号码数多的用户,是外省求职者的可能性较高。,省内交往圈号码数,国内交往圈号码数,本地交往圈号码数,通话行为 交往圈,通话行为 定向通话,定向通话次数多、定向交往圈大、定向短信条数多的用户是外省求职者的可能性高。而且这类变量的区分能力相对其它变量更显著。,定向通话次数,说明:“定向长途地”是指一个用户打电话最多的一个城市(排除发达地区)“定向通话次数”是与指定向长途地的号码通话的次数。如类推理。,定向交往圈大小,定向短信条数,通话行为 SMS,发送外省的SMS条数在14条以上的的用户是外省求职者的可能性较高。条数多于32条的,则这个可能性很高。短信变
12、量比长途变量的区分力更强因为长途费率较高,用户与省外联系时用户打移动长途的需求受抑制,数据不能很好反映用户实际与外省联系程度。短信费率固定,发短信更随意。因此外省的短信发送条数更能反映用户与省外通话的需求。,往外省SMS条数,主叫省际长途MOU,VS.,通话行为 首10次通话,首10次通话中外省通话次数多的用户,是外省求职者的可能性很高。,可能原因:用户在开号后,都会先和家人联系,告知新号码。因此外来工的首10次通话中会有与老家的通话。,这个变量的区分力非常显著。,注:首10次通话中有外省通话的样本数占14.4%,相关业务,“我爱我家”业务用户是外 省求职者的可能性较大。但“我爱我家”的现在用
13、户数很少,样本中只占0.2%,集团客户成员是外省求职者的可能性较小。,数据探索总结,调研样本中外省求职者的统计特征较明显。,通过用户的ARPU、长途通话、定向长途、首10次通话等变量可以识别出可能是外来求职的用户。,从相关业务也可以识别外省求职者,但是这些业务现有用户数量很少,不能满足本模型的需求。,从数据探索的图线中总结出特征变量的参考取值范围。,样本特征,通信特征,数据业务特征,数据探索特征,模型构建,建模方法选择:根据数据探索结果显示,变量与外省求职者的概率大体是单调关系。因此用Logistics回归这类线性方法也能胜任。Logistics回归简介:,Logistic回归模型是一种概率分
14、类模型,它以用户是外省求职者的概率为因变量,客户属性、通信行为等因素为自变量建立回归模型。以p 表示用户是外省求职工的概率,函数p 对Xi 的变化在p=0 或p=1 的附近是不敏感的、缓慢的,且非线性的程度较高。按照Logistic 变换(或称为p 的Logit 变换),即(p)对Xi 就可以是线性的关系了,即可以表示为:,模型构建,流动人口识别是判别是否流动人口的分类问题,用决策树和逻辑回归均能较好解决问题。选用TERADATA专用挖掘工具TWM中的逻辑回归和决策树算法进行建模。,样本切分:按外省求职者标志随机分层抽样:80%作为训练集,20%作为测试集。模型训练:用训练集以分步Logist
15、ics回归训练,自动选择最有用的变 量,拟合出变量的参数。模型评估和优化:用测试集评估模型的准确率,不断优化模型。模型构建后得到外省求职者概率的计算公式,用于识别外省求职者。,建模结果(逻辑回归),Wald Statistic反映变量区分外省求职者的能力,越大则区分力越显著。,外省求职者识别变量及参数:,标准化参数反映变量在以标准差为单位变化时,外省求职者概率变化的程度。绝对值越大则表示影响越大。,模型评分公式(逻辑回归),根据建模结果,用户是外省求职者的概率p的公式为:,其中 X-4.538305+0.164047*首十次通话省外次数+0.08442*定向交往圈人数-0.000869*在网时
16、长(天)+0.005299*上行省外短信次数-0.029367*主叫交往圈号码数+0.625817*珠三角用户+3.605697*省际主叫次数占比+0.006456*非漫游费用-0.004215*定向短信量-0.005115*ARPU+0.747288*国内漫游MOU占比+3.00E-05*定向漫游时长-1.436906*省际主叫占比-0.359402*省际定向mou占比+0.001993*上行省内短信次数,模型验证结果(逻辑回归),在测试集上评估模型准确率:,分数在前5%的用户,命中了全部外省求职者的28.5%,LIFT值为5.2;分数在前10%的用户,命中了全部外省求职者的42.7%,LI
17、FT值为4.2。,LIFT,查全率,外来工群体建模并设计系统开发,经分应用专题,现状,模型构建,系统中针对特定用户群体的分析处于相对粗放的分析方法,针对外来工群体进行模型设计,构建特定用户群体的识别模型、客户影响力模型,用户特定的市场营销与分析需要,变量探索,模型建立,交往圈数据修正模型,通过用户业务使用情况修正模型,外呼调研修正,最终模型修正结果,目录,项目背景实施方案应用案例项目的主要创新点社会和经济效益,应用一:外来工群体关怀,此项成果可支撑两方面的应用:一方面为外来工的通信行为、业务或服务需求及满足度等方面提供宝贵的分析数据,为制定针对性的营销服务策略提供有得的参考依据。另一方面为今后
18、外来工客户关怀活动提供系统营销方案配置及目标客户清单和方案开展后的跟踪统计。,应用流程图,通过模型识别可以给出一个客户标识,判断该客户属于外来工,从而为后续的经营分析,针对不同客户群体进行精确化营销奠定基础。,应用二:及时跟踪外来工客户规模异动情况,区域,时间,总客户,外来工规模,该项目完成后,可以从区域(县市、各个工业园区)、时间和总客户(考核外来工在总人口和总客户中占比等等)三个维度进行实时跟踪和考察,便于及时把控各个区域外来工规模的变动。,应用三:开展外来工客户招聘信息主动关怀,通过该项目建立的外来工识别模型,提取其中有短信收发且片区位置有企业发布招聘信息的外来工,发送短信推荐移动开发的
19、“外来工短信招聘求职平台”,搭建便捷的信息化招聘通道。,求职者或招聘单位,只需编辑求职或招聘所要求的岗位情况,发送短信至特定端口,系统根据请求将自行发送最新匹配的岗位信息,今后打算将此平台改造12582统一平台。,应用四:基于影响力模型针对产品生命周期不同阶段开展营销,成长期,成熟期,衰退期,病毒营销激励营销,投入期,激励营销,根据影响力模型确定高影响力用户,针对产品不同生命周期阶段采取不同的营销策略。,体验营销,病毒营销,影响力模型应用在产品生命周期的不同阶段,应用五:开展外来工客户精确营销活动,外来工客户精确营销活动,针对某一种产品,利用关联分析,找出曾经购买该产品的外来工客户更容易购买其
20、他相关产品的规则,基于这些规则挖掘不同产品之间的潜在关系,并组成外来工产品关联规则矩阵,进行产品组合分析,向客户提供捆绑组合产品,实现交叉销售,在为客户提供更多产品和服务的同时实现企业收益的增长,根据外来工客户在亲情沟通、信息服务及生活娱乐等方面的需求,进行客户细分,开展外来工客户精确营销活动,提升外来工客户价值。,案例:流动人口识别助力外来流动人口细分市场营销,以中山分公司为例,使用流动人口识别模型,发掘定位为工业园区的外来工群体,联合相关政府部门,大力推广“12580找工我帮你”活动,效果显著。,根据流动人口识别模型,精准定位客户群体。,主动关怀 根据目标名单对外来工群体发送“关怀”宣传短
21、信,让客户及时了解就业信息。,匹配推荐 利用12580强大招聘信息库进行匹配,将合适的就业信息推荐给客户。,实现双赢70%客户在找工后通话量明显增加,10%20客户靠12580成功求职,根据客户通话发生地信息,经常到访的营业厅位置等信息,实现区域客户群体的进一步确定,结合起来监控各个外来工微区域,制定本地个性化的外来工服务策略,目录,项目背景实施方案应用案例项目的主要创新点社会和经济效益,主要系统创新点,通过客户通信基站信息可以获取客户的位置信息,而位置信息背后蕴藏丰富的客户特征数据。,流动人口因地缘等关系自然而然成组成群,外来务工人员、高校学生圈子内部的通信交流较多,通过客户交往圈信息可以作
22、为流动人口的辅助判定依据。,经营分析系统建立外来务工人员、高校学生和流动高端人士等三类客户数据挖掘模型,并为客户打上知识标签.,技术创新,技术要点1:客户位置信息,技术要点2:客户交往圈信息,技术要点3:数据挖掘技术和客户特征知识标签库,主要管理创新点,系统建立监控预警机制,监控全省外来人口的返乡与回流趋势,并能根据特定群体流动趋势的情况,实现智能化的服务营销推送功能。,通过流动客户的流失倾向评估模型,自动判断高流失倾向模型,并根据预先制定的客户保有营销措施,实现智能化的营销激活功能。,基于GIS地理信息系统,监控各个外来工微区域,制定本地个性化的外来工服务策略与精准营销活动。,建立流动人口监
23、控预警机制和智能精准营销流程,实现流动客户的流失倾向评估与保有营销模式,建立流动人口GIS营销管理模式,目录,项目背景实施方案应用案例项目的主要创新点社会和经济效益,经济效益(1/2),算法说明:截至2011年3月底,全网“两城一家”与“非常假期”营销活动发展的用户总数为375.2万。按精确营销发展客户数占比10%估算,“两城一家”与“非常假期”精确营销目标客户中成功办理套餐且享受优惠用户数为37.5万人。精确营销平均Lift值约为3,套餐作用期按2个月计算,每用户每月话费收入平均增加6元左右。估算精确营销带来的新增收入为:新增套餐收入=37.5*(3-1)*3*2=450(万元)新增话费收入
24、=38*(3-1)*6*2=912(万元)合计增加收入:858+1958=1362(万元),经营分析系统解决方案辅助流动人口市场营销,通过精确营销准确定位“两城一家”目标客户,协助稳定存量市场,带来新增效益 1362 万元。,经济效益(2/2),抢占区域蓝海市场,提升区域存量市场,节约人力物力,通过学生和外来工客户识别模型不仅有助于了解学生客户、外来工客户和本地客户的消费特征,制定差异化的营销服务策略;更有助于将相关方应用于其它细分市场,推进公司精细化营销跨越式。,经营分析系统解决方案辅助流动人口市场营销,通过精确营销准确定位“两城一家”目标客户,协助稳定存量市场,带来新增效益 1362 万元
25、。,通过对学生和外来工市场的区域化支撑,可以节约大量的人力和物力,特别是在客户信息调查和收集上,预计每年可以节约人力15人/年,以一个员工一年人力成本为8万元计算,大约可以节省人力费用120万元。,全方位客户关怀 打造客户归属感,节能降本 挖掘企业资源增效最大化,通过外来工客户识别模型识别更多的外来工客户,通过保单提醒促进更多的外来工参与外来工保单活动,充分体现移动社会责任感。通过学生客户识别模型识别学生客户针对性开展G3体验,提升G3影响力,社会效益,通过价值评估体系和客户细分成果进行客户差异化服务,从多方面多层次对客户进行关怀,打造客户归属感。发布外来工招聘信息,我们不仅关注自己的业务,也关注社会焦点问题,提升企业公民的形象。,将合理的资源投放到合适的客户群体,不仅让客户得到针对性的服务,同时有助于公司节约大量的人力和物力,使公司资源增效最大化,节能降本,实践科学发展。,强化移动社会责任感,提升企业影响力,应用展望,进一步收集全省各种流动人口客户资料用于模型训练,并采用逻辑回归进一步优化模型,进一步梳理营销应用流程,确保两大市场精细化营销管理工作常态化开展,进一步健全存量市场客户价值提升评估体系,对存量市场开发工作成效进行常态化跟踪,深化应用,感谢聆听!,