《中国移动海南公司校园市场识别模型技术方案.doc》由会员分享,可在线阅读,更多相关《中国移动海南公司校园市场识别模型技术方案.doc(25页珍藏版)》请在三一办公上搜索。
1、中国移动海南公司校园市场识别模型技术方案版本号:1.0.0目录1引言31.1编写目的31.2实施内容31.3术语和定义31.4参考资料32技术实现42.1校园市场基础信息维护42.1.1学校信息维护42.1.2学校基站信息维护52.1.3学校渠道信息维护82.2校园市场识别模型92.2.1概述92.2.2名词解释122.2.3数据来源122.2.4校园区域客户识别模型132.2.5学生客户识别模型152.2.6学生客户到达数算法182.2.7新增学生客户识别模型182.2.8新生客户识别模型202.2.9毕业生客户识别模型223附录A:交往圈识别模型241 引言本方案旨在描述如何在现有经营分析
2、系统中建立校园客户识别模型,通过对校园区域内学生客户的识别,为校园市场营销提供精确的客户归属信息,实现对校园市场生产运营指标的分析评估;通过建立校园客户监控应用,对校园内外异常市场信息进行监控和处理;支撑公司营销服务人员对校园市场各类营销活动的闭环管理,全面提升公司整体应对校园市场变化的响应速度及把控能力,确保校园区域市场的竞争优势,提升公司核心竞争力。1.1 编写目的校园市场已是我公司的重点战略市场,为巩固校园市场优势地位,我公司在总部下发的规范指导下完成校园市场应用建设。1.2 实施内容本次技术实现的实施内容包括:校园基础信息维护,校园区域客户识别模型,学生客户识别模型,学生客户到达数算法
3、,新增学生客户识别模型,新生客户识别模型1.3 术语和定义序号名词解释1校园区域客户指可归属到某校园区域内的客户群体2学生客户指校园区域内的学生客户群体3新增学生客户指学生客户中新入网或第一次归属为学生客户的客户4新生客户指学生客户中属于新生的客户群体5毕业生客户指已离开校园但并未离开移动网的客户1.4 参考资料2010年经分系统校园市场应用业务技术方案中国移动海南公司专题应用需求书2 技术实现2.1 校园市场基础信息维护校园市场基础信息维护包含学校信息维护、校园基站信息维护以及校园渠道信息维护等。优化校园各类基础信息的维护流程,确保校园基础信息的及时准确,对于学生客户识别具有重要的意义。目前
4、校园市场基础信息维护操作均通过经营分析系统来实现。2.1.1 学校信息维护2.1.1.1 功能描述本章节所提及的学校主要是指大专及以上学校(包括普通高等教育院校、高等职业技术院校等)、中等专业技术学校、职业高中及附属中学等。本章节主要描述了学校基本信息的相关功能要求和技术实现。2.1.1.2 功能要求l 经分系统支持学校基本信息的增加、删除、修改、查询等功能;l 经分系统支持学校信息各类变更的审核和稽查功能。2.1.1.3 功能要素学校基本信息表属性名称属性描述备注学校标识省代码+地市代码+8位序号 系统自动扩展学校名称 填写全称,有多个校区时在括号内进行说明,例如:一个学校有南北两个校区,则
5、录入XXXX大学(南校区)、XXXX大学(北校区)手动填写归属地市下拉选择学校性质 本科、大专、中等职业学院、其它下拉选择2.1.1.4 实现流程1) 由经营分析系统在前台界面开发相关学校信息录入界面,录入字段请上表要求的功能属性,支持一线渠道人员进行所收集信息的录入;2) 对于不符合业务规则的填报,经营分析系统可以自动跳出错误提示;3) 录入信息通过经分界面进行展示,由上级渠道管理人员对录入信息进行审核修改;4) 对于审核通过的信息,正式更新经营分析系统数据;5) 支持对历史信息的变更删减,以及对历史操作的信息稽查。实现流程图如图所示:学校信息维护流程图2.1.2 学校基站信息维护2.1.2
6、.1 功能描述本章主要描述了学校和基站小区信息维护的相关功能要求和技术实现。校园区域主要包含各学校教学区、学生宿舍区、学校家属区等学生主要活动区域,由一个或多个的基站小区覆盖范围组成,信号覆盖或基本覆盖校园区域的基站小区与校园形成对应关系。学校基站的认定应由各地市场部门和网络部门共同进行,经确认的学校基站即纳入校园区域市场统计范围。各地发生学校基站变更的情况,应有严格的参数修订流程,以确保校园区域市场统计的准确性。新入网基站可根据基站经纬度、覆盖范围等属性确认是否学校基站;经确认后的学校基站,原则上不得进行学校属性变更,对已有学校基站变更的,需由网络部门出具相关文件方可实施。2.1.2.2 功
7、能要求l 支持在经分系统对校园基站小区关系的新增、删除、修改和查询功能;l 支持学校基站信息各类变更的审核和稽查功能。2.1.2.3 功能要素基站信息要素主要包含基站名称、小区代码、归属地区、学校名称、学校规模、学校类型、经度、纬度、基站学校覆盖率等要素,基站信号必须仅覆盖或基本覆盖校园区域,校园区域基站信息应以区域化基站参数信息为基础,保持校园区域基站基本属性与区域化基站参数一致,如表所示:基站信息表属性名称属性描述备注基站中文名称基站中文名称必选基站英文名称网管数据多为英文或拼音必选LAC代码LAC代码必选基站代码CELL代码必选学校标识(如果小区类型是校园,则填写学校名称)基站小区必须对
8、应唯一的一所学校必选校区类型教学区、宿舍区、家属区可选小区经度可选小区纬度可选小区天线高度可选小区天线方向角(水平)可选小区天线倾角(垂直)可选小区建站时间可选小区网络类型2G、3G站可选小区归属基站类型宏蜂窝、室内覆盖、直放站可选归属分公司地市级必选归属县公司县区级必选小区边界类型是边界小区(省内边界、省际边界,双重边界)可选小区类型商业务、住宅区、写字楼、学校、矿区、农村、县城等。可选2.1.2.4 实现流程分公司需要定期对基站小区与学校的对应关系进行维护,以保证校园区域的准确性。基站小区数据维护流程示例如下图:基站小区数据维护流程示例图流程说明:1) 省网络部定期将更新的基站数据提供给地
9、市公司;2) 地市公司进行基站信息与学校信息的匹配,并且对数据进行稽核,同时将结果反馈给市场经营部,市场经营部发现问题后及时与网络部协商; 3) 市场部审核无误后将学校基站数据传给经分系统;4) 经分系统根据一定的业务规则对数据进行校验,无误后入库。2.1.3 学校渠道信息维护2.1.3.1 功能描述本章描述学校渠道信息维护的相关功能要求和技术实现,重点介绍如何建立渠道(包含竞争对手渠道)与学校的映射关系,从而更好地对学生客户进行营销服务。2.1.3.2 功能要求l 支持学校渠道与学校标识映射关系的新增、修改、删除和查询等功能;l 学校渠道与学校标识的匹配需要符合一定的对应关系,对于不符合业务
10、规则的错误填报,系统可以跳出错误提示;l 支持对各类操作的审核、稽查功能。2.1.3.3 功能要素学校渠道(包含我公司与竞争对手渠道)需要与学校建立映射,具体属性要素如下表:学校渠道信息表属性名称属性描述备注市县标识学校所归属地市学校归属地市学校标识学校唯一标识关联校园基础表标识营业厅标识包含我公司营业厅和竞争对手唯一标识营业厅类型标识包含移动、电信、联通三类下拉选择2.1.3.4 实现流程1) 由经营分析系统在前台界面开发相关学校信息录入界面,录入字段请上表要求的功能属性,支持一线渠道人员进行所收集信息的录入;2) 对于不符合业务规则的填报,经营分析系统可以自动跳出错误提示;3) 录入信息通
11、过经分界面进行展示,由上级渠道管理人员对录入信息进行审核修改;4) 对于审核通过的信息,正式更新经营分析系统数据;5) 支持对历史信息的变更删减,以及对历史操作的信息稽查。2.2 校园市场识别模型2.2.1 概述校园市场识别模型主要根据校园的地理位置和通信网络的物理覆盖区域之间的对应关系,结合客户通话行为话单,通过一定的规则算法,确定出客户归属校园区域的方法。校园市场识别模型主要以区分校园区域客户和校园区域竞争对手客户为主,并在校园区域客户识别基础上,实现识别校园学生、校园新增学生、校园新生学生和毕业生识别算法。本方案中主要包括校园区域客户、校园区域学生客户、校园区域新增学生客户和校园区域新生
12、客户、毕业生客户五个部分识别模型算法。校园市场相关识别模型之间关系流程图:校园市场识别模型关系流程图以上校园区域各类别客户识别模型遵循月度全量计算和季节性拍照跟踪识别原则,能够满足不同时间段内到达数、新增、在校和未在校等情况分析,以便及时进行精确化营销。以各个时间段为例,说明校园区域客户各类别客户识别模型处理流程如下图所示。校园区域客户按照时间周期处理流程图本次方案根据校园区域客户数据处理方法分为不同的时间段,针对校园假期关键时间点,通过每年进行2次拍照基础客户处理,结合每月全量识别算法,形成不同时间段内关键处理内容。现将关键时间段处理内容描述如下:序号计算自然时间点数据更新频率主要内容步骤方
13、法17月月对4-6月累计校园区域客户进行拍照对4-6月份累计三个月的客户话单,按照校园区域客户归属识别方法分别确定本网客户和竞争对手客户校园归属识别。作为截止6月拍照校园客户。(即4-6月拍照客户)28月月计算7月全量校园区域归属客户,识别7月新增校园区域客户,并核减拍照客户离网客户分为两部分:步骤一:按照校园区域客户归属识别算法,计算7月全量校园区域客户数。并作为7月全量校园区域归属客户数。步骤二:将步骤一判断出的客户与之前拍照4-6月份的客户进行比较,如果在7月全量客户中存在,但在拍照客户中不存在的客户作为新增客户。步骤三:对4-6月份拍照的客户直接与客户资料表关联,剔除离网状态客户。将截
14、止6月拍照客户与新增客户一起作为截止7月拍照校园区域客户。38月15日-11月15日日月日累计分析新增、在校和未在校客户。月度计算全量客户。步骤一:将累计8月15日当月汇总校园区域客户情况与截止7月拍照校园区域客户进行比较,从8月15日开始直到11月15日进行日新增、在网和未在网识别。如果不在拍照客户中作为新增,如果存在并且有过1次校园通话作为在校。每日新增将不断更新截止当前拍照校园区域客户群,作为次日更新比较基准数据。步骤二:9月初,计算8月全量校园区域归属客户,并与截止7月拍照校园区域客户进行比较,并对本月新增客户与日累计新增进行修正。并同时修正在校、未在校客户标识。步骤三:将7月截止拍照
15、校园区域客户剔除客户截止8月离网状态,补充8月新增、更新未在校客户,形成截止8月拍照校园区域客户。4 1月月对10-12月累计校园区域客户进行拍照对10-12月份累计三个月的客户话单,按照校园区域客户归属识别方法分别确定本网客户和竞争对手客户校园区域归属识别。作为截止12月拍照校园区域客户。51-4月日月日累计分析新增、在校和未在网客户。月度计算全量客户。步骤一:将1月1日-4月30日期间累计日汇总校园区域客户与截止12月拍照校园区域客户进行比较,进行日报中新增、在校和未在校识别。如果不在拍照客户中作为新增,如果存在并且有过1次校园通话作为在校。每日新增将不断更新截止当前拍照校园区域客户群,作
16、为次日更新比较基准数据。步骤二:2月初,计算1月全量校园区域归属客户,并与截止12月拍照校园区域客户进行比较,对本月新增客户与日累计新增进行修正。并同时修正在校、未在校客户标识。步骤三:将12月截止拍照校园区域客户剔除客户截止1月离网状态,补充1月新增、更新未在校客户,形成截止1月拍照校园区域客户。以此类推满足每月底拍照校园区域客户更新标准。直到4月。特别说明:校园入学期间日累计跟踪必须按照8月15日-11月15日之间进行跟踪分析,寒假开学跟踪从1月开始,上半年开学按照1月1日-4月30日之间进行跟踪分析。校园客户识别是每月均需要分析全量校园客户,在指定时间段上增加拍照客户日、月跟踪情况。以校
17、园区域客户为基础,结合客户有效交往圈和校园区域竞争对手识别算法,形成校园区域竞争对手客户按照时间周期处理流程:校园区域竞争对手客户按照时间周期处理流程2.2.2 名词解释校园区域划定原则是一个校园区域只包含一所学校。校园区域本网客户:指表示所在校园区域内的本网客户群体。校园区域竞争对手客户:指表示在校园区域内竞争对手的客户群体。学生客户:指校园区域内属于学生客户群体。包括本网学生客户和竞争对手学生客户。新增学生客户:指识别的学生客户中未出现在上一拍照周期内的客户。主要包括本网新增学生客户和竞争对手新增学生客户。新生客户:指学生客户中属于新生的客户群体。主要包括本网学生新生客户和竞争对手学生新生
18、客户。在校学生客户:根据校园区域本网客户在规定秋季入学和寒假在校后指定日期范围内,进行过至少1次以上的校园通话客户作为在校学生客户。不在校学生客户:根据校园区域本网客户在规定的秋季入学和寒假在校后日期范围内,未进行任何通话的校园通话客户作为未在校学生客户。秋季开学阶段:指8月15日到11月15日时间段。春季开学阶段:指1月1日到4月1日时间段。2.2.3 数据来源目前我省分析校园客户通话行为数据来源于“本网客户本地语音业务清单”,校园区域归属信息来源于“校园区域基站参数对照表”,主要包含校园区域代码,校园区域名称,归属地市、县、包含基站、小区代码等。2.2.4 校园区域客户识别模型2.2.4.
19、1 校园区域本网客户识别模型校园区域本网客户作为识别客户属于校园区域身份特征的基础,主要是将本省本网在网且办理动感地带校园音乐套餐的客户作为分析整体客户群,通过当月本地语音业务清单,结合校园区域基站参数对照表,汇总形成客户在各个校园区域的累计通话次数、通话时长和客户当月内总体区域中的累计通话次数、通话时长。得出客户校园区域累计通话次数与总体通话次数占比,如果占比大于等于预设阀值,则判断为校园区域本网客户。如果小于预设阀值,则不作为校园区域本网客户。对确定为校园区域的客户进一步分析具体归属校园区域情况,遵循取通话次数最多为原则,如果通话次数相同则取通话时长最多,通话时长相同则取校园编码最大的校园
20、作为归属校园。阀值:30%统计周期:日(春、秋季开学阶段)、月。校园区域本网客户归属识别算法流程如下:校园区域本网客户归属识别算法流程2.2.4.2 校园区域竞争对手客户识别模型校园区域竞争对手客户是根据本网客户与竞争对手客户本地语音业务互打交往圈话单信息,汇总形成交往圈中各个校园区域累计通话次数以及通话时长和竞争对手总体互打通话次数和通话时长,如果竞争对手与校园区域本网客户的通话次数与所有互打通话次数比例超过预设阀值,则确定此竞争对手为校园区域竞争对手客户。如果小于预设阀值,则不作为校园区域竞争对手客户。对确定为校园区域竞争对手的客户进一步分析具体归属校园区域情况,遵循取互打通话次数最多为原
21、则,如果通话次数相同则取通话时长最多,通话时长相同则取校园编码最大的校园作为归属校园。阀值:30%统计周期:日(春、秋季开学阶段)、月校园区域竞争对手客户归属识别算法流程2.2.5 学生客户识别模型2.2.5.1 模型说明在“校园区域本网客户”和“校园区域竞争对手”识别模型基础上进一步通过分析条件识别出本网学生客户和竞争对手学生客户。并通过在网学生客户识别模型识别出在网学生客户和未在校学生客户。2.2.5.2 本网学生客户识别模型步骤一:筛选学生客户.。在已识别的“校园区域本网客户”的基础上,根据学生客户特征进一步进行筛选,从已识别的校园客户中进行剔除,从而识别出学生客户。筛选要素参考如下:
22、筛选要素筛选条件网龄网龄大于8年 通话行为没有被叫行为的客户新业务量点对点短信通信量小于30条年龄年龄小于15岁或大于30岁的客户ARPUARPU均值(近三个月平均)= 200元通话位置轨迹统计月基站区域跨度较大(以下条件为“或”的关系)1、前五个通话基站通话次数比例=3交往圈根据学生聚集性的特征,交往圈内应同样有较多的学生。交往圈的校园区域本网客户数小于一定比例(中专生为3,大学生为5)步骤二:补充学生客户。为进一步精确捕捉学生客户,在校园附近动感营业厅入网的客户。如果该渠道所属校园与校园区域客户识别模型的客户归属校园一致,则使其归属至该校园。学生客户识别模型2.2.5.3 竞争对手学生客户
23、识别模型在竞争对手校园区域客户识别模型的基础上进一步识别出竞争对手学生客户模型,按照“竞争对手学生客户与我网学生客户交往较多”的原则,识别为竞争对手学生客户。具体步骤如下: 步骤一:获取竞争对手校园区域客户与本网校园区域客户通话的情况汇总 从本地非漫游语音清单中将竞争对手校园区域客户与本网校园区域客户号码的通话次数以及通话时长汇总,并排序。步骤二:通过竞争对手校园区域客户与我网学生客户客户通话超过一定比例判定竞争对手校园区域客户为学生客户。通过汇总计算竞争对手校园区域客户与本网学生客户通话次数占该竞争对手校园客户与本网校园客户通话次数的占比,当占比大于等于50% 时,则判定该竞争对手校园区域客
24、户为竞争对手学生客户。竞争对手学生客户识别模型2.2.5.4 在校与未在校学生客户识别模型在每年寒暑假之前,拍照一段周期内(暑假以4-6月拍照,寒假以10-12月拍照)的学生客户作为在校学生的基准客户。通过判断这部分客户开学期间是否在校园基站下发生通话行为确定为在校学生。该模型适用于本网和竞争对手校园客户。具体更新周期如下:以4、5、6月拍照的全量学生客户为基准客户,若该部分用户秋季入学阶段在校园基站下发生过1次通话行为,即将其标识为在校客户,否则识别为毕业未在校客户。 以10、11、12月拍照的全量学生客户为基准客户,若该部分用户春季入学阶段在校园基站下发生过1次通话行为,即将其标识为在校客
25、户,否则识别为毕业未在校客户,并进行标识。竞争对手采用是否与本网在校学生通话来识别在校还是毕业未在校,基准客户、跟踪时间与移动客户一致。2.2.6 学生客户到达数算法根据校园区域学生客户识别模型,通过一定时间范围内的判断规则,形成本网学生客户到达数和竞争对手客户到达数统计算法。2.2.6.1 本网学生客户到达数算法本网学生客户到达数统计算法:在拍照学生客户群基础之上,以后逐月将当月学生新增客户进行累加并剔除离网客户数。2.2.6.2 竞争对手学生客户到达数算法竞争对手学生客户到达数统计算法:在拍照竞争对手学生客户群基础之上,以后逐月将当月竞争对手学生新增客户进行累加并剔除连续3个月内未通话竞争
26、对手客户数。2.2.7 新增学生客户识别模型2.2.7.1 模型说明考虑学生客户的增长规律,校园新增学生客户的计算分为日新增、月累计新增、月新增、三种模型,其中,月新增要求每月计算;而日新增、月累计新增只在每学年春、秋开学期间。新增学生客户分为本网新增学生客户与竞争对手新增学生客户两类,针对二者分别进行计算。新增学生客户识别模型图2.2.7.2 本网新增学生客户识别模型2.2.7.2.1 日新增学生客户识别模型日新增在春、秋季入学期间进行跟踪,采用月累计话单进行识别校园客户。根据每日获得的全量学生客户名单,与昨日的学生客户到达进行比较,昨日学生客户到达中不存在的客户视为当日新增学生客户。本日到
27、达学生客户=当月累计新增学生客户+上月到达学生客户-离网学生客户。2.2.7.2.2 月累计新增学生客户识别模型月累计新增在春、秋季入学期间进行跟踪,采用月累计话单进行识别校园客户。根据每日获得的全量学生客户名单,与上个月的学生客户到达进行比较,上月学生客户到达中不存在的客户视为当月累计新增学生客户。2.2.7.2.3 月新增学生客户识别模型每月,采用当月全量的学生客户与上个月的学生客户到达明细数据相比,在上个月学生客户到达明细数据中不存在的客户为当月新增客户。2.2.7.3 竞争对手新增学生客户识别模型2.2.7.3.1 竞争对手日新增学生客户识别模型竞争对手日新增在春、秋季入学期间进行跟踪
28、,采用月累计话单进行识别校园竞争对手客户。根据每日获得的全量竞争对手学生客户名单,与昨日的竞争对手学生客户到达进行比较,昨日竞争对手学生客户到达中不存在的客户视为当日竞争对手新增学生客户。竞争对手本日到达学生客户=竞争对手当月累计新增学生客户+竞争对手上月到达学生客户-连续3月未通话竞争对手学生客户。2.2.7.3.2 竞争对手月累计新增学生客户识别模型竞争对手月累计新增在春、秋季入学期间进行跟踪,采用月累计话单进行识别校园竞争对手客户。根据每日获得的全量竞争对手学生客户名单,与上月的竞争对手学生客户到达进行比较,上月竞争对手学生客户到达数据中不存在的客户视为当月累计竞争对手新增学生客户。2.
29、2.7.3.3 竞争对手月新增学生客户识别模型每月,采用当月全量的竞争对手学生客户与上月竞争对手学生客户到达明细数据相比,在上个月竞争对手学生客户到达明细数据中不存在的客户为当月新增客户。2.2.8 新生客户识别模型2.2.8.1 模型说明新生客户是根据学生客户范围内,通过每月新生入校后识别出新生客户的身份特征。2.2.8.2 本网新生客户识别模型本网新生客户以“新增学生客户识别模型”为基础,通过“新增客户交往圈”的原则,主要是针对每年开学期间(8月15日至11月15日) 新增学生客户中,统计当月的新增交往圈信息(包括对端号码和通话次数等),如果该新增学生客户的交往圈中通话次数超过50%的对端
30、号码是本网或竞争对手8月15日至统计日期的新增学生客户,则将该客户判断为本网新生客户。具体算法模型流程如图所示: 本网新生客户识别模型2.2.8.3 竞争对手新生客户识别模型竞争对手新生客户主要针对每年开学期间(8月15日至11月15日) 竞争对手新增学生客户,统计当月与本网新增客户的交往圈信息(包括对端号码和通话次数等),如果该竞争对手新增客户的交往圈中通话次数超过30%的对端号码是8月15日至统计日期的本网新增学生客户,则将该客户判断为竞争对手新生客户。具体算法模型流程如图所示:2.2.9 毕业生客户识别模型2.2.9.1 模型说明毕业生主要根据学生客户中“在校学生客户”识别计算基础上,将
31、未在校客户作为毕业生客户原始目标群,确定出学生毕业生客户群体。主要分为本网毕业生和竞争对手毕业生。2.2.9.2 本网毕业生客户识别模型本网毕业生客户识别算法主要以“在校学生客户”识别出未在校学生客户为基础,累计跟踪作为毕业生客户。2.2.9.3 竞争对手毕业生客户识别模型竞争对手毕业生客户识别算法主要以“在校学生客户”识别输出的竞争对手学生客户为基础,累计跟踪作为竞争对手毕业生客户客户。3 附录A:交往圈识别模型交往圈识别模型:用户在使用移动服务过程中,产生的交往模式、属性模型(消费等)、活动模式及IMEI属性特征的综合表征都具备某些基本特征,这些基本特征的表现称为此用户的交往圈特性。 利用
32、交往圈识别模型进行个体之间的识别,交往圈识别模型具有稳定和可重现性,不仅是其通话行为的客观表现,同时也能够通过其背景资料,所使用的终端标识等信息进行识别。l 交往圈与一个移动号码发生通话行为的所有的对端号码集合l 交往号码一个移动号码的交往圈内的号码l 交往圈的时效性随时间变化可能出现大幅度变化l 全集交往圈在一定时间段内与一个移动号码A发生通话行为的对端号码的全集称为A在这段时间内的全集交往圈l 有效交往圈与一个移动号码发生通话行为且具有相对稳定模式和密集程度的对端号码集合有效交往圈在一定时间段内可以作为重入网识别的依据l 有效交往圈大小用户有效交往圈大小与其ARPU存在相关性l 交往指数衡量一个移动号码的交往号码与其交往程度的量化指标Exp= (call_freq,call_dura,call_counts)涵盖交往频度,通话时长,通话次数等诸多因素 为移动号码的有效交往圈确定提供评估基础图 附录A1