基于客户全息信息的垃圾短信挖掘及套利链监控系统.ppt

上传人:laozhun 文档编号:2240772 上传时间:2023-02-05 格式:PPT 页数:35 大小:3.82MB
返回 下载 相关 举报
基于客户全息信息的垃圾短信挖掘及套利链监控系统.ppt_第1页
第1页 / 共35页
基于客户全息信息的垃圾短信挖掘及套利链监控系统.ppt_第2页
第2页 / 共35页
基于客户全息信息的垃圾短信挖掘及套利链监控系统.ppt_第3页
第3页 / 共35页
基于客户全息信息的垃圾短信挖掘及套利链监控系统.ppt_第4页
第4页 / 共35页
基于客户全息信息的垃圾短信挖掘及套利链监控系统.ppt_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《基于客户全息信息的垃圾短信挖掘及套利链监控系统.ppt》由会员分享,可在线阅读,更多相关《基于客户全息信息的垃圾短信挖掘及套利链监控系统.ppt(35页珍藏版)》请在三一办公上搜索。

1、中国移动科技创新成果推广材料,完成单位:省公司业务支持中心,成果名称:基于客户全息信息的垃圾短信挖掘 及套利链监控系统,01,成果研究类别:其他,省内评审结果:,成果专业类别:业务支撑,目录,4,技术实现方案,3,关键点、难点和创新点,1,项目背景和意义,2,成果应用情况及效益,项目推广方式建议,项目推广投资和软硬件需求,5,6,垃圾短信治理已势在必行!,如何改善客户感知?垃圾短信严重的干扰了用户的正常通信生活,造成客户服务质量下降,客户关系出现前所未有的危机,如何树立良好的企业形象?08、09年,央视“3.15”晚会连续曝光垃圾短信事件,引起社会强烈反响媒体及社会舆论把运营商推上了 风口浪尖

2、,如何快速、长效治理?集团公司要求全面、有效整治垃圾短信广东公司作为集团试点,全面探索垃圾短信治理的模式经验,客户感知下降,社会舆论压力大,集团公司严格要求,在移动通信市场快速发展的同时,垃圾短信问题日益凸显,危害性愈发严重。垃圾短信已成为影响企业形象的重要负面因素,如何以客户导向,有效治理垃圾短信,提升服务质量,维护稳定的客户关系成为我们亟需解决的问题。,解决之道基于客户全息信息的垃圾短信挖掘及套利链监控系统,渠道养卡识别 助力渠道监管 社会渠道违规批卡、倒卡为垃圾短信发送者获取卡号资源提供了便利,是垃圾短信产生的重要原因之一,因此经分在事前进行渠道养卡的识别,从源头上杜绝垃圾短信。,垃圾短

3、信模型识别 基于经营分析系统中的客户属性、消费数据和消费行为分析等信息,构建垃圾短信号码识别模型,通过挖掘等相关技术,辅助垃圾短信号码识别。与网维拦截系统建立互动 输送垃圾短信疑似号码,提升垃圾短信拦截系统的效率和准确率,降低人工审核的压力和人力资源投入成本。,经分前端监控 利用垃圾短信黑名单,做好前端日常监控,包括垃圾号码关键指标监控、垃圾号码渠道分析与监控、垃圾号码资费监控等,为省公司以及地市的垃圾短信监控提供数据支持。垃圾短信套利链探索 借助经营分析系统的各类渠道明细数据,对垃圾短信号码的入网渠道集中度,欠费情况等进行分析,探索垃圾短信的套利链,为垃圾短信的渠道治理提供依据。,基于客户全

4、息信息的垃圾短信挖掘及套利链监控系统,利用经分系统强大数据仓库信息以及数据挖掘的能力,建立基于客户全息信息的垃圾短信挖掘及套利链监控系统,从事前预测、事中监控、事后分析三个方面助力垃圾短信治理工作。,事前,事后,事中,目录,4,技术实现方案,3,关键点、难点和创新点,2,项目背景和意义,1,成果应用情况及效益,项目推广方式建议,项目推广投资和软硬件需求,5,6,技术实现方案,广东公司原有的垃圾信息管理中心包括网维系统识别、10086999举报平台以及短信人工仲裁三部分。本系统借助省经营分析系统先进的数据挖掘技术以及强大的数据库资源,利用客户的全息视图,加入到垃圾信息治理的长效工作机制中,以辅助

5、网维垃圾短信拦截系统的识别准确度,减少人工仲裁的成本,为垃圾信息治理工作提供精准的数据支持。,基于客户全息信息,建立垃圾短信高效治理体系,垃圾号码整体分析,品牌,渠道养卡识别,垃圾号码识别,入网时长,渠道,ARPU,发送量,发送模型,对方号码连号,探索垃圾短信的发送模式建立预警机制,发掘垃圾短信的运营模式从源头上解决问题,用机类型,短时间内发送量分析,发送连号分析,对方号码回复分析,与对方号码通信分析,入网时长分析,。,垃圾号码识别模型,渠道商,SP商,不法垃圾短信商,欠费分析,孖卡分析,IMEI分析,酬金分析,低资费套餐,.,垃圾号码黑名单文件,关键业务指标系统跟踪监控,阈值设置,客户基本资

6、料,账单资料,清单资料,套餐资料,渠道信息,系统监控,事中,事前,事后,渠道运营模式分析,渠道整治,与网维建立互动机制,渠道处罚,建立渠道养卡模型,从源头杜绝垃圾短信,社会渠道违规批卡、倒卡为垃圾短信发送者获取卡号资源提供了便利,是垃圾短信产生的重要原因之一,因此经分在事前进行渠道养卡的识别,从源头上杜绝垃圾短信。,不法社会渠道商,大量号码卡没被实际卖出,而是被“养”起来,向移动公司制造号码卡被购买和使用的假象,利用养卡获得非法利益:如:套取酬金,获得SP分成金额;获得移动赠送话费或其他实物赠送。还可能为垃圾短信商提供低价格的号码资源,为不法垃圾短信商提供便利!,目标:识别出真正的渠道养卡号码

7、,将这些养卡号码排除在营销优惠之外,减少垃圾短信获利的空间;打击为垃圾短信发送者获取卡号资源的渠道商。,渠道养卡模型建模方法,本方案采用标准的K-means簇聚分类算法将正常用户和养卡号码划分开,其中模型输入变量如左图。算法的数学描述如下:,可取K8,根据具体用户构成的复杂情况进行变动,复杂性高的就选取更在的K值。经过簇聚分类后,每类的用户有几种情况:养卡号码、主流用户、低质用户、特高质用户等。结果如下:,1假设要聚成K个类。随机决定K个类中心Z1(1),Z2(1),.,Zk(1)。2在第k次叠代中,样本集Z用如下方法分类:对所有i=1,2,.,K,ij 若 则3令由2得到的Sj(k)的新的类

8、中心为Zj(k+1)令 最小。j=1,2,.,K 则。对于所有的j=1,2,.,K,若Zj(k+1)=Zj(k),则终止。否则goto 2,输入:类数K;表1上述的养卡数据表。输出:K个集合Si,i=1,2,.,K,是第i类里面的用户集合。过程:,渠道养卡模型模型结果,找出的养卡号码和实例如下:,模型效果:根据某市公司试点情况:识别出养卡代理商数量提升8.7倍,养卡号码数量提升5.3倍,从上表可见,arpu和imei是两个维度,展现用户群的分布:,正常用户的消费较高,并且不同用户的消费有较显著的差异,反之养卡群的用户消费较低。正常用户都很少换手机,而且不会与很多人共用手机,反之养卡群使用相同I

9、MEI频次较高。,获中国国家知识产权局受理专利:养卡识别方法及系统(专利申请号:200910241567.7),建立垃圾号码识别模型,做好事中监控,垃圾号码特征:动感地带占比最高:达56.24%;新用户占比高:在网时长70%在2个月以内;主要来源于社会渠道:其中来自“特约代理点”和“指定他营厅”这两个渠道的号码占比分别为41.9%和39%;,根据垃圾号码黑名单,进行垃圾号码特征探索分析 分析的样本数据取自省客户服务中心在20100524-20100619时间窗口内被客户投诉的短信为垃圾短信,对应的发送号码为垃圾号码。,垃圾号码识别模型特征分析,垃圾号码特征:小部分以号段来批量发送,约占34%。

10、向一个对端号码发送一条短信:将近80%的垃圾号码的人均发送短信条数等于1条。语音活跃度低:76%以上无语音通话,远高于全省网聊卡14.17%的无语音通话。,注:连号是取号码的前9位,如果发送的号码前9位相同,则认为发送对象是连号,垃圾号码识别模型模型构建,建立模型:本方案选取了决策树模型来识别垃圾号码。使用被客户投诉发送垃圾短信的号码为垃圾号码,将垃圾号码与随机号码按1:20的比例进行建模,数据按照(6:4)分成训练集和测试集来构建、评估模型。其中模型输入变量如左图所示。,评估模型:考核模型的查准率和查全率。其公式如下:查全率=模型输出的真实垃圾号码数/垃圾号码样本总数 查准率=模型输出的真实

11、垃圾号码数/规则输出的总号码数模型跑数的运行时间是考核模型应用的重要指标。,垃圾号码识别模型模型结果,决策树的最终结果如下(部分结果):,查全率:垃圾号码数占比查准率=节点判断正确的号码数/该节点总号码数1:判断为垃圾号码0:判断为非垃圾号码,在网时长,查全率=9%,查全率=91%,=50天,50天,查全率=3%,入网时长=27,入网时长27,查全率=4%,查全率=3.3%,查全率=2%,短信发送量100条,短信发送量100条,短信发送量100条,查全率=0.40%查准率=0.987,查全率=1.2%,查全率=0.38%查准率=0.984,1,1,查全率=0.75%查准率=0.990,主叫时长

12、=10分钟,1,查全率=4%,查全率=2.78%查准率=0.990,主叫时长=20分钟,1,短信发送人数94人,查全率=0.46%查准率=0.992,查全率=1%,查全率=0.59%,主叫时长=10分钟,人均短信发送量=1条,1,1小时短信发送量的最大值=50条,1小时短信发送量的最大值50条,查全率=1.8%,1小时发送量大于10的频次2次,查全率=0.8%,主叫时长=10分钟,短信发送人数=94人,查全率=90%,主叫时长=10分钟,人均短信发送量=2条,查全率=1%,人均短信发送量=1条,查全率=3.1%,查全率=0.6%,人均短信发送量=1.2条,查全率=0.5%,人均短信发送量=1.

13、2条,垃圾号码识别模型模型结果,模型评估:,按照决策树叶子的层次,可以总结出识别规则,一天内满足下述任何一个规则都可以判断号码为垃圾号码,模型应用:全省21个地市一天的清单量:约20亿条记录 跑数时间:1小时15分,与网维拦截系统建立交互机制,2010年11月根据省网维垃圾短信拦截系统的黑名单信息,对垃圾短信识别模型进行优化,并将优化后的短信号码文件发送给拦截系统。,2010年10月接入省网维垃圾短信拦截系统7个接口信息,2010年9月根据垃圾短信识别模型,下发疑似垃圾短信号码文件给省网维垃圾短信拦截系统,每日疑似号码量为6000个,省经分系统于2010年9月开始下发疑似垃圾短信号码文件,与省

14、网维垃圾短信拦截系统形成联动,每日疑似垃圾号码量约为6000个。2010年10月开始二期接口建设,省网维垃圾短信拦截系统通过省BOSS,传输给经分垃圾短信黑名单、拦截名单等7个接口文件,日文件记录数超过150万条,文件大小超过17.7G。,模型建设,接口建设,优化反馈,MO嫌疑黑名单AO嫌疑黑名单互联互通嫌疑黑名单自有业务嫌疑黑名单短信拦截名单黑名单疑似黑名单处理结果,运营模式分析,提升事后渠道监管力度,SP商分析,不法垃圾短信商分析,渠道商,找出垃圾号码集中的地市和品牌,从入网时间、发送量、渠道等进行特征分析,结合地市酬金体系,剖析垃圾号码利益链,垃圾号码运营模式分析思路,分析总结垃圾号码渠

15、道运营模式,借助经营分析系统的各类渠道明细数据,在事后对垃圾短信号码的入网渠道集中度,欠费情况,及各入网渠道的现金流量进行分析,探索垃圾号码的运营模式,从而估计渠道的获利空间,为垃圾短信的渠道治理提供更精准依据。,运营模式分析探索垃圾短信套利链,运营模式分析探索垃圾短信套利链,4,结合地市酬金体系,剖析垃圾号码利益链,总结垃圾号码渠道运营模式,结合A公司激活酬金发放方式(激活后次月发放首次酬金),以及前面分析,可以得出如下渠道养卡垃圾短信模式一:套取酬金之后,用于大量发送短信,造成欠费。,使用相同的探索方法,还发现渠道垃圾短信运营模式二:渠道商为了利用套餐内免费短信发垃圾短信进行套利,发送总量

16、不多,但具有极强的爆发能力,需要重点提防。,模式一:套取酬金后,发送大量垃圾 短信,造成欠费;模式二:利用套餐内免费短信发送垃 圾短信。,模式二行为特征,入网时间集中月均发送短信量不高集中使用低资费套餐发送垃圾短信内容近似度极高;办理和取消短信套餐群体特征强,入网渠道集中短信发送时间集中,运营模式分析提升社会渠道监管,将垃圾短信渠道的探索分析结论应用于社会渠道监控模型中,扩大监控范围,再通过聚类等模型方法,实现渠道养卡识别模型,提升模型的准确度!,入网时间集中短信量发送时间集中入网套餐集中入网渠道集中套餐外资费低欠费金额短信发送量垃圾号码数。,分公司网点编码网点名称网点星级客户入网时间分层客户

17、入网套餐,月固定费折算话务量充值累计次数充值累计金额最高频IMEI最高频IMEI的频数使用过的IMEI数低ARPU客户占比零次通话客户占比欠费客户占比高短信量用户占比垃圾短信投诉占比。,垃圾短信渠道特征,渠道监控模型指标,通过模型方法实现渠道养卡识别,建立系统自动监控报表,完善事后分析,1,前端监控,2,号码统一视图,3,阈值设置,垃圾号码资费套餐分析 帮助管理人员发现存在过低门槛的资费政策,为优化资费设计提供参考。,垃圾号码入网渠道分析 掌握垃圾短信发送号码、垃圾短信发送数量、垃圾号码欠费金额等在渠道的分布情况,为加强渠道监控和管理工作提供参考。,垃圾短信入网套餐分析 监控垃圾短信号码在入网

18、套餐的分布情况,帮助管理人员发现预存优惠政策、套餐包设计中的漏洞。,系统监控号码统一视图,1,前端监控,2,号码统一视图,3,阈值设置,以省网维垃圾短信拦截系统提供的垃圾短信黑名单为基础,结合经分提供的用户基本属性和业务使用属性及帐务属性等,建立垃圾短信号码信息视图,为其全面掌握垃圾短信的情况提供支持。,系统监控阈值设置,1,前端监控,2,号码统一视图,3,阈值设置,根据各级业务管理人员、分析人员对垃圾短信关键指标监控的需求,支持灵活设置关键业务指标监控规则。,目录,4,技术实现方案,2,关键点、难点和创新点,3,项目背景和意义,1,成果应用情况及效益,项目推广方式建议,项目推广投资和软硬件需

19、求,5,6,技术方案的关键点、难点和创新点,创新点,基于数据挖掘技术的渠道养卡识别模型已获得国家专利基于数据挖掘的垃圾短信号码识别模型,能够精确定位垃圾短信的发生源,实现了对垃圾短信的实时精确拦截,难点,顽固的黑色产业链:短信渠道比其他宣传渠道有着成本低、效率高、便捷性、隐蔽性和精准性等得天独厚的优势,已经形成了顽固的黑色产业利益链。垃圾短信识别难度大:垃圾短信发送者在利益的驱使下,不断采用新技术逃避运营商的拦截,垃圾短信用户特征快速变化,低频垃圾短信用户特征隐蔽,给打击垃圾短信增加了难度。,关键点,全面统筹,多举并措:全面分析垃圾短信的价值链条,通过各部门协同,各个击破,协同控制,实现全面切

20、断垃圾短信的价值链条。模型研究,精确识别:充分利用BI系统的数据,通过数据挖掘技术,建立垃圾短信识别模型,同时结合其它系统,做到精确识别和拦截。,目录,3,技术实现方案,2,关键点、难点和创新点,4,项目背景和意义,1,成果应用情况及效益,项目推广方式建议,项目推广投资和软硬件需求,5,6,综合治理成效显著,垃圾短信量逐月下降,利用经分系统强大数据仓库信息以及数据挖掘的能力,从垃圾信息价值链的源头出发,建立垃圾号码识别模型,助力于垃圾号码治理工作,实行源头控制、多手段的垃圾信息系统整治,已经取得了很好的治理成效。集团公司通报指标:10月每万用户被举报率2.29,在7月首次达到集团公司小于5的指

21、标要求。10月被北京用户举报量936条,10月较6月下降55%10月垃圾信息举报量:103882条,比09年下降52.48,准确识别垃圾短信号码,提升社会和经济效益,高准确度的识别系统:垃圾号码识别模型在9月底上线后,10月-12月份经分疑似垃圾短信号码与网维举报黑名单的号码重合度都在30%以上,表明识别模型的总体效果良好,识别度高。,经济效益显著:降低了人工仲裁核查成本,极大提高经济效益。垃圾短信的人工仲裁成本较高,9月-11月的核查成本都在300条以上(即核查300条点对点短信,才仲裁一条黑名单,11月份人工仲裁量为3151569 条),而经分的疑似垃圾短信核查在150条以下(即每150条

22、可仲裁一条黑名单),可大大降低降低人工审核的压力和人力资源投入成本。,社会效益明显客户感知和企业形象改善:客户感知积极提升,一系列措施也赢得了媒体和社会舆论的正面评价,企业公众形象得以有效改善,取得良好的社会效益。推动产业可持续发展:为行业树立了标杆和榜样作用,有利于提升整个电信行业的短信信息管制水平,肃清影响短信产业发展的“毒瘤”,推动短信业务的良性可持续发展。,全面破解渠道养卡模式,抑制垃圾短信的源头,全面破解渠道养卡模式模式一:骗取酬金后发送垃圾短信,欠费停机后弃卡;模式二:利用套餐免费短信发送垃圾短。准确定位垃圾号码源头“特约代理点”和“指定他营厅”这两个渠道的号码占比分别为41.9%

23、和39%,是防范的重中之重。显著提高统筹管理效益专利技术全方位侦察养卡行为,识养卡渠道商数量提升8.7倍,养卡号码数量提升5.3倍。全年预测,可节约的虚增用户酬金成本3000万元以上,节约关联营销成本900万以上。,渠道养卡专利技术,成果整体效能分析,注:1、不能纳入前11项的列入“其他”,可以自定义效能类型 2、没有产生效能的项可以自己删除 3、内容多的可以分页,目录,3,技术实现方案,2,关键点、难点和创新点,5,项目背景和意义,1,成果应用情况及效益,项目推广方式建议,项目推广投资和软硬件需求,4,6,项目推广方式建议,基于客户全息信息的垃圾短信挖掘及套利链监控系统在全国乃至整个电信行业都处于领先水平,具有良好的推广性、可移植性,可在外省乃至全国复制并推广。推广方案建议如下:,经营分析系统,垃圾短信冲裁平台,基于客户全息信息的垃圾短信挖掘及套利链监控系统可在全国各省兄弟公司实施。,成果推广条件,人,料,机,环,法,数据挖掘人员,从上而下的重视意识,岗位的设置,工作明晰,部门职责的确立,业务口径的确认,系统建设,监控报表,制度流程完善,管理办法的建立,公司领导支持,目录,3,技术实现方案,2,关键点、难点和创新点,6,项目背景和意义,1,成果应用情况及效益,项目推广方式建议,项目推广投资和软硬件需求,4,5,项目推广投资和软硬件需求,34,谢 谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号