《用户的业务偏好分析应用模型.ppt》由会员分享,可在线阅读,更多相关《用户的业务偏好分析应用模型.ppt(9页珍藏版)》请在三一办公上搜索。
1、用户的业务偏好分析应用模型,目录,业务偏好应用模型研究的需求如何根据客户的数据业务行为、基础画像、互联网行为,研究客户的业务偏好以及内容、时间等偏好,针对当前数据业务沉默客户、潜在客户开展激活与推荐。研究业务偏好应用模型的意义以用户为导向,满足用户个性化需求,比传统的大众推荐效果更好。以真实数据为依据进行分析,实现对用户的精准定位和精确推荐。有利于节约成本、提高利润水平,保留和吸引更多用户。,背景意义,基于结构化数据的偏好分析模型,通过用户的月基础画像信息自动对用户分群生成用户标签。在每个用户群内,通过用户的业务使用行为做内容关联分析针对每类用户推荐不同的内容。,输入数据,用户基础画像数据业务
2、使用行为数据以手机视频业务为例,业务偏好计算,用户分群:数据变换、归一化:解决各个特征的计量单位、大小范围差异大的问题。K-means聚类:使用基础画像信息自动聚出8个类型不同的用户群。,业务偏好计算,(1)高资费人群:该类人群特征是绝大部分数值均大于平均值,即消费水平高于平均水平,特别是总费用是各类人群中最高的。(2)标准用户群:该类人群特征是绝大部分数值与平均值持平或低于平均值。值得一提的是,虽然GPRS套餐费较高,但使用时能严格控制流量,使流量不超过标准套餐的额度,不产生额外的GPRS通信费。(3)低资费人群:该类人群特征是通话时长、短信量、上网流量均低于平均水平,特别是总费用是各类人群
3、中最低的。(4)上网发烧友:该类人群特征是上网的流量和费用超高,同时通话等传统业务量少。(5)上网一族:该类人群特征是上网流量经常超出GPRS套餐额度,导致GPRS通信费超高。与上网发烧友相比,通话等传统业务使用显得更活跃。(6)理性上网群:该类人群特征是订阅GPRS套餐较为理性,套餐费高于平均值,属于喜爱上网的上群。同时,GPRS套餐外产生的额外费用几乎没有。(7)商务人士:该类人群特征是套餐月租费、漫游通话费、无线上网流量在各类人群中最高,符合商务人士出差、经常无线上网的特点。(8)通话达人:该类人群特征是语音业务套餐费显著高于其他各个用户群。另外,有了语音业务套餐,本地通话仍很频繁。,基
4、于文本的内容过滤推荐模型,出于效率考虑,用户数据分析平台以每个用户访问过的项集的文本特征分别建立该用户的Profile并按日更新,然后通过比对Profile和推荐候选项集的文本特征来实现内容过滤推荐。相比于传统算法,主要进行了如下改进:a.分层多粒度的标签体系。用户偏好特征按照大类-子类-关键词的方式进行组织,能够适应不同的营销场景需求。例如,进行手机阅读推荐时主要使用“阅读”类的标签,进行游戏推荐时主要使用“游戏”类的标签;b.潜在语义分析。解决不同语境下的多义词问题。,基于文本的内容过滤推荐模型,示例,基于文本的内容过滤推荐模型,对于在某一特定文件里的词语 来说,它的重要性可表示为:,是该词在文件 中的出现次数,而分母则是在文件 中所有字词的出现次数之和。,逆向文件频率IDF则计算一个词语普遍重要性。某一特定词语的IDF,可以由总文件数目除以包含该词语之文件的数目,再对数得到。,则一个词语的权重为:,根据用户访问过的文件,用向量wc=(wc1,wc2,.,wck)来表示用户的偏好,其中每个分量wci表示关键词ki对用户c的重要性。而一个文件可以表示为:ws=(w1j,w2j,.,wkj)。则用户对该文件感兴趣的程度是:,