《基于客户消费行为的电信客户聚类分析.doc》由会员分享,可在线阅读,更多相关《基于客户消费行为的电信客户聚类分析.doc(6页珍藏版)》请在三一办公上搜索。
1、基于客户消费行为的电信客户聚类分析文章来源 毕业论文网 yjbys小编为您提供一篇毕业论文,是关于基于客户消费行为的电信客户聚类分析的计算机应用毕业论文,欢迎参考! 关键词: 移动增值业务 RFM模型 层次分析法 摘要:论文结合电信行业特点,将RFM模型和层次分析法结合起来衡量客户价值,并采用聚类方法对客户细分,挖掘出潜力客户,有效地降低了营销成本。 前言 客户细分是按照一定的标准将企业现有客户划分为不同客户群的过程,客户细分是精确营销的基础。通过客户细分能掌握不同客户群的差异化需求,进而才能针对不同客户群的差异化需求,设计个性化的产品和服务
2、,并针对不同细分客户群设计相应的营销策略,从而吸引客户、保持客户、提高客户忠诚度。客户细分的方法包括基于客户统计学特征的客户细分、基于客户价值的客户细分、基于客户行为的客户细分、基于客户态度的客户细分。本文结合电信行业特点,将RFM模型和层次分析法结合起来衡量客户价值,并采用聚类方法对客户细分,挖掘出潜力客户,有效地降低了营销成本。 1衡量客户价值 1.1 RFM模型 RFM模型是衡量客户价值和客户创利能力的一种重要方法,它基于3个指标,其中,R(Recency)代表最近一次购买到现在的时间长度;F(Frequency)代表一定时期内的购买次数;M(Monetar
3、y)代表一定时期内客户在本企业的消费额。在客户价值研究方面,Goodman等1根据RFM值将企业有限的物力、财力应用到高价值客户身上。Hughes2根据RFM的值将客户分为五类,并针对五类客户采取不同的销售策略。本文来自论文之家:,转载请保留此标记Stone等3提出不同行业的RFM应赋予不同的权重。Sung4利用SOM将顾客的RFM值分类,然后比较各类的RFM平均值以及所有顾客的RFM平均值,观察各类顾客的变化规律,通过其上升或者下降,来判断各类顾客是否为忠诚度高的白金顾客还是即将流失的顾客。其中,Hughes将客户分为五类的设定较主观;Stone的权重设定也较为主观,缺乏一个系统的方法;Su
4、ng的方法将客户分为8(2*2*2)类也较为主观。 1.2改进RFM模型 虽然RFM模型的最终目的是计算顾客价值,但是应结合行业特点对RFM模型进行改进。例如,在传统的RFM模型中,对于每天都在使用电信业务的客户,R值均为零,F值太大难以区分客户,因而,不能用传统的RFM模型对电信企业客户进行分析。对于电信行业,因为客户交费额度等于消费额度,且时间间隔较大、频次相对较少,因此,可以基于客户消费行为构建RFM模型来衡量客户价值,R代表最近一次交费到现在的时间长度;F代表一定时期内的交费次数;M代表一定时期内客户在本企业的交费额(消费额),改进后的RFM模型中三个指标的权重需要
5、采用系统而科学的方法进行分析4。 美国运筹学家T. L. Satty于20世纪70年代提出的AHP决策分析法(analytic hierarchy process,简称AHP方法),是一种定性与定量相结合的决策分析方法。可以将复杂问题分解为若干层次和若干因素,在各因素之间进行简单的比较和计算,就可以得出不同方案重要性程度的权重,可用来计算改进后的RFM模型中三个指标的权重。选择某市电信公司的三位业务经理、四位市场营销人员和三位老客户采用1-9及其倒数的标度方法对改进后的RFM模型中的三个指标重要性进行两两比较,分别得到10位评价者的判断矩阵,对其求平均,得到判断矩阵A,见表1。&nb
6、sp;表1 判断矩阵A 采用和积法计算特征向量,首先将判断矩阵A每一列归一化 对按列归一化的判断矩阵,再按行求和将向量 = 归一化则 即为所求的特征向量,Wi代表各因素的相对权重,经计算,判断矩阵A的特征向量为 ,其中M的权重最大,F的权重次之,R的权重最小,即10位评价者认为交费金额是影响顾客价值的最主要因素,交费的频度F次之,而近度R是最不重要因素。&nbs
7、p;接着计算判断矩阵A的最大特征根 为了防止判断矩阵中出现相互矛盾之处,需要对判断矩阵做一致性检验。首先,计算一致性指标CI 接着,为了检验判断矩阵是否具有令人满意的一致性,还需要将CI与平均随机一致性指标RI进行比较。查表可知,RI=0.58,因而,随机一致性比率 ,因为CR<0.1,可以认为层次分析排序的结果有满意的一致性。 1.3计算客户价值 从某市电信公司的客户记录中随机抽取了11305名客户的2010年4月至2011年3月缴费记录进行分析,以季度为时间段,分别统计各个季度的客户价值。以2010第二季度,即2010年4月至2010年6月为例
8、,R代表此季度中最后一次缴费到6月底的时间长度;F代表此季度中的缴费次数;M代表此季度中客户的缴费额。由于RFM模型中三个指标的度量单位不同,需要先分别对其标准化,然后才能加权计算。对于指标R,其值越小,客户价值越大,为损益指标,因而其标准化公式为 ,xmax为11305条记录中最大的R值,xmin为11305条记录中最小的R值;对于指标F和指标M,其值越大,客户价值越大,为增益指标,因而,准化公式为 。用CR、CF、CM分别代表标准化后的R、F、M值,用C代表客户RFM模型中各项指标加权后的总得分,即此季度的客户价值,则C=WRCR+WFCF+WMCM,其中,WR、WF、WM分别为指标R、F
9、、M的权重,在前面用AHP方法已求出。依次类推,分别求出剩余3个季度的客户价值。 2寻找潜力客户 2.1 K-means算法 J.B.MacQue在1967年提出的K-means算法,是一种经典聚类算法,其核心思想是把一个数据对象划分为k个聚类,使每个聚类中的数据点到该聚类中心的平方和最小。K-means算法首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的聚类;然后,再计算每个所获新聚类的聚类中心;不断重复这一过程直到满足收敛条件。类间相似度(距离)的计算方法有类平
10、均法、重心法、最长距离法、差平方和法等,本文采用离差平方和来计算类间距离。 在 K-means 算法中,聚类数目K要事先给定。对于给定的数据集,要确定最佳聚类数目K,可以根据方差理论,采用R2统计量、伪F统计量或伪t2统计量来确定。 (1)R2统计量。R2=1-SK/S,其中K为分类数目,而SK代表K个类的总类内离差平方和,S为所有变量的总离差平方和。理论上,k越大,每个分类越小,SK越小,R2越大,但是,k太大,分类将失去意义,所以,只能取K,使得K比较小,而且R2足够大且不再大幅度增加。 (2)伪F统计量。F=(S-SK)/(K-1)/ SK/(n-K),n为
11、数据对象的数目,S、SK的含义同上。所以,只能取K,使得K比较小,且类内离差平方和(分母)应该较小,类间平方和(分子)相对较大,伪F统计量较大。 2.2 确定聚类数目 对于聚类数目K,从216取值,分别用K-means算法进行15次聚类,聚类后的R2统计量和伪F统计量分别见图1和图2。 图1 R2统计量的变化情况 由图1可知,在k=7和K=12两处,R2统计量分别达到峰值,但k=7处,即由8类合并为7类时,R2增幅更大,更明显。 图2 伪F统计量的变化情况 由图2可知,在k=5、K=7、K=11三处,伪F统计量分别达到峰值,但k=7处
12、,即由8类合并为7类时,增幅更大,更明显。 结合图1和图2可知,聚类数目取值为7时,聚类更合理。令K=7,用K-means算法进行聚类,并对每个分类的RFM值求平均,结果见表2,观察每个分类RFM值在四个时间段的变化规律。 表2 四个时间段的客户价值 对表2中的数据做折线图,可以看出七类顾客价值变化走势图,见图3。其中,第三类客户的客户价值高,其客户价值远远超过其它六类客户;第二类客户的客户价值虽然在第一时间段相对较低,但增长较快,有较大的发展潜力;第四类、五类、六类客户价值波动很大,发展潜力不大;第七类客户价值虽然平稳,但客户价值较低,没有发展潜力;第一类客户的
13、客户价值快速减少,为即将流失客户。因而,选择客户价值高的第2类客户和有发展潜力第3类客户共2091人作为移动增值业务的精确营销对象。 图3 七类顾客价值变化走势图 3结论 目前,国内的通信企业并未采取有效手段对客户进行细分,只是简单的将市场划分为大客户市场、普通个人客户市场、校园市场等,因而,无法获取主要客户群体的需求特点,进而也不能采取有针对性的市场策略,结果是虽然获取了客户,但客户质量不高。针对电信业务特点,依据客户价值进行客户细分,挖掘出潜力客户,有针对性的开展精确营销,不但能有效地降低营销成本,而且能大大提高了营销效率,为进一步的精确营销打下了坚实的基础。
14、 参考文献: 1 Goodman J.Leveraging the customer database to your competi-tive advantageJ.Direct Marketing,1992,55(8):26-27. 2 Hughes A M.Strategic database marketingM.Chicago:Probus Publishing,1994. 3 Stone B.Successful direct marketing methodsM.New York:MCGraw-Hill Company,1995. 4林盛,肖旭. 基于RFM的电信客户市场细分方法J.哈尔滨工业大学学报,2006,38(5), 758-760.