《计算机应用论文决策树在基于消费者外表的服装营销中的应用.doc》由会员分享,可在线阅读,更多相关《计算机应用论文决策树在基于消费者外表的服装营销中的应用.doc(4页珍藏版)》请在三一办公上搜索。
1、决策树在基于消费者外表的服装营销中的应用 决策树在基于消费者外表的服装营销中的应用张革伕1, 2,欧阳浩男1,徐琪2(1.南华大学经济管理学院,湖南衡阳421001;2.东华大学旭日工商管理学院,上海200051)(jkfu tom. com) 摘要:服装销售人员常常根据消费者的外表特征来进行快速营销活动,以提高购买率。从数据挖掘技术的角度来探讨基于消费者外表印象的快速营销技术,以帮助营销人员快速寻找外表印象营销规则。介绍了决策树算法原理;其次,讨论了消费者外表印象评价指标体系,并根据该体系由销售人员在服装店铺里进行了消费者的外表及其行为数据采集;应用了计算实例来说明服装消费者的外表营销决策树
2、分类模型;利用工具Clementine中的决策树方法来进行营销规则的挖掘。研究表明了该应用是切实可行的。 关键词:快速营销;服装供应链;决策树算法;数据挖掘;外表印象中图分类号:TP18文献标志码:A0引言 计算智能与数据库应用技术的快速发展,为企业的营销活动提供了新的手段,也带来了一些新的市场营销突破口。 近些年出现的客户关系管理( Customer RelationshipManagement,CRM)被企业整合进企业资源规划(EnterpriseResourse Planning,ERP)以及企业管理决策系统中,以求在这个个性化时代更好地服务客户,并留住客户1-3。数据库营销是一种靠收集
3、客户特征信息以及消费习惯的技术,并希望通过应用计算智能模型来进行知识挖掘,以支持管理决策。 数据挖掘技术是数据库营销的技术基础,其原理大部分都离不开数理统计方法,例如:决策树、粗糙集、神经网络、CHAID等4-6,但也包括一些高性能的计算智能或者是混合体。数据挖掘技术近些年的应用集中在客户消费行为的信息处理7-8,例如根据Web的访问规律来判断其喜好特征,根据消费者的个人基本资料如收入、学历、家庭结构等来分析其购买力、信用等级等,或者是收集客户Cookies信息来推荐商品,或者通过收集和处理其关联的消费信息来规划营销方式。 从实际营销的角度来看,企业的销售人员最常遇到的问题是如何将所面临的对象
4、进行分类。特别是服装销售人员,如何快速地确定面前的消费者类型,从而判断其与目标服装之间的吻合度,在有限的时间内采取有效的推荐,以促成交易,提高服装的购买率很重要。就服装销售而言,销售人员更需要一种能通过观察消费者显露在外的特征而可预知其行为的能力或技术,这样可大大提高销售效率。而现在研究的消费行为分类一般都是从消费者的心理着手9,或者是依赖消费内在条件10。从技术的角度来看,决策树是一种不错的分类方法11,简单有效,应用广泛。 本文将讨论服装销售的决策树算法模型,通过分析消费者外表特征印象与消费行为的关系,以期对消费者分类,指导营销,提高效率。 1决策树算法原理1. 1决策树分类模型 决策树模
5、型最早由Hunt提出,他将概念表示成“属性值”形式。例如,对消费者的描述有多种属性:性别、年龄、打扮、发型和眼神等,属性的值域可表示为:1)属性(性别)=男,女;2)属性(年龄)= 儿童,少年,青年,中年,老年;3)属性(打扮)= 时髦,讲究,大众化,寒酸。 概念学习系统(Concept Learning System, CLS)中的决策树节点就是决策属性,对应于待分类对象的属性,由某一节点引出的弧对应于这个属性的可能取值,叶节点对应于分类的结果。图1表示了一棵决策树。显然,决策树本身就对应着一种分类模式。 图1一棵消费者外表属性构成的消费行为树要提高搜索树的效率,首先必须保证树是一棵理想、最
6、优的决策树。为了提高效率,Quinlan提出了一种启发式搜索算法,称为ID3算法。它以信息熵和信息增益度为衡量标准,搜索原则是首先选择熵增益最大的节点。C4. 5、C5. 0算法对ID3进行了改进12-13。 1. 2决策树ID3算法ID3算法的基本步骤是:1)选择属性表AttrList = A1, A2, Ai, An,检测属性设为Ai;2)Ai的值域ValueType(Ai) = V1,VS的S个取值把训练实例集T分为S个子集,则T =Sk=1T(i)k;子集T(i)k中的所有实例的属性Ai的取值为Vk;3)T中实例分类结果组成class = C1, C2, Cj,Cm,Cj的实例数为ej
7、,1jm,且mj=1ej=|T |, |T |表示训练实例集T的实例总数,实例分类结果为Cj的概率为Pj=ej/|T |;4)求取相对信息熵。 定义训练实例集T的实例信息量为式(1):I(T) =-mj=1PjlbPj=-mj=1ei|T |lbej|T |=-(mj=1ejlbej|T |) /|T |(1)定义子集T(i)k的实例平均信息量为式(2):I(T(i)k) =-(mj=1e(i)jlbe(i)j|Tik|) /|T(i)k|(2)子集实例数与实例总数关系如式(3):mj=1e(i)j=|T(i)k|(3)如果选择属性Ai作为检测属性来将训练实例集T分为S个子集后,可以由各实例子
8、集的实例总信息量| T(i)k|I(T(i)k)之和对实例集T的实例总数|T |的平均值来表示实例集T的实例平均信息量,相对信息熵由式(4)确定:I(T,Ai) =(sk=1|T(i)k|I(T(i)k) /|T |(4)5)搜索的启发式如式(5),称为熵增益原理。 GI(T, Ai) = I(T) -I(T, Ai)(5)ID3选择信息量最大的属性Ai作为检测属性来划分实例集,达到分类的目的。 2外表特征印象营销与决策树模型 现在企业人员想通过了解详细的个人隐私来掌握消费者消费行为规律的做法遇到了强大阻力,人们对市场调研已经构筑了一道道心理防线,而且研究人员无法避免受访者的应付行为。为了获得
9、消费者在自然状态下的消费行为特征、对流行元素的感应规律,本文放弃了传统的调查研究法,而是通过营销人员对消费者外表特征的观察和评价,在自然状态下跟踪和记录消费者对指定款式服装的感应和行为变化;再利用决策树算法模型来建立客户印象类型与服装消费规则模型,并使用决策树挖掘工具进行实例分析。 2. 1实验方法与步骤在广州选择了一家大型商场,指定了一款新的针织时尚衫,从8月底秋季上市,由销售人员一直观察记录了3个多月。 观察记录内容包括2个表,销售人员在消费者走后,进行现场回忆,在12min内完成消费者的购物行为与外表特征记录工作。一个表是该款服装的销售日志,按时间与访问顺序记录每天访问的每个消费者行为类
10、型,共分三种: a表示观察和咨询、b表示比划和试穿但没购买、c表示购买。另一个表是消费者的外表特征,包括:身高、体型、衣着打扮、气质等体现人的消费心理和习惯的因素。对这些可观察的外表特征进行了分类和索引。表1是消费者外表特征评价指标体系。销售人员只需要在消费者走后,进行现场回忆,就可在12min内完成消费者的外表特征记录工作。每张表对应一条日志记录。在本销售季节结束后,将数据输入到数据库中,然后根据决策树模型由研究人员进行数据处理。此方法称为消费者外表印象分析。3 表1消费者外表印象与消费行为评估指标体系指标选择项性别(I1) A:男; B:女年龄(I2)A: 1217; B: 1824;C:
11、 2534;D: 3549;E: 5064; F: 65岁以上身高(I3)A: 1. 4米以下; B: 1. 41. 5米;C: 1. 511. 6米;D: 1. 611. 7米;E: 1. 711. 8米; F: 1. 8米以上体型(I4) A:很瘦; B:比较瘦;C:匀称;D:比较丰满;E:很丰满衣裤(I5)A:高档; B:有点档次;C:大众化;D:比较低档; E:非常低档服饰(I6)A:非常精致; B:比较淡雅;C:大众化;D:比较有个性;E:非常独特打扮(I7)A:很合体; B:比较合体;C:大众化;D:比较有个性;E:非常独特发型(I8)A:很流行; B:有修饰、简洁;C:自然、普通
12、;D:刻意、新潮;E:非常独特文化(I9)A:很有知识; B:比较知识;C:大众化;D:比较少文化;E:很少文化气质(I10) A:高贵; B:文雅;C:大众化;D:大方;E:急躁行动(I11)A:小心谨慎; B:有点保守;C:一般; D:比较随意;E:率直脸谱(I12) A:很有活力; B:阳光;C:一般;D:刻板;E:低沉眼神(I13)A:非常灵活; B:比较灵活;C:一般; D:比较专注;E:非常专注言谈(I14)A:喜欢交谈; B:能交谈;C:一般;D:少言语;E:沉默不语2. 2数据预处理表2和表3是指定的女式长袖针织时尚衫的消费者消费行为统计表,销售季节为8月底到12月初,其5折价
13、为250元。厂家给此产品的定位为2534岁、温柔典雅型、中等收入的白领女性。 表2各特征各类别分布情况特征A B C D E F总计性别3 402 405年龄9 65 220 82 17 12 405体型6 105 180 102 12405衣裤20 143 215 27 0405服饰12 159 177 54 3405打扮37 156 182 30 0405发型15 165 198 24 3405文化8 222 148 27 0405气质0 107 187 98 11405行动15 66 165 144 15405脸谱42 69 243 15 36405眼神15 126 174 81 940
14、5言谈30 150 183 31 11405表3各特征各类别的购买分布情况特征A B C D E F总计性别3 78 81年龄3 12 42 15 6 3 81体型0 24 39 15 381衣裤0 33 43 5 081服饰0 24 49 8 081打扮3 36 36 6 081发型0 24 51 6 081文化0 39 39 3 081气质0 21 36 24 081行动7 16 32 17 081脸谱7 18 44 10 281眼神0 24 41 13 381言谈7 29 34 13 081实验中共记录了405位女性的特征,未排除重复访问的女性。表2为消费者特征分布表,表3为对应的购买情
15、况分布表。405条消费行为记录中购买记录有81条,其他为未购买记录。 2. 3决策树模型与分类实例经过上面的数据预处理后,可以利用信息熵来分析厂商产品营销定位是否准确,也可通过最后规则的建立来为销售人员提供推销策略,以集中精力对付那些犹豫不决的人。下面分别给出面向“性别、年龄和打扮”的信息熵增益情形。可以看出,性别的增益最大,这说明,厂商首先必须按“性别”进行分类,其次是“年龄”,然后是“打扮”。这说明厂商的分类基本上是正确的。这样可得到一条营销规则:如果对象为女性,其年龄为2534岁,打扮合体,则可能会购买该服装。通常推销人员会根据厂商的指导意见来进行营销,但是还需要加入更多的元素。推销人员
16、可进一步根据上面的分类方法来进行分类,包括发型、气质与眼神等特征,从而可锁定对象,重点应对,在有限时间内推销给更多合适的顾客,提高购买率(目前统计的结果未超过20% )。 分类属性信息量与增益(“消费行为”信息总量I0=1.28750)如下。 1)基于“性别”的分类:“性别”A的信息量IA= 0;“性别”B的信息量IB= 1. 274 31;“性别”平均信息量I=1. 26487;“性别”信息增益GI = I0-I= 0. 02263;2)基于“年龄”的分类:“年龄”A的信息量IA=0. 918296;“年龄”B的信息量IB= 1. 494919;“年龄”C的信息量IC= 1. 249884;
17、“年龄”D的信息量ID= 1. 486566;“年龄”E的信息量IE= 1. 584963;“年龄”平均信息量I= 1. 5;“年龄”信息增益GI = I0-I= 0. 2125;3)基于“打扮”的分类:“打扮”A的信息量IA=1.29574;“打扮”B的信息量IB= 1. 54302;“打扮”C的信息量IC=1.39605;“打扮”D的信息量ID= 1. 485 48;“打扮”平均信息量I= 1.44963;“打扮”信息增益GI = I0-I=0.16213。 3服装消费的外表印象决策树挖掘实例 第2章中的分类过程计算繁琐,在大数据量情况下,必须借助于计算机技术。决策树的程序化实现也比较简单
18、,目前各大数据库提供商如微软提供的AnalysisManager(数据分析与联机分析器)里有决策树工具, SPSS提供的强大的数据挖掘软件Clementine也有决策树工具。本研究利用Clementine10. 1来进行基于消费者外表印象特征的消费行为挖掘,并给出分析结果。Clementine中的决策树算法C5. 0可生成树图和规则集。 图2试穿行为规则集分析结果显示了31条规则,包括只看或询问(a)、比划和试穿(b)、购买(c)等三种行为的分类规则。每一类规则包含若干子规则。图2显示了分析后生成有3类规则集, a类行为规则包含14个子规则, b类行为规则包含9个子规则, c类行为规则包含8个
19、子规则。 下面给出a类行为规则的14个子规则。a类行为是“非购买”行为,只询问或查看,营销人员无需对这部分人群分出注意力。 基于顾客印象的“非购买”规则集如下:Rule 1: if I1=BI5=BI7=A then action=aRule 2: if I8=CI12=AI13=B then action=aRule 3: if I9=AI11=C then action=aRule 4: if I2=CI11=DI14=E then action=aRule 5: if I2=CI8=BI11=DI13=E then action=aRule 6: if I2=EI8=B then act
20、ion=aRule 7: if I8=E then action=aRule 8: if I2=CI4=CI8=B then action=ac类行为是“购买”行为,这部分来到店铺基本上有购买意向,取决于服装对其吸引力。营销人员的主要任务是培养其忠诚度。 基于顾客印象的“购买”规则集如下:Rule 1: if I8=BI12=A then action=cRule 2: if I4=CI6=CI12=CI14=B then action=cRule 3: if I2=CI11=A then action=cRule 4: if I8=BI13=D then action=cRule 5: if
21、 I8=CI14=A then action=cRule 6: if I2=BI14=DI8=B then action=cRule 7: if I2=DI7=BI8=BI11=D then action=cRule 8: if I8=CI12=D then action=c对于营销人员来说,最重要也最需要花时间精力应对的就是b类用户,这部分用户中有部分人有购买倾向,因此,营销人员必须采用适当的手段,包括:价格或促销性优惠、重点推荐、说服与对比以及其他策略。这些方法的应用必须根据具体的消费者特征来实施。图2是对比划、试穿行为规则的展开,显示了4条规则。例如:规则3表示如果客户的年龄在2435岁,体型匀称,而服饰比较淡雅,能交谈,但行动比较随便,则客户的行为通常是比划或试穿,不购买。比划或试穿这说明客户有需求意向,但最后未买。原因可能是价格问题,也可能是一些服装特征如尺码、款式风格、细节部件或者颜色等不符合消费者需求,如果是尺码问题回旋余地小,但其他问题应该可能得到解决。 从数据挖掘的结果来看,对于该款服装的分类应该从性别、年龄着手,然后是打扮、言谈、脸谱,这说明厂商的分类大范围内是恰当的,而销售商还需要进一步细分才能提高销售效率。3