《KXEN产品介绍.ppt》由会员分享,可在线阅读,更多相关《KXEN产品介绍.ppt(59页珍藏版)》请在三一办公上搜索。
1、北京英泰慧雪科技有限公司电信业数据挖掘,公司简介IWTKXENKXEN产品介绍产品解决的问题背景产品定位产品特点与传统数据挖掘产品比较理论基础产品组成产品应用案例,北京英泰慧雪科技有限公司简介,北京英泰慧雪科技有限公司成立于2006年雇员超过100名IT服务及解决方案提供商,IT服务IT咨询服务项目管理业务和技术的整合应用开发系统维护和技术支持服务,解决方案商务智能企业绩效管理企业内容管理行业解决方案,KXEN产品在中国内地及香港地区的总代理,服务产品线市场营销服务e解决方案CRM服务,宗旨以互联网和无线技术基础上开发的创新的多渠道的客户关系管理及电子商务解决方案帮助客户实现业务收入的增长,北
2、京英泰慧雪科技有限公司介绍续,2007年,IWT与韩国领先的CRM解决方案供应商共同成立合资公司MPC TI Ltd.,进一步扩大了产品服务在CRM领域的份额。在2008年,我们在北京设立客户关系管理服务中心,以便更好地为客户提供服务。公司投入大量资金用于产品研发,并且在多个电子商务解决方案领域取得独立的知识产权。行业:我们侧重的金融服务、电信、零售和旅游行业。我们的客户:包括中国移动、中国电信、电讯盈科、国泰航空、创新、金宝汤、永明人寿等经验丰富的专业服务团队,为客户制定和实施电子商务和CRM解决方案。我们专注于自己的产品,包含电子商务平台、客户联络中心解决方案、以及各种网络和移动应用的同时
3、,我们也作为世界级解决方案专家,如KXEN、Cognos等公司的代理为客户提供营销策划服务。此外,我们还为电信部门的重点大型工程项目提供系统集成和项目管理服务。,合作伙伴,强大的合作伙伴确保给客户带来最佳的解决方案高效的同盟保证我们时刻走在技术的前沿在中国、马来西亚、泰国和印度尼西亚也建立了相关合作伙伴关系和经销体系,KXEN 公司背景,全球著名的专业数据挖掘软件开发厂商,创立于1998年七月总部位于旧金山,在巴黎拥有研究中心,在美国和欧洲运作投资方:Sofinnova US&France,Innovacom,XAnge,Motorola Ventures 科学技术委员会:Vladimir V
4、apnik Leon Bottou Yann le Cun Bernhard Schoelkopf Isabelle Guyon Lee Giles Olivier Chapelle Emmanuel Viennet-Gilbert Saporta在机器学习(人工智能)领域拥有很高的声誉KXEN分析架构包最新版本5.0版支持Windows,Linux,Solaris,HP-UX,AIX支持包括中文在内的多个国家语言,全世界250+多个客户截至到2007年1月,电信,MCIMobile ONEMobistarRogersSTARHUBTeliaUralszvyak comVodafone D2V
5、odafone UKVodafone NLVodafone NZWataniya K,Bell CanadaBelgacomCelCom福建电信甘肃电信四川电信Cox Com.EarthlinkFET TaiwanFrance TelecomOrangeOneK-CellKGTelecom,金融,KBFinarefFranfinanceLa Banque PostaleLoanPerformanceMerrill LynchOSEOTunisie LeasingUlster BankUNI BANCO BRAZILUral BankNikko securitiesWells Fargo,Ban
6、k AustriaBarclaysBZWKCAJA AsturiasCAJA NavarraCoop BankDiscoverEposLCLGan CapitalGMF汇丰银行(香港)HBOSHCAIC(K)Fidelity,零售和其他,La Blanche PorteLee ValleyLowesLowerMyBillsMaximilesMotorolaMicrosoft EuropeOverstockPMUPowergenSearsStarwoodStaplesW.,AC NielsenBottega VerdeBote OutilsComebackeBayExperian US&Euro
7、peGranTurismoBrainpad Harte HankiFloorKPMGRusoEnergosbyt,2007年50 个新客户,2008年48个新客户,2009年 32 个新客户!,合作伙伴,全球系统集成商Accenture,CapgeminiB.O技术合作伙伴OEM合作伙伴战略合作伙伴Cognos技术合作伙伴SAPSAP BW 认证-两个KXEN的数据挖掘工具销售商之一由 SAP NetWeaver 支持Teradata技术合作伙伴战略合作伙伴和转售合作伙伴其它合作伙伴:Microsoft(Yukon integration),JSR73(Java Data Mining Gro
8、up)OEMsBO,Doubleclick,Loanperformance,Clarity Blue,MDB,Smart Focus,SeeWhy,Misys/Almonde,Fermat,Proficient,Advizor,Experian,Alterian,公司简介KXEN产品介绍产品解决的问题背景产品定位产品特点与传统数据挖掘产品比较理论基础产品组成产品应用案例,KXEN产品及应用案例简介,数据挖掘现状及问题,数量巨大,维度繁多人类仅仅能够应付最多5个变量商业问题多客户流失欺诈分析交叉销售财务预测客户需求个性化全球通神州行动感地带各种套餐手工挖掘速度效率已经无法满足市场变化速度决策的科
9、学化,经验信息,OLAP&报告,Gut feeling,Excel&报表,企业日常决策,建模,“整个公司由猜测&行为 变为测试,理解,预测行为”Thomas Gith 埃森哲,客户 市场 销售 财务,公司面临商业问题,促销活动的用效性,向上销售,交叉销售,客户满意度,市场分类,市场分析,需求预测,供应链,2个面临的挑战,挑战 1:更多客户,更多群体,更多产品,更多模型需要建立!问题:我们能够用现有的工具建这么多新的模型吗?挑战 2:团队在扩充和雇佣更多新人。问题:他们有符合要求的技能吗?他们能很快地培训好吗?,15,KXEN 有什么不同?,易于使用没有统计培训或专业知识,也可以使用KXEN自动
10、数据准备和探索,允许访问原始数据包括上千个变量并自动找到重要的指标,快速建模在几小时内创建和部署模式,而不是数周使用KXEN可以帮助您进行日常决策、解答传统模型因市场响应速度慢而无法解决的商业问题,易于部署明确的质量和可靠性指标,便于自动部署设计整合到企业应用程序和工作流程模型代码可以导出到任何目标环境,16,数据挖掘项目中时间开销情况(Rexer Study 2008),执行报告V5.0!,ADM V5.0!,经过优化的数据库内打分V5.0!,KXEN框架!,KXEN框架!,打分/部署,理解商业问题,访问和准备数据,生成模型,写报告,选择变量,理解,商业问题,应用,准备数据,建模,模型测试,
11、准备数据:缺失值处理,异常值处理,函数变换,把数学语言转换成商业描述,选择与商业问题最相关变量,以适合算法需要,用不同算法进行建模,选择不同参数,KXEN:自动决定重要变量多至几千个变量,KXEN:K2C模块自动化预处理,KXEN:结构风险最小化理论自动选优,KXEN:独特专利技术,KXEN产品定位-自动化数据挖掘技术,数据理解,数据准备,建模,评估,传统数据挖掘工具处理流程,数据挖掘应用瓶颈:技术问题,数据预处理类型转换:转换为算法本身所支持的类型、做数据bin操作去奇异值:辨识奇异值,做适当处理去缺失值:填充缺失值函数变换:去除数据分布的影响 数据集平衡:使训练集中的数据均衡 降维处理模型
12、选优模型验证模型选优:算法选择算法参数选择模型理解数学-商业,传统的数据挖掘方法每个模型的成本:¥30,000,4周,数据理解,业务问题,应用,准备数据,建模,模型评估(理解),KXEN 新一代的方法每个模型的成本:¥500,1周或更少!,业务问题,建模,应用,我们现在创建上百个预测模型所花费的时间在过去只能创建一个模型.通过KXEN 我们节省上百万美元,运用了更有效的营销活动.金融客户,KXEN与传统数据挖掘工具比较时间与成本,选择变量准备数据变量编码 缺失值处理奇异值处理匹配模型测试模型模型报告模型部署,KXEN 自动化,KXEN引擎分析框架架构,任意维度“5 to 5000”任意回应率“
13、0.5%to 50%”任意数据类型 字符串,整型,浮点型,日期,etc.任意噪音 缺失值,奇异值 变量任何分布形态正态,非正态 输入变量的任意相关度 独立,高度相关,KXEN一致编码-完全自动化,数据预处理,营销案推广甄选出很有可能购买产品的目标客户显著提高客户响应率,降低营销广告成本提高利润客户流失预警 哪些用户已经流失 哪些用户快要流失 影响用户流失的重要因素是什么客户细分 怎样根据用户价值或使用行为划分用户群 各用户群的比例是多少 用户群的特征是什么交叉销售 哪些产品组合更受欢迎未来预测 客户消费的周期性分析 客户消费的趋势分析,稳健回归(K2R),聪明分群(K2S),关联规则(KAR)
14、,时间序列(KTS),KXEN解决方案-基于问题的建模(非算法),稳健回归组件,回归/分类 了解并预测客户的行为(连续二值分类目标)应用:目标市场、欺诈检测、评分、流失,可能的场景:会有人购买你的产品吗?你是否应该给客户贷款?哪些用户已经流失?哪些用户将要流失?影响用户流失的重要因素是什么哪些用户可能会响应您的营销活动吗?是否有欺诈行为?客户的估计价值是多少?客户的ARPU值是多少?,26,聪明分群组件,分群/聚类聚类相似群体-监督/无监督应用:市场分群、渠道/信息管理,可能的场景:为每个不同的营销活动,识别不同的市场客户群体?定义和理解潜在的流失客户特征?定义和理解高价值客户特征?识别购买新
15、产品的客户特征?认识购买不同产品组的客户特征?怎样根据用户价值或使用行为划分用户群各用户群的比例是多少用户群的特征是什么,27,关联规则组件,关联规则/市场篮分析发现产品和服务的内在关联,并立即采取适当的行动或建议,可能的场景::哪些产品可以交叉销售?哪些产品可以考虑捆绑销售?鉴于该客户有移动电话,他会订漫游服务的可能性多大?Given that he bought HTC Touch,what is the likelihood that he will buy Apple iPhone?鉴于他买了HTC的触摸,他将购买Apple iPhone可能性多大?,28,时间序列组件,时间序列/预测
16、分析预测与时间相关的数据(提取趋势和周期)来预测下一个未来值。,可能的场景:整体ARPU值下个月会下降吗?KL月销售未来几周会增长吗?电话通话量预计未来两周是多少?股市指数是否会继续攀升?客户消费的周期性分析客户消费的趋势分析,29,KXEN 建模向导 JNI wizard(standalone)基于CORBA的Server/client(client for CORBA server)KXEN Enterprise(Web)KxShell:KXEN script SAS 伴侣 Clementine插件Library c+DCOM CORBA KJDM,KXEN应用模式,数学商业完美结合,模型
17、解释,一套符合各项规范的可重用组件Java API C+APICOM DCOM组件CORBA组件KJDM组件KDD模式(Knowledge Discovery in Database)模型输出为各种源码SQLPMMLCJAVA,KXEN的集成优势,预处理-自动化模型性能验证-自动化最优模型搜索-自动化模型商业解释-全面化,上帝的归上帝,撒旦的归撒旦数学的归KXEN,商业的归用户,KXEN自动化数据挖掘,“减少了数据准备时间从以前的整个建模周期的70%到现在的几乎不用花什么时间。”“KXEN的模型比传统工具创建的模型更精确/健壮。”“即使经验不是很多的分析员也可以创建高质量的模型。”“一年自动维
18、护几百个模型。”“期望生产力提高10倍。”,发表于2005 Teradata 用户大会,客户评价KXEN,KXEN在这里,来源:Gartner评测报告,KXEN代表未来,在Gartner发布的07年2季度客户数据挖掘魔力象限报告中,KXEN位居“远见卓识”象限。这意味着,KXEN技术,真正代表着未来的发展;于KXEN之中,客户可以获取最先进的数据挖掘技术,最好的性价比,洞悉客户行为,提升企业竞争力,来源:德国技术咨询公司mayato,KXEN:2009最具性价比数据挖掘软件,最近,德国技术咨询公司mayato发布数据挖掘挖掘软件的评估报告2009最具性价比数据挖掘软件,考察了SAS EM、SP
19、SS Clementine、KXEN等12种产品:最终结果,KXEN名列第一。KXEN处理数据的速度的确非常值得称道。具体请下载Data Mining Software 2009:Successful Analyses at Affordable Prices(November 2008)。,模型性能及产量比较,模型准确性,模型产量,高,低,KXEN/SAS&SPSS比较,公司简介KXEN产品介绍产品解决的问题背景产品定位产品特点与传统数据挖掘产品比较理论基础产品组成产品应用案例,KXEN产品及应用案例简介,基于 Vladimir Vapnik的结构风险最小化方法,Russian 数学家 St
20、ructured Risk Minimization支撑向量机(Support Vector Machines,简称SVM)是基于统计学习理论的一种新的机器学习技术。采用了使用结构风险最小化原则替代经验风险最小化原则 First book in 1991 Springer Verlag.,建模理论基础,结构风险最小化的岭回归算法一种kmeans算法“第三代”算法(Frequent Pattern Vertical)一种概括了ARIMA,GAR等算法的优化方法,稳健回归(K2R),聪明分群(K2S),关联规则(KAR),时间序列(KTS),KXEN核心模块的主要算法介绍,KXEN不需要客户去选择
21、算法,而且算法的参数设置是一个自动的流程,自动把一个数据集分为三部分,估计集,验证集和测试集,自动汇报最好的模型,保证了模型的拟合能力与泛化能力,训练集,数据集,自动分割等分割策略,模型 2,模型 1,模型 n,测试集,验证集,选择最好模型,验证性能,模型数据集分割,学习范式:回归,鉴于已知观测集,试图找到一个基本的过程模型(f(X,w):,Y,x,f(X,w),哪一个是好的模型?-SRM,创建的模型 已知数据 新数据,学习理论问题:在训练集的错误在新数据集上的错误,两者间的关系?模型推广能力怎样?,低拟合性/高泛化性(训练错误=测试错误),稳健模型(低训练错误低测试错误),过拟合/低泛化(没
22、有训练错误,高测试错误),经验风险或预期风险?,SRM的核心思想是减小方程中的两项,传统的学习理论,经验风险 预期风险,假设,预期风险 经验风险+置信区间(未知)从训练数据 Function(h,L),Vapnik,Where h=VC 维,L=样本大小,风险,模型复杂度,结构风险最小化是关键,拟合性:一个模型能描述你当前的数据到怎样的程度?通过最小化错误来取得.可靠性:一个模型能预测未来的数据到怎样精确的程度?通过最小化可靠区间来取得.,KXEN用Vapnik的结构风险最小化来“扫描”不同的模型集。它使用了稳健的方式,在最好的拟合性和稳健性(准确性和泛化性)间进行平衡,选取最好的模型,KI&
23、KR性能指标,KI(KXEN Indicator)指标衡量输入变量预测目标变量的能力。KR(KXEN Robustness)(鲁棒性)衡量新数据集(非测试集)上的性能.KI 范围为0(随机模型)到1(完美的理想模型)“好”KI的标准取决于业务:具体情况具体分析KR范围为0 1“好”KR 的标准:=0.95,Ki&Kr 指标解释,%目标命中率,理想模型随机模型KXEN估计集KXEN 验证集,系列,50,15,100,100,50,KR 1-B/(A+B+C),A,%打分排名前百分数人数,KI测试集 C/(A+B+C)KI估计集(B+C)/(A+B+C),B,C,80,CRM:60%客户获取/营销
24、案推广风险管理交叉销售/向上销售客户满意度分析风险:25%信用卡风险评估(信用评分)BaselII欺诈检测其它:15%数据清洗流程优化,KXEN应用领域比重,变量数量Sears西尔斯900large bank大银行1200Vodafone D2沃达丰D2 2500Barclays巴克莱银行2500Rogers Wireless Rogers无线公司5800HSBC汇丰银行8000consumer credit消费信贷16,000模型数量/年Vodafone沃达丰 D2 760market research市场研究 9,600Cox Comm.考克斯通信28,800real estate房地产7
25、0,000Lower My Bills 460,000获得的生产力Rogers Wireless 7xVodafone沃达丰D2 10 xSears西尔斯 8xBelgacom12x,商业价值Barclays巴克莱银行:邮件件数 70%,15 的呼入活动的转换率,销售 35,成本 30,获利35 Bank of Austria奥地利银行:在1个季度赢得 6千7百万美元新业务,响应 300 500%E.ON:销售 20%,从1个模型获得每年5百8十万美元销售增量Cox:答复率 260%,产品每户 14%,投资回报率在2个月Bell Canada贝尔加拿大:100%RO投资回报率1个模型大型电信运
26、营商:呼出 70%,产品 利润 20%Live Person:网上 销售 渠道 200 700%Sears西尔斯:运营 成本 50%,开发时间 90 Large bank:大银行:上市时间 66 100 的投资回报率 在1个模型,KXEN驱动新的实践和提升企业绩效,侦测潜在客户流失,制定相应对策(Orange)基于历史数据建立预测模型利用模型每周或每月对新的客户数据进行侦测对于潜在流失性高的客户提供相应对策,维持客户忠诚度挑战:精确的侦测=高投资回报率商业推广活动优化(ATT)根据商业活动的历史数据,或从客户资料库中抽取1%的数据进行试探投放,根据反馈的信息建立模型将模型应用于整个数据库,生成
27、每个客户对于新一轮的商业活动的反馈指数对于反馈指数较高的客户群有针对性地进行商业推广活动挑战:快速建模=高投资回报率交叉销售(France Telecom)根据上一季度购买新产品的客户资料建立模型将交叉销售模型应用于最近的客户资料根据每个客户的消费倾向进行有针对性的产品推广挑战:快速建模(多个模型)+精确的预测=高投资回报率其他:欺诈预警(PCS),客户群分类(Orange),推广活动策划(Cox Communication).,KXEN电信业国外案例,需求及使用KXEN前,KXEN解决方案,结果,其他好处,1、2天建立10个模型.自动生成SQL代码,60秒完成194万多个客户打分2、KXEN
28、直接建立模型质量提升7%3、2分30秒建立一个模型,为每个变量绘制收益曲线自动创建HTML文件,易于实时部署可以把数据拷贝到EXCEL,保存图形,更容易创建汇报,手工写SQL代码部署模型,数据提取到SAS,1、流失分析:平均每个模型24周,2、客户潜在人均收益分析:因子分析缺乏稳健性,3、呼叫容量预测:分析区域日均呼叫总长,总部在欧洲,是全球电信解决方案的领导性供应商。他们提供本地的,漫游和国际的声音和数据服务,蜂窝电话服务,卫星服务和所有的网络服务。它的移动电话有400万个客户。公司提供全球解决方案,覆盖200多个国家和地区,客户能以一种电信标准连接各种的商务中心。他们有16个节点的Tera
29、data系统。,传统方法建立10个模型需要50个星期,KXEN2天建立10个模型,速度快,一家大的欧洲电信公司,欧洲最大的电信供应商,提供移动、固定电话和高速数据服务。15000名雇员,3400万商业和个人 客户。2007年营业额达84亿欧元。面临的挑战:深入了解客户及其喜好,进行成功的市场营销;超过100的市场渗透率已导致每年整体流失率高达24。采用KXEN,每年760个模型,模型的开发时间减少了70。,沃达丰德国、荷兰,客户流失管理 向上销售/交叉销售 促销活动管理,沃达丰德国,客户挽留 市场推广模型圣诞节促销 客户行为预测,沃达丰荷兰,KXEN帮助我们减少每年12%的客户流失。对于开发新
30、的产品和服务,产品上市的速度是关键。使用KXEN回归模型很容易迅速发现300个或更多变量的影响。从KXEN,不到一个小时就能得到我们需要的答案。这样的速度和准确性任何其他种类的分析解决方案几乎是不可能实现的。荷兰客户业务部负责人,对用户来说,KXEN的简单易用具有特别重要的意义:不再有任何需要无休止的配置,人们可以专注于解释的结果。-德国市场营销战略市场与客户洞察部Verena Meuther,140TB的客户数据,70亿条记录,U.S.Cellular公司是美国第五大无线服务运营商,为美国25个州的148个市场中的620多万用户提供无线通信服务。成立于1983年,总部位于芝加哥,2008年利
31、润42亿美元,运营网络是CDMA 1XRTT,美国无线服务运营商U.S.Cellular公司,在2.5天内,采用KXEN输入相同的数据集,我们开始构造严重流失模型,建立了竞争流失模型,并初步建成5个产品交叉销售/向上销售模型:原来的客户流失模型需要好几个月构建和调整而KXEN能够在一天内建立一个高效的流失模型,KXEN模型提高17%的效率,Rogers Wireless公司是加拿大最大无线服务运营商,840多万用户。2008年利润63亿美元,运营覆盖加拿大全国GSM网络,加拿大最大无线运营商Rogers 公司,2006,企业版许可证,数据仓库EDW,2007-2009,201X,201X,专业
32、版许可证,主要是回归模型1 3 个人 10个模型/年2000 属性,建模只需48小时15个用户,4条业务线,非统计人员3000个属性120+个模型/年,更多的模型包括:回归、增量提升模型、二阶段模型、时间序列预测、社会关系网络,利用数据库打分技术和EDW计算能力更多探索性建模,KXEN 自动化带来给企业带来看得见的好处,巴克莱银行(前10名的银行)每年优化240个营销活动减少70 邮件,销售额增长35,成本下降了30,利润增长35 在一天而不是几周回答高管出“如果”的问题沃达丰(电信第1)每年760个模型模型的开发时间减少了70 西尔斯(零售商第3)成本下降50,模型的开发时间减少90 在几分
33、钟内回答采购员“如果”的问题 考克斯通讯 每年1680个营销模型 产品每家增长了14,交叉销售的回应率高达260 投资回报率只需2个月 Lowe s的 每人周一个模型,业界领先一整套为您量身定制的行业解决方案大量可供借鉴的行业成功案例丰富实施经验安装产品应用产品部署专业技能、一站式按需服务IT咨询支持维护培训技术文档,全套解决方案提供商,数据挖掘领域最佳合作伙伴,提高效益增加新业务推广成功率提高利用率降低成本控制风险提高服务水平,帮助您:,我们的价值,提供评估版,培训,评估,效果验证,推广,时间:1周客户方机器,时间:0.53天人员不限,时间:1530天确定评估项目(营销案/流失预测),时间:确定评估效果(与客户KXEN之前方法对比;与其它工具对比),实施流程建议,Thank you!,余润锋13681591815yurfiwt-,