移动数据挖掘交流材料.ppt

上传人:laozhun 文档编号:2936232 上传时间:2023-03-04 格式:PPT 页数:22 大小:2.53MB
返回 下载 相关 举报
移动数据挖掘交流材料.ppt_第1页
第1页 / 共22页
移动数据挖掘交流材料.ppt_第2页
第2页 / 共22页
移动数据挖掘交流材料.ppt_第3页
第3页 / 共22页
移动数据挖掘交流材料.ppt_第4页
第4页 / 共22页
移动数据挖掘交流材料.ppt_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《移动数据挖掘交流材料.ppt》由会员分享,可在线阅读,更多相关《移动数据挖掘交流材料.ppt(22页珍藏版)》请在三一办公上搜索。

1、梅州移动数据挖掘交流,精点科技数据服务部李青海2009年2月,议 程 安 排,数据挖掘原理,1,4,流失预警,常用工具介绍,客户细分,3,2,数据挖掘原理,定义:KDD是从大量数据中提取出有效的、新颖的、有潜在作用的、可信的、并能最终被人理解的模式(pattern)的非平凡的处理过程。最近,Gartner Group的一次高级技术调查将数据挖掘和人工智能列为“未来三到五年内将对工业产生深远影响的五大关键技术”之首,并且还将并行处理体系和数据挖掘列为未来五年内投资焦点的十大新兴技术前两位。根据最近Gartner的HPC研究表明,“随着数据捕获、传输和存储技术的快速发展,大型系统用户将更多地需要采

2、用新技术来挖掘市场以外的价值,采用更为广阔的并行处理系统来创建新的商业增长点。”,数据挖掘分类,挖掘对象基于数据库的挖掘基于web的挖掘基于文本的挖掘其他,如音频、视频等多媒体数据库用户使用响应模型交叉销售模型客户评价模型分段模型,数据挖掘分类,分析数据挖掘的任务是从数据中发现模式。模式按功能分为预测型(Predictive)和描述型(Descriptive),而按实际作用可分为以下几种模式:分类:首先从数据中选择已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对没有分类的数据进行分类;预测:用历史来预测未来,回归的方法;关联分析:关联规则;聚类:物以类聚;序列模式:是指

3、在多个数据序列中发现共同的行为模式;描述和可视化:数据挖掘的结果的表示形式;偏差分析:从数据分析中发现异常情况也是很重要的,基本方法是寻找观察结果与参照之间的差别。观察常常是某一个域的值或多个域值的汇总。参照是给定模型的预测、外界提供的标准或另一个观察,数据挖掘分类,挖掘模型决策树(decision tree)关联规则(association rules)聚类(clustering)神经网络(Artificial Neural Networks,简记作ANN)粗糙集(rough set)概念格(concept lattice)遗传算法(genetic algorithms)序列模式(seque

4、nce pattern)贝叶斯(Bayes)支持向量机(support vector machine,简记作SVM)模糊集(fuzzy set)基于案例的推理(case-based reasoning,简记作CBR),决策树,决策树是以实例为基础的归纳学习算法,着眼于从一组无次序/无规则的事例中推理出决策树表示形式的分类规则;决策树基本算法是:贪心算法,它以自顶向下递归、各个击破方式构造决策树.,聚类,聚类是根据数据的不同特征,将其划分为不同的簇(cluster),目的是使得属于同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别(相异度)较大;聚类技术大致分为五种:划分方法(parti

5、tioning method)层次方法(hierarchical method)基于密度的方法(density-based method)基于网格的方法(grid-based method)基于模型的方法(model-based method),议 程 安 排,数据挖掘原理,1,4,流失预警,常用工具介绍,客户细分,3,2,常用工具Excel,相关性分析,常用工具Excel,回归分析,常用工具SPSS,SPSS 是Statistical Program for Social Sciences 的简称,即社会科学统计程序,由美国SPSS公司1970年代推出,迄今已有近30多年的历史。是国际著名三

6、大社会科学统计软件包之一(SAS、SPSS、Statis)。,SPSS界面:,数据表,变量表,相关性分析,常用工具SPSS,概率分布,常用工具SPSS,列联分析,常用工具SPSS,常用工具Clementine,Clementine 是ISL(Integral Solutions Limited)公司开发的数据挖掘工具平台。1999年SPSS公司收购了ISL公司,对Clementine产品进行重新整合和开发,现在Clementine已经成为SPSS公司的又一亮点。,资料流程区,管理器,选项版区,专案,报告窗口,状态视窗,常用工具Clementine,常用功能:,描述功能,数据审计(Data Au

7、dit)散点分布(Plot)频度分布(Histogram),建模功能,线性回归(Regression)Logistic回归(Logistic)决策树(C5.0)二步聚类(Twostep),议 程 安 排,数据挖掘原理,1,4,流失预警,常用工具介绍,客户细分,3,2,对分出来每个群体进行描述及解释,神州行数据业务分群,全球通数据业务分群,动感地带数据业务分群,1.分群的思路及方法,2.需求访谈,整理纪要及需求,3.确定分群变量及描述变量,4.使用数据挖掘工具聚类,客户细分,议 程 安 排,数据挖掘原理,1,4,流失预警,常用工具介绍,客户细分,3,2,1.流失预警的思路及方法,2.需求访谈,整理纪要及需求,3.流失预警宽表数据处理,4.流失相关分析,流失预警,5.使用数据挖掘工具建模及评估,6.预警模型应用,问题与讨论,Were listening.我们在倾听。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号