大数据时代的数据挖掘与商务智能(一)ppt课件.ppt

上传人:小飞机 文档编号:1972921 上传时间:2022-12-29 格式:PPT 页数:55 大小:4.37MB
返回 下载 相关 举报
大数据时代的数据挖掘与商务智能(一)ppt课件.ppt_第1页
第1页 / 共55页
大数据时代的数据挖掘与商务智能(一)ppt课件.ppt_第2页
第2页 / 共55页
大数据时代的数据挖掘与商务智能(一)ppt课件.ppt_第3页
第3页 / 共55页
大数据时代的数据挖掘与商务智能(一)ppt课件.ppt_第4页
第4页 / 共55页
大数据时代的数据挖掘与商务智能(一)ppt课件.ppt_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《大数据时代的数据挖掘与商务智能(一)ppt课件.ppt》由会员分享,可在线阅读,更多相关《大数据时代的数据挖掘与商务智能(一)ppt课件.ppt(55页珍藏版)》请在三一办公上搜索。

1、1,大数据时代的数据挖掘与商务智能,2,数据是宝贵的财富,其中蕴含大量有用的(有助于管理和决策)信息和知识。计算机和通讯技术的发展,使数据量急剧增加,人类进入大数据时代。收集、传输、存储、整合、分析与挖掘数据的各项技术快速发展。大数据时代,数据分析与数据挖掘作为一门信息技术,其兴起主要是受数据积累的增长和对数据分析的需求的驱动。,3,在大数据时代,我们共同探讨数据分析与数据挖掘的思想、方法和应用前景。尽量向大家介绍数据分析与数据挖掘的全貌,给一些资料性的信息。由于数据分析与数据挖掘涉及的方法广泛,软件、工具、公司太多,应用太广,此次以介绍方法为主。,4,大 纲,大数据的时代背景商务智能与数据科

2、学基于统计的传统数据分析技术数据管理与数据挖掘概论数据挖掘与知识发现技术典型应用及案例分析,5,第一部分大数据的时代背景,大数据的时代背景,从数据谈起大数据现象与新信息世界观产业界与学术界的关注“大数据”对社会发展的影响,6,从数据谈起,数据无所不在,7,“大数据”的时代背景,8,无所不在的数据(1),国家(省、市)统计局(http:/),70万家企业联网“直报”统计数据从2012年2月18日开始,全国70万家三上企业和房地产开发经营企业将在统一的数据采集和处理平台上,通过互联网直接向国家数据中心或国家认定的省级数据中心报送统计数据。,国家统计局推进“大数据”应用,2013年11月19日下午,

3、国家统计局与百度、阿里巴巴等11家企业签订了大数据战略合作框架协议,共同推进大数据在政府统计中的应用。战略合作内容,主要是共同研究探讨建立大数据应用的统计标准,包括指标定义、口径、范围、分类等;确定利用企业数据完善、补充政府统计数据的内容、形式及实施步骤,包括数据采集、处理、分析、挖掘、发布等。在此基础上,合作双方将建立战略合作关系。,9,10,无所不在的数据(2),金融数据(http:/,低频数据:日数据高频数据:金融市场中的逐笔交易数据和逐秒交易数据。超高频数据:实时数据,金融大数据的挑战与应对,在以网络化和数字化为基本特征的新经济时代,金融产业日渐回归本质,表现为金融数据流的产生、交换、

4、存储、分析以及使用。大数据对金融业带来了剧烈的挑战冲击,我国金融机构需要明确大数据战略的顶层设计,加强大数据基础设施建设,实施稳妥的大数据安全策略,方能从容迎接大数据时代。,11,金融业大数据十大趋势,第一、市场数据集变得越来越庞大,业务对数据的细分粒度要求越来越高,以满足预测模型、业务预测和交易影响评估的需求。第二、新的监管和合规要求更强调治理和风险汇报,推动了全球性金融机构对更深入和透明的数据分析需求。第三、金融机构不断完善自身的企业风险管理框架,该基于主数据管理策略开发的框架可协助企业提高风险透明度,加强风险的可审性和管理力度。,12,第四、金融服务公司都希望能充分利用各种服务交付渠道的

5、海量客户数据,开发新的预测分析模型,实现对客户消费行为模式进行分析,提高客户转化率。第五、在巴西、中国和印度等后发展中市场,经济和业务增长机会正在超越欧洲和美国,大量投资被投放到本地和云数据处理基础设施中。第六、“大数据”在存储和处理框架两方面的优势将帮助金融服务企业充分掌握业务数据的价值,降低业务成本并发掘新的套利机会。第七、面对“大数据”所带来的不断增加的数据量要求,需要对传统的数据传输工具ETL(提取、转换和加载)流程进行重新设计。,13,第八、大量历史客户支付行为数据的信用风险预测模型正在零售与公司贷款催收中得到大量应用,通过该技术,银行可以通过对不同客户违约和还款资料进行分析,对催收

6、次序进行优化。第九、随着以平板电脑和和智能手机为代表的移动应用和互联网工具的迅速普及,技术基础设施和网络在对不同来源、不同标准数据进行处理、编索和整合方面的压力不断增大。第十、“大数据”推动了对数据处理算法的需求,提出对数据安全和访问控制的重视,并可有效降低对现有系统的影响。,14,15,无所不在的数据(3),在超市中,数据通过条码扫描机获得。这样的“购物蓝”数据库由大量的交易记录组成。RFID技术与物联网应用,什么是物联网?,全面感知,可靠传输,智能处理,利用RFID、传感器、二维码等能够随时随地采集物体的动态信息。,通过网络将感知的各种信息进行实时传送。,利用计算机技术,及时地对海量的数据

7、进行信息控制,真正达到了人与物的沟通、物与物的沟通。,物联网的大数据挑战,物联网不仅仅是传感器,物联网是提供支撑智慧地球的一个基础架构,物联网的存在使这种基于大数据的采集以及分析变成了一种可能,这面临着三项挑战。物联网的边缘计算。物联网的中间件。 物联网的运营管理平台。,17,18,无所不在的数据(4),到2020年,北斗卫星导航系统将拥有35颗卫星(已发射16颗),形成覆盖全球的卫星网络,九省示范应用,LBS。,全球四大卫星导航系统北斗卫星导航系统美国的GPS俄罗斯的格洛纳斯欧盟的伽利略系统,北斗“三步走”的发展战略,19,GEO(Geosynchronous Eearth Orbit):地

8、球静止轨道卫星IGSO(Inclined Geosynchronous Satellite Orbit): 倾斜轨道同步卫星MEO(Medium Earth Orbit):中高轨卫星,大数据与北斗系统,把短信和导航结合,是中国北斗卫星导航系统的独特发明。北斗卫星导航系统的应用目前逐渐形成规模化、标准化的趋势,已向民用用户全面开放,成功应用于个人位置服务、气象应用、交通管理、运输管理、应急救援、精密授时、精细农业等多个行业。近期,东南亚四国(泰国、老挝、文莱缅甸)都于中国政府签订协议,采用我国的北斗导航系统,同时中国与巴基斯坦有望在近期签订北斗系统合作协议,成为第五个使用北斗导航的国家。,20,

9、21,无所不在的数据(5),生物信息学(人类基因组计划)神经信息学(人类脑计划),生命科学的大数据时代来临,要解决当前生命科学的问题,需要从时空状态对生老病死进行解读,这就需要大数据,这种大数据揭示的就是大科学,这种大科学就是人类发展史上最大的产业。生命科学已进入大科学、大数据时代,基因资源是源头。如何去储存这些资源,为未来研究的使用提供基础成为一个关键问题。为了适应更庞大数据存储、处理、分析与应用的要求,深圳华大基因研究院还和国家超算天津中心、深圳超算中心、广州超算中心等机构展开战略性合作。下一步,将通过云计算的模式来组织存储和处理相关数据。,22,23,无所不在的数据(6),网络大数据,网

10、络数据即使不是最原始的大数据源,也是使用最广泛、认可度最高的大数据源。网络数据是指用户浏览万维网所产生的日志信息,是等待分析和挖掘的信息宝库。横跨于大量不同行业中的企业组织已经把那些来自于网站的详细而又处于客户层面的行为数据源整合入它们自身的企业数据分析环境中。,24,大数据(Big Data),数据不仅在“量”上疯狂的增长着,在“源”上也不断的丰富着。世界上产生的数据,有近 80% 是由个人用户产生的;据估计,到 2020 年全球将有 500 亿个设备连入网络,地理位置、网络浏览行为、健康数据、甚至基因信息等,都成为技术为个体服务的有效资源,这也意味着商家对每一个用户都将有精准的了解,真正做

11、到与客户的“零距离”接触。正是这种巨大的商业利益的驱使,使得大数据成为国际一流企业竞相投入使用的竞争利器。,25,大数据现象,An Everest Sized Opportunity!,26,KMGTPEZYK Kilo 1K字节 = 1, 024字节M Meg 1M字节= 1, 048, 576字节G Giga 1G字节 = 1, 073, 741, 824字节T Tera 1T字节 = 1, 099, 511, 627, 776字节P Peta 1P 字节= 1, 125, 899, 906, 842, 624字节E Exa 1E字节 = 1, 152, 921, 504, 606, 84

12、6, 976字节 Z Zetta 1Z字节 = 1, 180, 591, 620, 717, 411, 303, 424字节 Y Yotta 1Y字节 = 1208, 925, 819, 614, 629, 174, 706, 176字节,容量单位:从K到Y,数据存储单位及换算关系,27,产业界与学术界的关注,麦肯锡咨询公司“大数据”研究报告“Big data: The next frontier for innovation, competition, and productivity” McKinsey Global Institute, May 2011.,28,高德纳(Gartner)

13、研究与顾问咨询公司,产业界与学术界的关注,Data are becoming the new raw material of business: an economic input almost on a par with capital and labor. 数据正逐渐变成商业所需的原材料之一:一项几乎和资本或劳力一样重要的经济原料。(Feb. 27th, 2010),29,产业界与学术界的关注,20世纪大萧条以来,美国作为世界强国的开放历史,数据技术浪潮的兴起过程,气势磅礴,波澜壮阔。美国政府为什么能,中国到底缺什么?“大数据”之“大”,并不仅仅在于“容量之大”,更大的意义在于:通过对海量

14、数据的交换、整合和分析,发现新的知识,创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”。,30,2012-7,产业界与学术界的关注,大数据是人们获得新的认知,创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。大数据的核心就是预测。三个转变。更多:不是随机样本,而是全体数据更杂:不是精确性,而是混杂性更好:不是因果关系,而是相关关系,31,2013-1,产业界与学术界的关注,本书主要介绍了如何驾驭大数据浪潮,并详细地介绍了什么是大数据,大数据为什么重要,以及如何应用大数据。本书还从具体实用的角度,介绍了用于分析和操作大数据的工具、技术和方法;以及人才和企

15、业文化的角度,介绍了如何使分析专家、分析团队以及所需的分析原则更加高效,如何通过分析创新中心使得分析更加有创造力,以及如何改变分析文化。,32,2013-1,产业界与学术界的关注,爆发:大数据时代预见未来的新思维。巴拉巴西的研究是在人类生活数字化的大数据时代基础上进行的,移动电话、网络以及电子邮件使人类行为变得更加容易量化,将我们的社会变成了一个巨大的数据库。巴拉巴西揭开人类行为背后隐藏的模式“爆发”,提出人类日常行为模式不是随机的,而是具有“爆发性”的。,33,2012-6,新信息世界观:物理世界、信息世界、人类社会组成三元世界,34,大数据,共生智能系统中的数据、信息与知识管理,组织与社群

16、:人类集体智能决策与问题求解,扩展的计算机网络系统:人工智能数据加工平台,可感知的环境与物品:周遭智能(AmI)感知与执行终端,数据、信息、知识流转,共生智能系统:综合集成,共同解决现实的复杂问题,“大数据”对社会发展的影响,科学研究第四种范式公共管理智慧城市工业生产与商业经营大数据产业链与商务智能,36,第四种范式,观察与经验描述与实验、理论建模、仿真与计算等科研模式之后,当代又出现了数据密集型的科研范式。 微软公司于2009年10月发布了The Fourth Paradigm: Data-Intensive Scientific,首次全面地描述了快速兴起的数据密集型科学研究。“The Ne

17、xt Science Revolution”,Harvard Business Review,November 2010,37,第四范式:数据密集型的科学发现中文版图书,科学正在进入一个崭新的阶段。在信息与网络技术迅速发展的推动下,大量从宏观到微观、从自然到社会的观察、感知、计算、仿真、模拟、传播等设施和活动,产生出大量科学数据,形成被成为“大数据”(BigData)新的科学基础设施。,38,2012-10,39,自然科学大数据专刊,40,2011年2月11日出版的科学杂志刊登专题数据处理,2008年9月3日出版的自然杂志刊登专题大数据,公共管理智慧城市建设愿景,“智慧城市”系统体系结构,智慧

18、城市的三个空间理论,43,城市管理是个复杂学科,智慧城市建设是一项复杂的系统工程。对智慧城市的建设应该同时着眼于三个空间的整体。,大连建设智慧城市的总体思路,44,基础设施智能化、产业发展现代化、公共服务普惠化和运营管理精益化,大数据产业链,大数据产业相关企业经济活动包括:用以实现大数据存储、检索、处理、分析、展示的相关IT硬件与软件的生产、销售和租赁活动,以及相关信息服务。可分为三个方面:(1)用以搭建大数据平台、实现大数据组织与管理、分析与发现的相关IT硬件与软件的生产、销售和租赁活动;(2)大数据平台的运维与管理服务,系统集成、数据安全、云存储等解决方案与相关咨询服务;(3)与大数据应用

19、相关的数据租售业务、分析预测服务、决策支持服务、数据分享平台、数据分析平台等。,45,大数据产业链,46,47,大数据的典型特征(3V),大数据的价值(Value),大数据将引发新的“智慧革命”:从海量、复杂、实时的大数据中可以发现知识、提升智能、创造价值。有了云计算、物联网,但缺乏大数据分析处理的核心技术,智慧城市的“大脑”就不够发达,“智商”就不够高,能力就不够强。,广义的大数据,50,商务智能与数据科学,目前决策制定者正在被大量的数据淹没,数字信息从各种各样的传感器、工具和模拟实验那里源源不断地涌来,令企业的组织能力、分析能力和储存信息的能力捉襟见肘。 正如麦肯锡的报告揭示的那样,商业管理作为科学的一个特性正在越来越凸现出来。,51,决策需要信息与知识,52,商务智能,商务智能的前世今生,起源:从数据到知识的挑战和跨越结蛹:数据仓库之厚积薄发蚕动:联机分析之惊艳破茧:数据挖掘之智能生命的产生化蝶:数据可视化的华丽上演,54,55,谢 谢 !,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号