《SAP化数据为力量课件.pptx》由会员分享,可在线阅读,更多相关《SAP化数据为力量课件.pptx(40页珍藏版)》请在三一办公上搜索。
1、,化数据为力量 新思维、新技术、新应用,Public,化数据为力量 新思维、新技术、新应用Public,关键词:速度,关键词:速度,关键词:速度,移动通信网络的进化:,2G时代 3G时代 4G时代,移动设备的进化:,关键词:速度移动通信网络的进化:2G时代 3G时代,大数据时代下,数据分析创新的起点也在于速度,SAP的创新技术平台HANA基于内存计算的高性能实时数据平台,基于磁盘的传统数据库,SAP HANA,传统,未来,大数据时代下,数据分析创新的起点也在于速度SAP的创新技术平,SAP HANA高速的原理,磁盘存储,分区,仅插入增量数据,压缩,列存储,内存处理,CPU,I/O 瓶颈,传统数
2、据平台,SAP HANA,SAP HANA高速的原理磁盘存储日志与备份分区仅插入增量数,HANA,SAP HANA内存数据库一体机是实时应用平台和数据库平台,实时计算没有延迟的业务分析处理迅捷多处理器,海量内存实时的计算引擎支持ERP简单易用预装的设备内置BAE (业务分析引擎)支持开放标准ANSI 92 SQL MDX, JDBC/ODBC,软件内存计算引擎/内存数据库实时数据管理平台,+,硬件认证的硬件系统*X86/SUSE Linux,HANASAP HANA内存数据库一体机是实时应用平台和数,为什么SAP HANA不仅是内存数据库?,SAP HANA的优势特性:内存计算实时处理预测分析
3、库文本处理空间计算业务分析库开放的架构操作维护简单多种创新应用,为什么SAP HANA不仅是内存数据库?支持任何设备任何应用,SAP五大产品战略,应用程序,移动技术,商务分析,云计算,数据库技术,Powered by SAP HANA实时高性能计算平台,HANA是SAP各大产品线的创新平台!,SAP五大产品战略应用程序移动技术商务分析云计算数据库技术P,过去传统数据分析技术,Cube,ETL,操作型数据存储(ODS),索引压缩分区,查询结果,计算引擎,查询,聚合,决策者获取商务智能,企业应用系统中的数据,从生成数据到用于分析之间存在延迟架构复杂导致建模成本高性能优化方式复杂多维Cube数据冗余
4、抽取时间长,基于HANA的商务智能新架构,过去CubeETL操作型数据存储(ODS)复制索引压缩分,基于HANA的商务智能,分析速度极速提升,每年50万商品门店8000家每月300家门店调整,4小时-6秒,在SAP HANA支持下,8 秒,快8,100倍,18 小时,在SAP HANA之前,案例1,案例2,案例3,基于HANA的商务智能,分析速度极速提升每年50万商品4小时,拉夏贝尔:HANA对比结果,应付暂估内部供应商查询,查询范围,原来需,公司:1000范围:7天,6640秒1.9小时,公司:1000范围:30天,出不来,所有公司范围:2个月,出不来,所有公司范围:1个月,出不来,2天完成
5、这个场景的HANA建模+BI展现计算涉及数据量表 = 8千万HANA总体时间不呈线性增长建议:大输出报表可以考虑用后台模式,然后保存成在BO的Cache中(邮件通知),公司:1000范围:15天,出不来,拉夏贝尔:HANA对比结果应付暂估内部供应商查询查询范围原来,安踏:使用HANA后的提升(工厂库存分析),工厂库存数据(141,881,431 条)在限制库存不为零的条件下,3.515 秒展现数据结果,安踏:使用HANA后的提升(工厂库存分析)工厂库存数据(14,基于HANA的SAP Business Suite (SoH)新架构,方案说明SUITE ON HANA(SOH),HANA作为SA
6、P商务套件(ERP/CRM/SRM/SCM/PLM) 的后台数据库,为ERP提供内存的数据存储和数据处理功能利用HANA的高性能,将复杂计算下沉到HANA层面,目前支持进400项的专有优化HANA Live提供ERP各模块的预制模型,简化模型开发SAP商务智能套件BO可直接访问HANA底层数据模型,真正实现OLTP和OLAP的结合,基于HANA的SAP Business Suite (SoH,上好佳快速消费品 SAP ERP数据库迁移,解决方案SAP ERP powered by SAP HANA业务挑战财务月结周期过长:每家分公司月结需要2天,且6家分公司的月结无法并行操作。集团合并报表的出
7、具时间相应滞后。在月结期间,会锁定系统中的单据,严重影响业务部门的正常运作。业务报表查询效率低下、相应速度慢。用户往往需要缩短查询时间跨度,手动合并查询结果,造成用户对系统满意度不高。解决方案优势迁移到SAP HANA数据库之后,大大优化了系统中的性能瓶颈。且可利用ERP的HANA数据库,快速构建BI分析数据集市。实现了交易(OLTP)与分析(OLAP)一体融合,大大缩短企业数据的使用周期。,24倍财务月结执行加速,5400倍业务分析报表查询性能,3.5倍ERP数据库数据压缩,客户名称上好佳(中国)有限公司公司网站www.oishi-公司简介“上好佳(中国)有限公司”系菲律宾LIWAYWAY公
8、司在中国投资的外商独资企业,1993年落户于上海。是集研发、生成、物流、销售、服务、管理为一体的大型知名跨国集团型企业,集团旗下国内拥有十余家生产基地,发达的销售网络体系,已成为国内休闲食品行业中的领航者之一。营业收入:20亿 RMB员工数量:8,000,上好佳快速消费品 SAP ERP数据库迁移解决方案24,SAP HANA还能如何应用?,“肩并肩” 的场景,HANA加速器,HANAplatform(数据集市),HANAapps for Suite(包括:报表 & 分析),Cloudon HANA,实时分析,1,2,3,SAP HANA还能如何应用?“肩并肩” 的场景HANA R,HANA创
9、新应用 SAP Match Insights,SAP与德国足协合作,基于SAP HANA平台推出SAP Match Insights足球解决方案,协助德国国家足球队竞逐2014年巴西世界杯。该方案在全景视频基础上实时追踪了所有场上球员的信息,令一些关键比赛指标得以精确计算与战略评估,例如控球率,防守范围,防守空挡等,使得教练可以及时发现漏洞,调整战术等。世界杯结束后开始转“民用”,预计Q4完成产品化,HANA创新应用 SAP Match Insights,HANA创新应用 SAP Match Insights,HANA创新应用 SAP Match Insights,SAP HANA,sdf,业
10、务场景优化以及行业应用,Suite on HANA 正在实施的项目,BW on HANA新上线的场景,500+,200+,160+,Suite on HANA,2014年1月,SAP HANA 的一些数据,SAP HANAsdf 7,600+ 50 100,国内零售与快销品行业的HANA用户,国内零售与快销品行业的HANA用户,关键词:深度,集体洞察力,预测&行动,感知 & 响应,数据分析应用的深度越深,竞争优势越明显,关键词:深度原始数据已清洗数据标准报表即席报表与多维分析敏捷,金融、零售、电商等服务业的营销模式正在从基于经验推送的传统模式演变为基于大数据的实时互动模式,响应速度慢成本高成功
11、率低客户体验差,无法实现,基于经验,基于大数据分析,单向推送,实时互动,营销建模的效率提高5倍以上更深刻地了解客户行为(从业务规则模型到大数据分析模型)自主的、工厂化的高质量建模,速度快成本低成功率高客户体验好,金融、零售、电商等服务业的营销模式正在从基于经验推送的传统模,零售行业营销活动设计常有:优惠打折、赠送礼品、多倍积分等,通过不同的细分客户群有针对性地开展不同的营销活动,并计算不同群体及不同活动的投入产出比,便于后期不断优化数据挖掘规则。,零售行业营销活动设计常有:优惠打折、赠送礼品、多倍积分等,通,基于SAP InfiniteInsight ,利用大数据开展精准营销,数据仓库,生产系
12、统,Customer Data,DepositAccounts,OperationalDataStore,应用层(CRM, BI),Loans,Transactions,Profit,CustomerDataMart,Call Center,Direct Mail,Web,E-mail SMS,渠道,Contacts,Cards,OLAP Query & Reporting,报表平台,Track,Analyze,Plan,Excute,营销活动管理,Multi-channelInformationDelivery,BrokerageAccounts,数据挖掘,HANA,基于SAP Infini
13、teInsight ,利用大数据开展,SAP InfiniteInsight 架构,分析建模,计划刷新,数据准备,应用模型,ADS创作 数据映射及准备 文本分析,关联分析,虚拟市场营销,回归 关联 分群预测,产品展示 有针对性的广告 网站内容,在数据库运行的模型 (优化的SQL, 支持 HANA, Oracle, IQ, etc.)基于程序代码的模型(C+, PMML, Java, SAS, etc.),接收新数据自动优化模型自动应用新模型出错警报,SAP InfiniteInsight 架构分析建模计划刷新,InfiniteInsight的建模能解决什么问题?,分类 (Classificat
14、ion)谁在接下来的 (周 | 月 | 年) 是否 将 (购买 | 欺诈 | 流失 )?回归 (Regression)(销售额 | 流失客户数量) 在下(周 | 月.)将会变成 怎样?时间序列 (Time Series)(销售额 | 流失客户数量) 在下(周 | 月.) 在下来一年每个月的变化趋势是 怎样?推荐引擎 (Recommendation)在网页或零售店的客户提供商品推荐聚类分群 (Clustering)有多少个拥有相同(行为 | 属性 )的客户群组关联分析 (Social)分析相关关系来确定(社区 | 影响者),3种返回结果: 可能性 数值 组别,InfiniteInsight的建模
15、能解决什么问题?分类 (,零售与快消品行业的常见挖掘场景,销售预测区域经理负责管理位于许多国家大量的销售终端店面,他希望能快速随时可以制定出相应的销售策略以增加销售业绩. 销售终端店面的数据例如周期性销售KPI,员工数量,促销与折扣,销售能力,库存分布。 区域经理希望分析从2000年至今业务趋势,同时想做出未来一年的销售指标的预测。,客户分群负责一个国家所有连锁店的销售经理 已经最终确定3钟促销策略。 连锁门店的历史数据都已经齐备。经理希望把所有门店基于销售成交量,利润margin,门店规模,员工数量来分成3组,以便根据不同类型的分组应用相应的促销策略。,零售与快消品行业的常见挖掘场景销售预测
16、客户分群,零售与快消品行业的常见挖掘场景,客户流失分析 一位快消品企业的总经理正在面对一个严峻的问题,一定程度的老客户正不断的流失并转到竞争对手一方,影响到目前公司的营销业绩。 目前他拥有历史客户列表,他迫切想分析和了解为何客户会流失和转向竞争对手一方。 特别的,他想很快制定出一系列规则用以分析出目前客户列表中还有哪些存在流失的可能风险。,关联分析(购物篮)分析连锁门店拥有多年累积的历史客户列表 门店经理想知道和了解已经销售的产品中是否有一些相关性。 如果有任何相关性,他希望在产品销售过程中货架的布局和相应的绑定促销和推荐策略得以执行以提高销售业绩。,零售与快消品行业的常见挖掘场景客户流失分析
17、关联分析(购物篮),什么因素影响挖掘和预测在商业运营中的应用?,市场机会都“时不待我”即便在统计学家的帮助下,现有的工具从收集数据到生成可理解的知识也要花费数周你只能应用尖端技术与少数重要项目专业资源的稀缺性 你能等吗?,过于专业 你需要一名拥有博士学位的专家帮你应用现有的数据挖掘工具你能完全理解现有工具生成的长达50页的报告吗?分析专家都很繁忙,你很难让他空出充足的时间帮你建模,你能相信他吗?你如何能知道建立的模型应用的真实数据上时是可靠的? 只有长时间的经验才能让你对结果放心,如何部署?你需要程序员帮助你在现有的商业运作中部署模型应用现有的分析工具经常生成重复数据,浪费资源,整合效果不理想
18、,什么因素影响挖掘和预测在商业运营中的应用?市场机会都“时不待,SAP InfiniteInsight:业务用户主导分析过程,预处理-自动化模型性能验证-自动化最优模型搜索-自动化模型商业化解释-自动化,商业问题,选择变量,准备数据,建模,模型测试,理解,应用,选择商业问题最相关的变量,以适合算法需要,SAP:自动决定重要变量,多至几千个变量,用不同算法进行建模,选择不同的参数,SAP:结构风险最小化理论自动选优,准备数据:缺失值处理,异常值处理,函数变换,SAP:自动化预处理,统计专家,业务用户,成本:人力(PhD)+平均耗时:2-4周,SAP InfiniteInsight:业务用户主导分
19、析过程,轻松设置分析,选择属性,1,选择业务指标,2,排除一些属性,3,轻松设置分析选择属性1选择业务指标2排除一些属性3,无需猜测聚类数量,选择聚类集群数范围,无需猜测聚类数量选择聚类集群数范围,直观的模型报告,直观的模型报告,一键式部署,创建您的评分代码,一键式部署创建您的评分代码,案例:人口统计 年收入超过5万美元的人群特征,数据来源:美国人口普查抽样数据,涉及变量:年龄、职业、受教育水平、受教育年限、婚姻状况、工种、家庭关系、人种、性别、资本收益、资本损失、每周工作时长、种族、是否收入达到5万美元,案例:人口统计 年收入超过5万美元的人群特征数据来源:美,案例:人口统计 年收入超过5万
20、美元的人群特征,变量贡献:哪个变量与是否达到年收入5万美元关联性最大?,案例:人口统计 年收入超过5万美元的人群特征变量贡献:哪,案例:人口统计 年收入超过5万美元的人群特征,类别重要性:指定变量中哪些类别最有可能年收入超过5万美元?,案例:人口统计 年收入超过5万美元的人群特征类别重要性:,案例:人口统计 年收入超过5万美元的人群特征,决策树:快速应用模型作为判断依据,案例:人口统计 年收入超过5万美元的人群特征决策树:快速,案例:沃尔玛购物篮分析-对POS数据挖掘,设定最小支持度与最小信赖度两个阀值假设最小支持度min_support=5% 且最小信赖度min_confidence=70%
21、挖掘-算法-关联规则结果Support(尿布,啤酒)=5%且Confidence(尿布,啤酒)=70%在所有的交易纪录资料中,至少有5%的交易呈现尿布与啤酒这两项商品被同时购买的交易行为Confidence(尿布,啤酒)=70%于此应用范例中的意义为:在所有包含尿布的交易纪录资料中,至少有70%的交易会同时购买啤酒。若有某消费者出现购买尿布的行为,超市将可推荐该消费者同时购买啤酒,案例:沃尔玛购物篮分析-对POS数据挖掘设定最小支持度与,Large Retailer,SAP II Users by Division,SAP InfiniteInsight的优点,SAP InfiniteInsight的优点传统数据挖掘,