医疗大数据的应用.ppt

上传人:小飞机 文档编号:5246612 上传时间:2023-06-18 格式:PPT 页数:29 大小:2.95MB
返回 下载 相关 举报
医疗大数据的应用.ppt_第1页
第1页 / 共29页
医疗大数据的应用.ppt_第2页
第2页 / 共29页
医疗大数据的应用.ppt_第3页
第3页 / 共29页
医疗大数据的应用.ppt_第4页
第4页 / 共29页
医疗大数据的应用.ppt_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《医疗大数据的应用.ppt》由会员分享,可在线阅读,更多相关《医疗大数据的应用.ppt(29页珍藏版)》请在三一办公上搜索。

1、医疗大数据的应用,2,议程,医疗与大数据的趋势,什么是医疗大数据?大数据面临的挑战如何管理和利用大数据案例分享总结与展望,3,议程,医疗与大数据的趋势,什么是医疗大数据?大数据面临的挑战如何管理和利用大数据案例分享总结与展望,4,趋势分析:我们正处在医疗行业的一个重要转折点,医疗费用在不断上升GDP的占比非常高,Source:U nited Nation s“Po pulati on Agi ng 200 2”,25-29%,30+%,20-24%,10-19%,0-9%,%o f popu lation over age 60,2050WW Average Age 60+:21%,全球老龄化

2、 平均年龄60+:目前的10%,到2050年将达到20%,以美国为例:医疗大数据的价值3千亿美元/年,相当于每年生成总值增长0.7%,5,趋势分析:我们正处在医疗行业的一个重要转折点,0,5000,10000,15000,201020112012201320142015,存储的增长医疗服务产生的数据总量(PB),Admin Imaging EMREmail FileNon Clin Img Research,医疗影像归档一个医疗系统案例的数据,到2020年,医疗数据将急剧增长到35 Zetabytes,相当于2009年数据量的44倍增长,6,议程,医疗与大数据的趋势,什么是医疗大数据?大数据面

3、临的挑战如何管理和利用大数据案例分享总结与展望,7,医疗大数据简介,1.制药企业/生命科学,3.费用报销,利用率 和 欺诈监管,2.临床决策支持&其他临床应用(包括诊断相关的影像信息),4.患者行为/社交网络,数据来源包括哪些?,我们如何利用大数据创造价值?(示例),1.个体化医疗,3.欺诈监测得以加强,2.临床决策支持,4.由生活方式和行为引发的疾病分析,8,医疗大数据相关解决方案,分布式平台,存储优化,安全和隐私,影像数据处理加速,新兴的医疗服务 应用,个体化医疗,临床决策支持,肿瘤基因组学,健康信息服务,基础医疗服务,个人健康管理,老龄社会,数据分析及 视觉化处理,类SQL的检索,医疗影

4、像分析,机器学习,数据处理/管理,医疗影像,医疗记录,基因数据,9,议程,医疗与大数据的趋势,什么是医疗大数据?大数据面临的挑战如何管理和利用大数据案例分享总结与展望,10,大数据的挑战不仅来自于数据量的增长.需要新技术的支持,检验结果,费用数据,影像,设备产生的感应数据,基因数据等,数据量,结构化数据,遵循标准的数据标准(如,HL7)非结构化数据,如口述、手写、照片、影像等,类型,在传统的解决方案之上,引入新的数据及分析模型和技术,实时有效的商业价值,基于现有数据库中的数据进行分析,来支持不同种类的业务:如 费用及报销、患者病史、归档影像分析、实时临床决策支持(数 据分析),价值,实时数据分

5、析,而非传统的批量处理分析 数据以流的方式进入系统,进行抽取和分析 对于实时运行中的每个时间节点产生影响,而不是事后处理,速度,11,议程,医疗与大数据的趋势,什么是医疗大数据?大数据面临的挑战如何管理和利用大数据案例分享总结与展望,12,关注数据的价值,数据源文本-语音-视频-传感器 Requesting Or M2M通讯批量 商业应用,传统解决方案 环境ERP,CRM,Batch,OLTP-DB,边缘服务器(Edge),大数据存储的考虑传统存储方式 大规模数据分析 Hadoop*海量数据库 Hive*大规模备份 Lustre*,丰富的视觉化效果 安全的数据分析和缓存,分析 同步 端到端Ma

6、chine-to-Machine Source-to-Source,13,关注数据的价值,数据源文本-语音-视频-传感器 Requesting Or M2M 通讯批量 商业应用,传统解决方案 环境ERP,CRM,Batch,OLTP-DB,边缘服务器(Edge),Data Center ProvisioningDiscrete VirtualCloud As A Service HPC,大数据存储的考虑 传统存储方式 大规模分析 Hadoop*海量数据库 Hive*大规模备份 Lustre*,丰富的视觉化效果 安全的数据分析和缓存,分析 同步 端到端Machine-to-Machine Sou

7、rce-to-Source,14,大数据解决方案的部署方式(参考),企业级数据仓库,电子表格,视觉化工具,数据挖掘,集成开发工具,ODS&数据集市,企业应用工具,传统的文件格 式,日志,社交&网络,遗留系统,结构化,非结构化,录音文件&笔记等,数据平台,关系型数据库,No-SQL,内存数据库,SQL,应用,Node,Node,Node,Hadoop*,Web Apps MashUps,IMPORT,INSIGHTS,CONSUME,Create Map,REDUCE,18,大数据解决方案的整体框架架构,Data as a Services,BI&Predictive AnalyticsExis

8、ting BI/Analytics with in-databasedata processing support,Medical Devices,Data Velocity,Data Volume and Quality,Integrated Analytics with Hadoop Support,Integration Tools,Distributed High Performance Data ProcessingHadoop*MapReduce,Data ingestion,Integration and Processing Services,MPP DatabasesDW A

9、ppliances,Databases DBMS/NoSQL,Custom Analytic SolutionsMapReduceTextual AnalyticsStreaming Analytics,10GBeFast Fabric,Vertically Integrated Software IntelAIMSuite,NLP/Semantic Search/Machine Learning Knowledge Management,Data Vulnerability,HPC/TCP MIC,NAS-SAS and Distributed Storage,Data Access Use

10、r Authentication,Data Characteristics,DistributedVirtualPersistenceEvent,Message Real-Time,Cached,Federated EDW,Marts,Data Visibility,CloudProvisioning Models-Storage&Connectivity Considerations,Data SourcesText,Video,SecurityServices Privacy Compliance,HumanGenome&Drug Discovery,GIS,Surveillance an

11、dMedical Device Streaming Data,DiagnosticImages,SocialMedia,MedicalRecords,LogFiles,and Audio,Provisioning Models,Can Vary by Data,Characteristics,16,高效的大数据访问途径(客户端),“Know Me”“Free Me”“Express Me”,“Link Me”,17,大数据在中国医疗行业中的应用模式,1.制药企业/生命科学,3.费用报销,利用 率和欺诈监管,4.患者行为/社交 网络,2.临床决策支持&其他临床应用(包 括诊断相关的影像 信息),

12、药品研发对药品实际 作用进行分析;实 施药品市场预测基因测序分布式计算加快基因测序计算 效率,临床数据比对匹配同类型的病人,用药临床决策支持 利用规则和数据实时分析给出智能提示,公共卫生实时统计分析 发现公共卫生疫情及公民健康 状况新农合基金数据分析 及时了解基金状况,预测风险 辅助制定农合基金的起付线,赔付病种等基本药物临床应用分析分析基本药物在处方中的比例,远程监控 采集并分析病人随身携带仪器数据,给出智能建议人口统计学分析 对不同群体人群的就医,健 康数据实施人口统计分析了解病人就诊行为 发现病人的特定就诊行为,分配医疗资源,18,议程,医疗与大数据的趋势,什么是医疗大数据?大数据面临的

13、挑战如何管理和利用大数据案例分享总结与展望,19,案例分享:Regional Health Info Network ChinaReal-time Clinical Decision Support,实时的医疗数据处理(电子健康档案,医 疗影像数据),支持医疗协同、临床决策 支持和公共卫生管理采用 Hadoop*(HBase*/Hive*)来实现医 疗数据分析和处理未来将扩展到不同领域、不同区域/地区(包括数据交换、处理和分析)与本地的软件厂商及OEM厂商进行了广泛 合作技术挑战,Hadoop(HBase/Hive)与传统关系型数据 库如何有效结合大数据在区域卫生信息平台中的切实可行 应用场景

14、,Public Health,Hospital,Primary care(Grassroots),Ancillary Data&Services,Health Information DW,EHRData&Services,Registries Data&Services,Longitudinal Record Services,Health Information Access Layer,Care Coordination Clinical decision support,Data Analytic R&D,RHIN,20,区域医疗及基层医疗信息系统大数据解决方案,分布式数据服务系统,展

15、现层(报告,视图),集成的用户应用界面(居民、医生、卫生行政管理人员),数据挖掘(Mahout),分布式批量处理框架(Map/Reduce),协作 服务(Zookeeper),结构化数据采集器(Sqoop),日志数据采集器(Flume),分布式文件系统(HDFS),区域卫生信息访问层(HIAL),医院信息系统,医院信息系统,实时数据库(Hbase),语言和编译(Hive),基层医疗信息系统,新农合医疗保 险,服务器虚拟化,基础设施虚拟化网络虚拟化存储虚拟化,基于云的区域基层医疗服务系统多租户应用,健康档案数据存储,公共卫生医疗服务运营管理药品管理,21,Sequencing,3 Billion

16、 Base Pairs,Data Processing Cloud Storage VisualizationMillions of Variants,Interpretation&Analytics,Millions of Variants Millions of Patients,CommercializingTargeted Therapeutics Companion DiagnosticsActionable Biomarkers,案例分享:NEXTBIO基因数据分析,Cost to sequence a genome has fallen by 800 x in the last

17、4 yearsEach genome has 4 million variantsGrowth in the genomics data in the public and private domainData available in variety of sourcesStructured,semi-structured,unstructuredNew aggregated data growing exponentially,22,案例分享:NEXTBIO病人相关性数据,Novel DiscoveriesBiomarkers Disease Mechanism Drug Indicati

18、onsClinical Trial Parameters Patient Care Options,Large content repository of public and private genomic data combined with proprietary and patented correlation engine,23,案例分享:Kaiser Permanente 大数据应用,24,数据的发展趋势,Kaiser的数据中,90%是非结构化的(80%的EHR和影像数据)在未来十年,数据将会有25 倍的增长(One exabyte by 2020)主要的数据 增长 来自于 非结构

19、化数据(医疗影像,视频,文本,音频等)信息 给 实时个性化医疗服务带来了可能性(Requires Contextual device,environment,spatial,Demographics,Social and Behavioral profiles in addition to medical information)Kaiser 正在评估大数据相关技术,结构化数据,80%非结构化数据,全世界 80%的数据是非结构化的(大量的移动 终端设备,机器产生的数据)在未来十年,数据将迎来 44 倍的增长(35zettabytes by 2020)主要的数据 增长 来自于 非结构化数据(在线

20、 的归档数据,医疗影像,在线视频和存储,照 片等)信息 给各行业发展带来了新一轮的机遇(零售,金融,保险,制造,医疗,)各行业已经开始采用 大数据技术 用于信息提 取,全球数据的构成,结构化数据,Kaiser的数据构成90%非结构化数据,25,数据平台计算的趋势分布式计算,Discontinuous Change,SAN/NAS,Master,Slave(s),Data is distributed across processing slave nodes,Resources containing data are not shared,Master manages the data dis

21、tribution,job scheduling across slave nodes and aggregating result sets,Integrate built/bought Real-time Predictive Analytical Solutions or Processing logic,SMP(5$),MPP(10$),In-Memory(50$),SAN/NAS,SAN/NAS,Share-Nothing Distributed Storage and Compute($)Fault-tolerant MasterSlave Architecturecapable

22、of withstanding partial system failures,DAS,SAN/NAS,SMP(Disk Caching,High Speed Network)(10$),Kaiser is looking to exploit this capability,Structured,Relational Tabular DataInteractive Query SupportReal-time AnalyticsSQL Transaction Data,Unstructured,Non-tabular DataRich Ad Hoc IntegrationReal-time

23、AnalyticsUQL ALL Data,26,大数据平台需求分析,Ingestion(Data Model,Metadata Reference Data,Store),Integration(Alignment,Semantics,Completeness,Quality),Interrogation(Clustering,Statistical,Quality,Semantics),Information(Standard&Ad Hoc reporting,Query,Alerts,Forecasting,Access),数据量(Sensors,EMR,Claims,Pharmacy,

24、Images),类型(Structured,Text,Unstructured,Documents,Images),处理的特性 Intuition(Simulation,Optimization,Stochastic Optimization),A unified information storage methodologyenabling users to manage data from ALL sources.,A portfolio of tools to manage(profile,cleanse,classify,synchronize,aggregate,integrate,

25、share)ALL types of data.,Support current BI tools focused on structured information.Build/buy packaged unstructured data processing and analytics tools.,Ability to model information and transition from multiple access methods to generating,sharing,collaborating and acting on insights anytime,anywher

26、e on any device.,速度(SLAs,Real-time Decision Support&Contextual Intelligence),Information drives process optimizations with strategic impact.Modeling business intuition from data deluge.,数据的特性,27,大数据 界定的标准,DATA SIZE,DATA TYPE,DATA CLASS,DATA CATALOG,DATA VELOCITY,DATA ACCESS,DATABASE TYPE,SERVER ARCH

27、ITECTURE,STORAGE ARCHITECTURE,Gigabytes,Terabytes,PetabytesStructured,Semi-Structured,Unstructured Human Generated,Machine Generated Text,Image,Audio,VideoBatch,StreamingAnalytics,Search,Transaction(ACID,BASE)Relational,File Based,Columnar,NoSQL,Document,Graph,RDF,SMP,MMP,Distributed Processing,NAS,

28、SAN,Direct Access Storage,Spinning Disks,Flash,SSD,FRAMEWORKS,Financial,Computer Vision Engine,Geospatial,Machine Learning,Mathematical,Natural Language Processing,Neural Networks,ANALYTICS,Statistical Modeling,Time-Series Analysis,Voice Engine Standard Reporting,Ad hoc Reporting,Query/Drill downs,Alerts Forecasting,Simulations,Optimization,Stochastic Optimizations,DISTRIBUTED PROCESSING,Appliance,Commodity Cluster(CC)1K nodes,28,议程,医疗与大数据的趋势,什么是医疗大数据?大数据面临的挑战如何管理和利用大数据案例分享总结与展望,29,总结,我们正处在医疗行业大数据 和分析的一个重要转折点,我们需要让大数据更为高效,可以便捷的访问 专注在创新,依赖产业链来 提供企业核心能力之外的服 务 采用标准和最佳实践,参考 全球已有的成熟模型,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号