数据仓库和数据挖掘在医院信息系统中.doc

上传人:小飞机 文档编号:4264384 上传时间:2023-04-12 格式:DOC 页数:71 大小:195.50KB
返回 下载 相关 举报
数据仓库和数据挖掘在医院信息系统中.doc_第1页
第1页 / 共71页
数据仓库和数据挖掘在医院信息系统中.doc_第2页
第2页 / 共71页
数据仓库和数据挖掘在医院信息系统中.doc_第3页
第3页 / 共71页
数据仓库和数据挖掘在医院信息系统中.doc_第4页
第4页 / 共71页
数据仓库和数据挖掘在医院信息系统中.doc_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《数据仓库和数据挖掘在医院信息系统中.doc》由会员分享,可在线阅读,更多相关《数据仓库和数据挖掘在医院信息系统中.doc(71页珍藏版)》请在三一办公上搜索。

1、摘 要 随着信息化的迅猛发展,各医院都在建立自己的信息系统,数据库规模不断 扩大,复杂程度日益增加,从大量的数据中提取有用的信息供医院的决策服务就 显得尤为重要。 目前医院信息系统(HIS)的实现,绝大部分采用的是传统数据库技术,数据 处理以操作型处理为主,即联机事务处理(OLTP)。尽管产生了大量的业务数据, 但真正对决策有用的信息却很少,而且也造成了历史数据和当前数据、操作数据 和分析数据的利用与管理的冲突。为了解决这一问题,数据仓库技术应运而生。 北京肿瘤医院有其自身的特殊性,治疗上不同于其它医院,因此对于信息统 计、分析和管理决策上有其特殊要求。本论文以F在建设的肿瘤医院数据仓库为 例

2、,首先介绍了数据仓库(Dw)和数据挖掘(DM)在肿瘤医院应用课题的来源;其次, 阐述了数据仓库和数据挖掘的基本概念,数据挖掘的方法、算法,还有数据挖掘、 在线分析(OLAP)和决策支持(DSS)的差异。最后,介绍了肿瘤医院数据仓库建 立和应用的全过程。包括阐述了医院信息系统(HIS)的基本概念、医院分析数据 的历史方法及医院信息管理中存在的问题。肿瘤医院HIS数据库的结构设计,数 据仓库建立过程中的数据准备,数据仓库的架构、存储,维度和粒度设计,主题 抽取和确定,建立多维数据模型及多维数据分析,数据仓库和数据挖掘的主要功 能及医院实际应用。 关键词:医院信息系统;数据仓库;数据挖掘 Abstr

3、act With the fast development of informationtechnology,hospitals have established their own information systemsAnd the scale of database has been continuously extending andthe complexity been dramatically increasing since the daythe system was builtUnder this circumstance,to select the right informa

4、tion from a mass of data for thehospitalS decisionmaking is ofutter importance These days the traditional technique,namely Online Transaction Processing (OUTP),is the primary wayto realize theHospital Information System(HIS)Althou曲 a lot ofdata can be acquired by this way,few of them are useful for

5、making decisions WhatS more,in terms of utilization and management,it causes the confusion between historical data and current data and the conflict betweenoperation data and analysis data To solve this problem,the technology of Data Warehouse(DW)emerges as the times require Compared with other hosp

6、itals,Beijing Cancer Hospital has its ownparticularity, adopting different methods in treatmentsFor this reason,it has some specific requirements on the statistic,analysis and management of informationThis paper takes the data warehouse of Beijing Cancer Hospital,which is being established,as an exa

7、mple to introduce:firstly,the origin of Data Warehouse(DW)and Data Mining (DM)in the application subjects of the cancer hospital;Secondly,the fundamental concept of DWand DM,the method and arithmetic of DM,and the difference among DM,OLAP and DSS;lastly,the entire course about howthewarehouse was es

8、tablished and used,including the basic concept of HIS,the historical method of analyzing data, the problems involved in the management of information,the structure design of the warehouse,data preparation dudng the establishing period,the framework and storage of the DW,design of dimensionality and

9、granularity,abstracting and confirming subjects,building multidimensional data model and analyzing multidimensional data, themain function ofDW andDMand somepractical uses in hospitals KeyWords:Hospital InformationSystem;Data Warehouse;Data Mining 图21多维立方体9 图22企业中数据仓库结构10 图23大肠癌的决策树示意图13 图31 医院信息化的层

10、次20 图32医院HIS中四个表的关系图25 图33数据仓库所需要的4个表的关系27 图34费用随时间变化的过程图28 图35医院数据仓库的架构29 图36星型模型30 图37肿瘤医院多维立方体的关系图33 图38 多维数据分析33 图39费用分布图36 图310胃癌病人外科手术的术前准备天数36 图3,11 20012004病人数量的分析图38 图312多维立方体结构图38 图313所有诊断的费用分布39 图314树形显示的效果39 图315饼图显示效果40 图316病人职业构成40 图317 Analysis Services中的聚集41 图318决策树的树形表示方法42 图319决策树的

11、公式表示方法42 图320大肠癌术后决策树部分图45 11引言 本章主要是文献综述,并介绍了数据仓库、数据挖掘技术应用于肿瘤医院进 行的研究工作,最后给出论文的内容安排。 111文献综述 随着计算机应用的网络计算的发展,计算正向两个不同的方向拓展:一个是 广度计算,二是深度计算。广度计算是把计算机的应用范围尽量扩大,同时实 现广泛的数据交流。深度计算是人们对以往计算机的简单数据操作。目前,深度 操作己提出了更高的要求,希望计算机能够更多的参与数据分析与制定决策的工 作。传统的数据库技术是单一的数据库资源,它适合操作型事务处理,但分析型 处理(或信息型处理)能力较弱【2】。数据仓库(DataWa

12、rehouse。DW)的出现,将 操作型环境和分析型环境进行了分离,划清了数据处理的分析型环境与操作型环 境之间的界限,从而由原来的以单一数据库为中心的数据环境发展为一种以数据 仓库为中心的新的体系化环境【3】。 近十几年,随着科学技术飞速的发展,社会和经济都取得了极大的进步,与 此同时,在各个领域产生了大量的数据,如人类对太空的探索,银行每天的巨额 交易数据。显然在这些数据中的信息非常的丰富,如何处理这些数据得到有价值 的信息,人们进行了有益的探索。4】计算机技术的迅速发展使得处理数据成为可 能,这就推动了数据库技术的极大发展,但是面对不断增加的如潮水般的数据, 人们不再满足于数据库的查询功

13、能,提出了深层次的问题:能不能从海量数据中 提取信息或者知识为决策服务。仅就数据库技术而言已经显得无能为力了,同样, 传统的统计技术也面临着极大的挑战【51。这就急需有新的手段、新的技术来处理 这些巨量数据。于是,人们结合统计学、数据库、机器学习等技术,提出数据挖 掘(Data Mining,DM)来解决这一难题【6。 1111国内外现状 在国外,数据挖掘已经有不少成功案例。数据挖掘首先在金融、证券、电信、 零售业等数据密集型行业实施,因为这些行业信息化程度比较高,数据库中已经 保留了大量数据资源。例如,总部位于美国阿肯色州的世界著名商业零售连锁企业 沃尔玛(Wal Mart)的”尿布与啤酒”

14、的故事。沃尔玛拥有世界上最大的数据仓库 系统,通过数据挖掘工具,得到了一个意外发现:跟尿布一起购买最多的商品竟 然是啤酒。进一步的分析,揭示了隐藏在”数据关联”背后的行为模式,”啤酒与尿 布”的著名故事,可谓是数据挖掘产生巨大价值的经典案例。当企业拥有大量的数 据之后,如何从这些数据中”攥出油水”,才是企业信息化价值体现的最终目的。 有数据表明,进入二十世纪90年代,人类积累的数据量以每月高于15的速 度增加,如果不借助强有力的挖掘工具,仅依靠人的能力来理解这些数据是不可 能的。 数据挖掘的前景被人们普遍看好。国际知名调查机构Gartner Group在高级 技术调查报告中,将数据挖掘和人工智

15、能列为“未来三到五年内将对工业产生深 远影响的五大关键技术”之首,还将并行处理体系和数据挖掘列为未来五年内投 资焦点的十大新兴技术前两位【”。Gartner的调查报告预计:到2010年,数据挖 掘在相关市场的应用将从目前少于5增加到超过80。美国银行家协会预测数据 仓库和数据挖掘技术在美国商业银行的应用增长率是149。 与国外相比,国内对知识发现的研究较晚,而且较为分散,没有形成整体力 量。90年代,国家自然科学基金曾支持过对该领域项目的研究,但实际应用不多。 目前,国内的许多科研单位和高等院校竞相开展知识发现的基础理论及其应用研 究,这些单位包括清华大学、中科院计算技术研究所、空军第三研究所

16、、海军装 备论证中心等【81。其中,北京系统工程研究所对模糊方法在知识发现中的应用进 行了较深入的研究,北京大学也在开展对数据立方体代数的研究,华中理工大学、 复旦大学、浙江大学、中国科技大学、中科院数学研究所、吉林大学、北京理工 大学等单位开展了对关联规则开采算法的优化和改造;南京大学、四川联合大学 和上海交通大学等单位探讨、研究了非结构化数据的知识发现以及Web数据挖掘。 虽然国内有很多大学和研究机构从事数据仓库技术的研究,但到目前为止, 国内基本上没有成熟的数据仓库解决方案。在医疗行业的应用更是少之又少。 目前提供数据挖掘产品的厂商非常多,如著名的产品有SAS Enterprise Mi

17、ner、NCR Teradata Warehouse Miner、SPSS Clementine 70、IBM DB2 Intelligent Mine、SQL Server 2000数据挖掘组件、Oracle9i Data Mining、 CA C1everPath Predictive AnalysiS Server、DMiner等。这些产品各有特色: NCR、IBM、ORACLE等数据挖掘工具可以直接在数据库上进行挖掘;SAS提供了数 据获取、取样、筛选、转换工具来构造要挖掘的数据集;SPSS针对具体应用领域 推出了多个应用模版,以简化应用开发过程。 Microsoft将OLAP功能集成

18、到 Microsoft SQL Server 70中,提供可扩充的基于COM的OLAP接口。它通过一 系列服务程序支持数据仓库应用。数据传输服务DTS(Data Transformation Services)提供数据输入输出和自动调度功能,在数据传输过程中可以完成数据 的验证、清洗和转换等操作,Microsoft Office 2000套件中的Access和Excel 可以作为数据展现工具,另外SOL Server还支持第三方数据展现工具。 12数据仓库和数据挖掘在医院应用的课题来源 随着计算机技术的飞速发展和企业不断提出新的需求,传统的数据库技术以 单一的数据资源,即数据库为中心,进行事务

19、管理、批处理以及各种类型的数据 处理工作。不同类型的数据处理有着不同的处理特点,以单一的数据组织方式进 行组织的数据满足不了数据处理的多样化的要求,因此数据仓库技术应运而生。 数据仓库技术以传统的数据库作为存储数据和管理资源的基本手段,以统计分析 技术作为分析数据和提取信息的有效方法,它是诸多学科相互结合、综合利用的 技术。 北京肿瘤医院已经运行了医院管理系统将近5年的时间,积累了大量的数据, 还有其他的独立的信息系统的数据,比如(放射科、检验科、医疗保险),而这些 数据由于彼此独立并且成为历史,没有得到再利用。目前,有极少的医院能够整 合这些数据,充分利用。在此基础上,为了便于领导查询、分析

20、并支持决策,本 人在完成硕士论文期间提出了“数据仓库和数据挖掘在肿瘤医院中的应用”这个 研究题目,并在医院中也申请了“肿瘤医院数据仓库的建立和应用”研究课题。 本论文正是围绕着建立肿瘤医院数据仓库以及在此基础上的分析和数据挖掘 来讨论数据仓库技术及联机分析技术、数据挖掘技术的。 13论文的工作 本文研究的主要内容是首先以一、两个病种为例,从肿瘤医院现有的HIS数 据出发,探讨建立管理信息数据仓库(Data Warehouse)的方法;其次能够在此基 础上,开展单病种费用研究,使用新的费用管理指标,应用数据挖掘技术(Data Mining)中的粗糙集理论对过度诊断和治疗的识别问题进行试分析。本文

21、主要工 作包括以下几个方面: 数据预处理的研究 由于数据库系统所获数据量的迅速膨胀(已达G或T数量级),从而导致了现 实世界数据库中常常包含许多含有噪声、不完整、甚至是不一致的数据。显然对 数据挖掘所涉及的数据对象必须进行预处理。 数据预处理主要包括:数据清洗(data cleaning)、数据集成(data intergratiOn)、数据转换(data transformation)、和数据消减(data reductiOn) 数据仓库建立过程的多维分析的实现 本文介绍了利用微软的Analysis Services工具在已经进行整理的数据的基 础上建立一个数据仓库的过程,包括如何设计主题、

22、维度、粒度,对数据仓库进 行钻取、旋转等操作,如何存储数据仓库,以及如何用可视化工具进行进一步分 析的全过程。 数据挖掘的几个算法的尝试 在已有数据的基础上,找出一些完整的、有分析价值的数据,利用数据挖掘 中的一些算法如(决策树ID3算法、聚集、粗糙集中RSL语言)来对数据进行试 探性的数据挖掘。并用微软的Analysis Services中的数据挖掘模型来实现决策 树和聚集方法的数据挖掘,并得到有用的知识。 下一步工作的展望 由于时间和人力的原因,本文只能做些探讨性的分析和研究,整个工作尚不 能成为成熟的可应用于实际的工具。但本人已在医院中申请了这个项目的课题, 并已经被批准,并得到了院长、

23、科主任的高度重视。因此会在未来重点地研究, 并希望能够得到理想的效果。 此项工作与HIs的区别 联机分析技术(OLAP)就是对大量信息进行复杂分析操作和决策制定的软件系 统。为了提高效率和有效性,必须把分析型数据从事务处理环境中提取出来,按 照决策支持系统处理的需要进行重新整合,建立单独的分析处理环境。数据仓库 正是为了构建这种新的分析处理环境而出现的一种数据存储和组织技术。与HIS 不同之处在于,数据仓库是对历史数据的批处理操作、按照主题进行分解合并重 新组织,是深层次分析利用的基础。HIS主要作用是使让大量的日常业务(如挂号、 划价、收费、结算等等)电子化,以提高医院工作效率和工作质量。H

24、IS的应用是 面向联机事务处理(OLTP)。 14论文的组织结构 全文分为三章各章组织如下: 第一章,为引言,主要内容有研究的技术背景,本篇论文主要工作、组织结 构的介绍。 第二章,介绍了数据仓库的概念和体系结构;数据挖掘的方法、算法;多维 数据分析和数据挖掘与决策支持的联系与区别。 第三章,是对在肿瘤医院建立数据仓库全过程的详细描述,包括医院信息管 理系统的介绍和国内外的动态:医院分析数据的历史方法,存在的问题以及数据 仓库架构、数据存储、粒度和维度的设计、主体的提取和确定、数据仓库实现的 功能;数据挖掘的应用实例,有几种算法的演示和说明。 最后,为结束语包括了对上述论文的总结,和对下一步工

25、作的展望。 第2章数据仓库与数据挖掘 21数据仓库的定义 211数据仓库的定义 信息技术的不断推广应用,将企业带入了一个信息爆炸的时代。每同、每时、 每刻都有潮水般的信息出现在管理者的面前,等待管理者去处理、去使用。这些 管理信息的处理类型主要是对管理信息的处理类型,主要有事务型处理和信息型 处理两大类。事务型处理,也就是通常所说的业务操作处理。这种操作处理主要 是对管理信息进行日常的操作,对信息进行查询和修改,目的是满足组织特定的 日常管理需要【9。在信息型处理中管理者关心的是信息能否得到快速的处理,信 息的安全性能否得到保证,对信息作进一步的分析,为管理人员的决策提供支持。 例如,为决策支

26、持系统、经理信息系统、战略信息系统等提供信息分析的支 持。这种类型的信息处理在现代企业中的应用越来越广泛,越来越引起管理人员 的重视。管理信息的信息型处理,必须访问大量的历史数据才能完成;而不像事 务型处理那样,只对当前的信息感兴趣1。因此,在信息型处理中,产生了与操 作性处理所采用的传统数据库有很大差异的数据环境要求。 目前,数据仓库一词尚没有一个统一的定义,著名的数据仓库专家WHInmon 在其著作Building theData Warehouse)一书中给予如下描述:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate

27、)、相 对稳定的(NonVolatile)、反映历史变化(Time Variant)的数据集合,用于支 持管理决策。对于数据仓库的概念我们可以从两个层次予以理解,首先,数据 仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库; 其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组, 并包含历史数据,而且存放在数据仓库中的数据一般不再修改。 根据数据仓库概念的含义,数据仓库拥有以下四个特点: l、面向主题。操作型数据库的数据组织面向事务处理任务,各个业务系统之 间各自分离,而数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽 象的概念,是指用户使用数据仓库

28、进行决策时所关心的重点方面,一个主题通常 与多个操作型信息系统相关。 2、集成的。面向事务处理的操作型数据库通常与某些特定的应用相关,数据 库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数 据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数 据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。 3、相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要及时发 生变化。数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数 据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数 据仓库中一般有大量的查询操作,

29、但修改和删除操作很少,通常只需要定期的加 载、刷新。 4、反映历史变化。操作型数据库主要关心当前某一个时间段内的数据,而数 据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如丌始应用 数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历 程和未来趋势做出定量分析和预测【12】。 212数据仓库与数据库比较 从“库”到“仓库” 数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、 为了决策需要而产生的,它决不是所谓的“大型数据库”。那么,数据仓库与传 统数据库比较,有哪些异同呢, 如表21所示: 表21数据库和数据仓库的对比裹【13】 对比内容 数

30、据库 数据仓库 数据内容 当前值 历史的、存档的、归纳的、计算的 数据 数据目标 面向业务操作程序重复处理 面向主题域,分析应用 数据特性 动态变化按字段更新 静态、不能直接更新,只能定时添 加、刷新 数据结构 高度结构化复杂化和操作计算 简单适合分析 使用频率 高 中到低 数据访问量 每个事务之访问少量记录 有的事务可能需要访问大量记录 对响应时间的要求 以秒为单位计算 以秒、分钟甚至小时为计算单位 数据仓库的出现,并不是要取代数据库。目前,大部分数据仓库还是用关系 数据库管理系统来管理的。可以说,数据库、数据仓库相辅相成、各有千秋【l。 213数据仓库的体系结构 数据仓库的体系结构分为数据

31、获取层、数据存储层、数据挖掘层等多个部分。 1数据获取层 数据获取层把决策主题所需要的数据(当前的、历史的),从各种相关的业务 数据库或数据文件等外部数据源中抽取出来,进行各种必要的清洗、整合和转换 处理,再将这些数据集成存储到仓库中”。数据获取层在数据仓库的整体系统应 用中占有非常重要的地位。 2数据存储层 数据存储层以一定的组织结构存储各种主题数据。数据仓库包括多个主题, 一个主题的数据通常存储在一个数据库中,包括该主题的一些综合性表,如主题 中选择的事实表、维表,还有为数据挖掘生成的中间表等。 3数据挖掘层 数据挖掘层集成各种数据挖掘的算法,包含具有很强功能的数据挖掘工具, 可以提供灵活

32、有效的任务模型、组织形式,以支持各项决策的数据挖掘任务。 数据挖掘与数据仓库的概念是密不可分的,数据挖掘要求有数据仓库作为基 础,并要求数据仓库已经存有丰富的数据。数据挖掘比本文后面谈到的多维分析 更进一步。举例,假如以某类产品的销售情况为例,如果管理人员要求比较各个 区域某类产品销量在过去一年的情况,可以从多维分析中找答案。但是,如果管 理人员要问为何一种产品销量在某地区的情况突然变得特别好或不好,或者问该 产品在另一地区将会怎样,这些是用多维分析工具难以简单解决的问题,就需要 利用数据挖掘工具寻找回答。 在实旌智能化决策时,一般分为两个步骤:第一步实现数据仓库和多维分析, 构造智能决策的基

33、础,实现分析应用:第二步实现数据挖掘,再发挥智能化决策 的特色【l”。数据挖掘是数据利用价值的再发现,它突破了传统意义上的数据查询, 是在更大的尺度上、更深的层次中对数据提高利用的价值,是数据仓库应用的关 键。 214联机分析处理(OLAP) 1联机分析处理(OLAP)的概念 联机分析处理(OLAP)的概念最早是由关系数据库之父EFCodd于1993年 提出的,他同时提出了关于OLAP的12条准则。OLAP的提出引起了很大的反响, OLAP作为一类产品同联机事务处理(OLTP)明显区分开来【17。 当今的数据处理大致可以分成两大类:联机事务处理OLTP(0nLine Transaction P

34、rocessing)、联机分析处理OLAP(OnLine Analytical Processing)。OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的 事务处理,例如银行交易【1”。OLAP是数据仓库系统的主要应用,支持复杂的分析 操作,侧重决策支持,并且提供直观易懂的查询结果。表22列出了OLTP与OLAP 之间的比较。 表22 OLP与OLTP比较【19 OLTP OLAP 用户 操作人员低层管理人员 决策人员,高级管理人员 功能 日常操作处理 分析决策 DB设计 面向应用 面向主题 当前的,最新的细节的,二维的分 历史的,聚集的,多维的集成 数据 立的 的统一的 存取 读写

35、数十条记录 读上百万条记录 工作单位 简单的事务 复杂的查询 用户数 上千个 上百个 DB大小 100MB_GB IOOGBTB OLAP是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一 致、交互地存取,从而获得对数据的更深入了解的一类软件技术。OLAP的目标是 满足决策支持或者满足在多维环境下特定的查询和报表需求,它的技术核心是”维 这个概念【201。 “维”是人们观察客观世界的角度,是一种高层次的类型划分。“维”一般包 含着层次关系,这种层次关系有时会相当复杂【2”。通过把一个实体的多项重要的 属性定义为多个维(dimension),使用户能对不同维上的数据进行比较。例如,一

36、 个企业在考虑产品的销售情况时,通常从时间、地区和产品的不同角度来深入观 察产品的销售情况。这里的时间、地区和产品就是维。而这些维的不同组合和所 考察的度量指标构成的多维数组则是OLAP分析的基础,可形式化表示为(维1, 维2,维n,度量指标),如(地区、时间、产品、销售额)因此OLAP也 可以说是多维数据分析工具的集合。 20LP的多维分析操作 OLAP的基本多维分析操作有钻取(roll up和drill down)、切片(slice) 和切块(dice)、以及旋转(pivot)等【2”。 钻取是改变维的层次,变换分析的粒度。它包括向上钻取(rollup)和向下钻 取(drill down)

37、。roll up是在某一维上将低层次的细节数据概括到高层次的 汇总数据,或者减少维数;而drill down则相反,它从汇总数据深入到细节数据 进行观察或增加新维。 切片和切块是在一部分维上选定值后,关心度量数据在剩余维上的分布。如果 剩余的维只有两个,则是切片;如果有三个,则是切块。 旋转是变换维的方向,即在表格中重新安排维的放置(例如行列互换)。 30LP存储数据的方式 OLAP有多种实现方法,根据存储数据的方式不同可以分为ROLAP、MOLAP、 HOLAP231。 ROLAP表示基于关系数据库的OLAP实现(Relational OLAP)。以关系数据 库为核心,以关系型结构进行多维数

38、据的表示和存储。ROLAP将多维数据库的多维 结构划分为两类表:一类是事实表,用来存储数据和维关键字:另一类是维表,即对 每个维至少使用一个表来存放维的层次、成员类别等维的描述信息。维表和事实 表通过主关键字和外关键字联系在一起,形成了”星型模式”。对于层次复杂的维, 为避免冗余数据占用过大的存储空间,可以使用多个表来描述,这种星型模式的扩 展称为”雪花模式”。 MOLAP表示基于多维数据组织的OLAP实现(Multidimensional OLAP)。以 多维数据组织方式为核心,也就是说,MOLAP使用多维数组存储数据。多维数据在 存储中将形成“立方块(Cube)”的结构,在MOLAP中对“立方块”的“旋转”、 “切块”、“切片”是产生多维数据报表的主要技术【2“。如图21所示 地 锅人绯 表中的。条教州 图21多维立方体 HOLAP表示基于混合数据组织的OLAP实现(Hybrid OLAP)。如低层是关系 型的,高层是多维矩阵型的。这种方式具有更好的灵活性。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号