数据仓库建模.ppt

上传人:牧羊曲112 文档编号:6296233 上传时间:2023-10-14 格式:PPT 页数:103 大小:1.24MB
返回 下载 相关 举报
数据仓库建模.ppt_第1页
第1页 / 共103页
数据仓库建模.ppt_第2页
第2页 / 共103页
数据仓库建模.ppt_第3页
第3页 / 共103页
数据仓库建模.ppt_第4页
第4页 / 共103页
数据仓库建模.ppt_第5页
第5页 / 共103页
点击查看更多>>
资源描述

《数据仓库建模.ppt》由会员分享,可在线阅读,更多相关《数据仓库建模.ppt(103页珍藏版)》请在三一办公上搜索。

1、数据仓库建模,Confidential 内部资料,注意保密,税务行业服务部高级顾问 于鹏报告日期:2008年4月24日,数据仓库建模概述数据仓库建模类型数据仓库建模过程数据仓库建模工具,内容,数据仓库建模概述,引言数据模型、数据仓库模型数据建模及模型架构数据仓库建模特点数据模型作用,数据仓库解决方案,数据仓库数据处理流程,税务逻辑数据模型面向关键主题域3NF,数据模型(Data Model),数据是所有业务活动、资源以及企业结果的记录。数据模型是一种运用一般业务知识来表现业务需求的一种数据结构规则数据模型通过抽象的实体及实体之间联系的形式,来表示现实世界中事务的相互关系的一种映射。,数据仓库模

2、型(Data Warehouse Model),数据仓库模型是数据模型中针对特定的数据仓库应用系统的一种特定的数据模型数据仓库模型起到了指导或计划数据仓库实现的作用。在真正的实现开始之前,联合每个业务领域的数据模型可以帮助确保其结果是有效的数据仓库,并且可以帮助减少实现的成本。,不同层次模型间的关系,数据建模(Data Modeling),建模是将实际问题简化、抽象为合理的数学结构的过程建模是一个系统工程,不是几天或者是几周就能够完成的,任何一个模块都可能需要几个月的时间来建设建模的方法和技巧很多,都是为业务需求服务的业务+技术才能完成建模过程,数据仓库数据模型架构,业务数据存储区,数据模型在

3、这里保证了数据的一致性,内部管理的元数据,数据模型帮助进行统一的元数据的管理,系统记录域的汇总,数据模型保证了分析域的主题分析的性能,满足了部分的报表查询。,具体的主题业务分析,数据模型可以单独存储在相应的数据集市中。,可选项,这部分数据模型主要用于相应前端的反馈数据,数据仓库可以视业务的需要设置这一区域,数据仓库建模特点,数据仓库是面向终端用户的在数据库操作中,用户不直接与数据库进行交互。他们使用应用程序,这些应用程序具有预先定义的或固定的查询。数据仓库的数据库特别是数据集市与终端用户非常接近,它通常不具有固定的查询。因此,它必须更易于理解。数据仓库是为数据分析而设计的终端用户几乎直接处理数

4、据,而且没有固定的工作流。终端用户对在仓库中记录数据不感兴趣,但他们需要从中获得信息。他们向仓库提出问题,通过所提取的信息测试并验证假设,重新构造事件链,分析那些事件以检测可能的模式或季节性的趋势,以及为将来做出推断和设计终端用户的需求可能是模糊或不完整的这些不完整的需求需要灵活的建模过程和适合于进化开发的技术。灵活的进化软件开发的风险是不连贯和不一致的终端结果。在开发数据模型时,肯定需要注意这些问题。,数据仓库建模特点(续),数据仓库是集成的数据库集合,而非单个数据库应将它构想为单个信息源,用于整个企业中所有的决策支持处理和所有的信息应用程序。数据仓库是一个“有机”物,如果在开始时还不够大,

5、就还会趋于变大。数据仓库包含属于不同信息主题领域的数据这些主题领域可以是将数据仓库逻辑划分成几个不同(概念的,甚至或者是物理的)数据库的基础。数据仓库还可以包含不同类别的数据。数据仓库通常包含历史数据,而不是日常操作数据的快照必要的遗留数据库可能不可用,或者可能无法在足够细的层次上捕获,除非花费金钱并付出努力来改变遗留输入环境。因此,数据仓库启用项目通常涉及业务过程和源应用程序的重组,数据模型的作用,进行全面的业务梳理,改进业务流程在业务模型建设的阶段,能够帮助我们对本单位的业务进行全面的梳理。同时,帮助进一步的改进业务流程,提高业务效率。建立全方位的数据视角,消灭信息孤岛和数据差异能够为企业

6、提供一个整体的数据视角,不再是各个部门只是关注自己的数据,而且通过模型的建设,勾勒出了部门之间内在的联系,帮助消灭各个部门之间的信息孤岛的问题,更为重要的是,通过数据模型的建设,能够保证整个企业的数据的一致性,各个部门之间数据的差异将会得到有效解决。解决业务的变动和数据仓库的灵活性能够很好的分离出底层技术的实现和上层业务的展现。当上层业务发生变化时,通过数据模型,底层的技术实现可以非常轻松的完成业务的变动。帮助数据仓库系统本身的建设开发人员和业务人员能够很容易的达成系统建设范围的界定,以及长期目标的规划,从而能够使整个项目组明确当前的任务,加快整个系统建设的速度。,数据模型的必要性与重要性,数

7、据仓库的基础,建设的导航图,数据整合的依据,消除数据的差异及冗余,支撑业务及数据的扩展,数据模型是数据仓库建设的基础,一个完整、灵活、稳定的数据模型对于数据仓库项目的成功起着重要的作用。,数据模型是整个系统建设过程的导航图。通过数据模型可以清楚地表达企业内部各种业务主体之间的相关性,使不同部门的业务人员、应用开发人员和系统管理人员获得关于系统的统一完整的视图。,数据模型是整合各种数据源的重要手段,通过数据模型,可以建立起各个业务系统与数据仓库之间的映射关系,实现源数据的有效采集,通过数据模型的建立,可以排除数据描述的不一致性。如:同名异义、同物异名,等等。可以消除数据仓库中的冗余数据。数据模型

8、的建立可以使开发人员清楚地了解数据之间的关系,以及数据的作用。,由于数据模型对现有的信息以及信息之间的关系从逻辑层进行了全面的描述,当未来业务发生变化或系统需求发生变化时,可以很容易地实现系统的扩展。数据结构的变化不会偏离原有的设计思想。,总结,什么是数据模型、数据仓库模型数据建模的定义和数据模型架构数据仓库建模的特点数据模型的作用,数据仓库建模概述数据仓库建模类型数据仓库建模过程数据仓库建模工具,内容,数据仓库建模类型,常用的数据仓库架构类型基于不同数据仓库架构下的数据仓库建模数据仓库模型分类,常用的数据仓库架构类型,三范式的原子层数据集市(Bill Inmon)星型结构的原子层HOLAP(

9、Kimball)三范式的原子层ROLAP,三范式的原子层数据集市,三范式原子层数据集市特点,通过“面向主题”表示应该围绕主题来组织数据仓库中的数据,例如客户、供应商、产品等等。每个主题区域仅仅包含该主题相关的信息。数据仓库应该一次增加一个主题,并且当需要容易地访问多个主题时,应该创建以数据仓库为来源的数据集市。换言之,某个特定数据集市中的所有数据都应该来自于面向主题的数据存储。集中式的体系结构持续下去将提供更强的一致性和灵活性,并且从长远来看将真正节省资源和工作。三范式的原子层给建立OLAP带来一定的复杂性,但是对于建立更复杂的应用,如挖掘仓库、探索仓库提供了更好的支持。这类架构的建设周期比较

10、长,相应的成本也比较高。,星型结构的原子层HOLAP,星型结构的原子层HOLAP特点,实现方式:首先在数据准备区中建立一致性维度、建立一致性事实的计算方法;其次在一致性维度、一致性事实的基础上逐步建立数据集市。每次增加数据集市,都会在数据准备区整合一致性维度,并将整合好的一致性维度同步更新到所有的数据集市。这样,建立的所有数据集市合在一起就是一个整合好的数据仓库因为该架构可以逐步建立的特点,它的开发周期比其他架构方式的开发周期要短,相应的成本也要低在星型结构的原子层上可以直接建立聚集,也可以建立HOLAP,三范式原子层ROLAP,该数据仓库架构也称为集中式架构(Centralized Arch

11、itecture),思路是在三范式的原子层上直接建立ROLAP。在三范式的原子层上定义ROLAP比在星型结构的原子层上定义ROLAP要复杂很多。采用这种架构需要在定义ROLAP是多下些功夫,而且ROLAP的元数据不一定是通用的格式,所以对ROLAP做展现很可能会受到工具的局限。这类架构和第一类很相似,只是少了原子层上的数据集市,选择合适的数据仓库架构,实际上,方法的选择取决于项目的主要商业驱动。如果某个企业或者组织数据管理不理想,或者希望为今后打下良好的基础,那么第一种或者第三种方法就更好一些。如果迫切需要给用户提供信息,那么第二种方法将满足该需求。而一旦满足了迫切的信息需求后,就应该考虑包含

12、独立数据仓库的数据体系结构的转换计划。,总结,三种常用的数据仓库架构各自的特点及优缺点,基于不同数据仓库架构下的数据仓库建模,三范式建模(Inmon)星型结构建模(Kimball)数据准备区建模,三范式建模(Inmon),高层建模(ERD,实体关系层)中间层建模(DIS,数据项集)底层模型(物理模型),高层建模,实体和关系实体:人,地点,物,事件以及任何包含业务活动数据的概念。关系:两实体间关联性的表示集成范围决定哪些实体属于模型的范围,由系统的建模者、管理人员和最终用户共同决定集成范围企业ERD由很多反映了整个企业不同人员的不同观点的单个的ERD合成的,中间层建模,高层模型中的每个实体,都要

13、建一个中间层模型四个基本构造初始数据组二次数据组连接件,表明主要主题域间的数据关系数据“类型”,中间层建模示例金融机构账户,底层模型,根据中间层模型创建考虑性能特性数据粒度与分割归并表选择冗余进一步分离数据导出数据预格式化,预分配人工关系预连接表,三范式建模优缺点,优点,从关系型数据库的角度出发,结合了业务系统的数据模型,能够比较方便的实现数据仓库的建模。,缺点,建模方法限定在关系型数据库之上,在某些时候反而限制了整个数据仓库模型的灵活性,性能等,特别是考虑到数据仓库的底层数据向数据集市的数据进行汇总时,需要进行一定的变通才能满足相应的需求。,星型结构建模(Kimball),核心:所分析的内容

14、以及用于分析内容的评估标准测度、维和事实测度,即评估标准,是事实的数字属性维,即所分析的内容,是事实的描述属性事实,一组维度及其相关的测度共同组成,星型结构示例,星型结构建模优缺点,优点,性能优势维度建模非常直观,紧紧围绕着业务模型,可以直观的反映出业务模型中的业务问题。,缺点,数据处理工作较大较多的数据冗余不能保证数据来源的一致性和准确性,数据准备区建模,建模的方式不拘一格,以能满足需要为目的,建好的表不对用户提供接口,多为临时表。主要使用人员为ETL工程师,数据仓库模型分类,OLAP模型(多维建模)星型/雪花结构模型(分析模型)底层模型(原子模型),总结,三种常用的建模方法实现过程和优缺点

15、数据仓库模型分类,数据仓库建模概述数据仓库建模类型数据仓库建模过程数据仓库建模工具,内容,数据仓库建模过程,底层模型设计分析模型设计OLAP模型设计,底层模型设计,数据仓库建模方法论底层模型设计过程,数据仓库建模方法论,数据仓库三级数据模型数据仓库建模方法论数据仓库概念模型建模方法数据仓库数据模型生命周期,数据仓库三级数据模型,将高级的业务概念以数据实体/属性的形态在逻辑层面上更详细的表达出来,逻辑模型对每个概念模型中所包含的具体实体和实体的属性进行定义,逻辑模型通过主题域中的实体和属性来反映,即业务模型,可以清晰的描述业务逻辑及其之间的关系,为逻辑模型的设计奠定基础,概念模型应该能够涵盖项目

16、所定义的目标范围内的所有数据,概念模型通过主题域的形式反映。,在逻辑模型的基础上,根据具体项目的软硬件环境、数据状况等进行优化和设置后的模型,是最终定型的物理模型。,概念模型,逻辑模型,物理模型,数据仓库概念模型建模方法,数据源分析,了解每个数据源的建设目标和定位,关键的业务流程及包含的数据元素;数据实体之间的关联关系;分析样本数据,验证业务规则;对数据内容和业务概念模型进行映射,验证概念模型。,了解企业经营管理中的主要活动,建立其活动列表,描述业务规则;寻找活动中的重要元素并定义;访谈业务部门,与相关人员验证这些活动;归纳初步的业务概念,产生业务概念的清单;定义概念并将他们关联在一起;分析业

17、务需求,验证业务概念模型。,自顶向下,自底向上,数据仓库数据模型生命周期,总结,数据仓库三级数据模型数据仓库建模方法论数据仓库概念模型建模方法数据仓库数据模型生命周期,底层模型设计,数据仓库建模方法论底层模型设计过程,底层模型的特征,是分析模型的数据源基于三范式构建建设过程需要相关业务人员全程参与分析设计工作量非常大需要对整个业务内容重新抽象和模型化为满足业务需求(非交易)而设计不是为解决所有的业务问题而设计的,能够满足最需要最常用的80%以上的需求就非常不错了是一个迭代开发过程,底层模型设计步骤,需要非常清楚的了解整个业务领域的时间、地域、对象、事件通过研究行业规范、学习行业先进经验、走访管

18、理人员、与目标用户讨论,实地参观学习等去发现和收集概念模型;需要发现并收集所要涉及或者说涵盖的领域下可能出现的实体,就是整个税收征管体系中需要用到的概念事物对一堆堆繁杂无章的概念进行整理分组,该合并的合并,该舍弃的舍弃,发现和抽象出来几个核心概念出来然后将其他的概念和这些核心概念靠拢,并争取能够划清结线,并结合现实世界,分析概念划分和抽取的合理性发现并描述组内概念之间的依赖关系抽象出业务模型,定义实体、实体属性及实体间的关系需要去考虑实体的生命周期,每个实体的由何而生,又由何而止的生命周期进行描述。并通过对生命周期的描述,修正你上面一个步骤分析出来的关系信息,设计概念模型,概念模型是所有业务主

19、题领域以及业务的公共数据元素的一致性定义 主要工作如下:抽取关键业务概念,并将之抽象化。将业务概念分组,按照业务主线聚合类似的分组概念。细化分组概念,理清分组概念内的业务流程并抽象化。理清分组概念之间的关联,形成完整的主题概念模型。,概念模型设计示例,项目目标某基金公司需要建设一个投资数据平台,整合天相、wind、财华、北方之星、金手指等系统的数据,为股票投资分析提供数据服务,实现过程,概念模型设计目标定义活动及业务规则列表重要元素的归纳和关系业务概念归纳概念模型验证业务人员访谈数据映射验证,目标定义,项目目标定义为建设一个投资数据平台,因此概念模型的设计以“投资”为主题,活动及业务规则列表,

20、基金公司发行基金产品,通过银行、证券公司等渠道推向市场,允许投资者进行买卖;一个基金公司可以发行多个基金产品,每个基金产品至少有一个基金经理来管理;基金产品分多种类型,有股票型,货币型、债券型、保本型、混合型等,每个大类下又细分为多个小类;基金产品在基金公司内部管理可能是分盘管理的,即一个基金产品对外公布是一个基金产品,在内部管理上可能分为几个基金产品来管理;基金公司除了管理基金产品外,还代理企业年金和社保基金的投资活动;根据基金产品的不同的风险偏好,基金目前在投资市场可买卖的产品包括股票、权证、债券、基金,未来还包括股指等,其中,企业年金和社保基金还可以投资市场上的基金产品;筹资公司既可以通

21、过发行股票来融资,也可以通过发行债券来融资,可以同时发行股票和债券,债券在一定条件的约束下可以转换成股票;投资市场的行情和宏观经济信息息息相关,基金公司需要研究宏观经济指数/行业指数,选择投资产品的类型以及行业板块;筹资公司自身的经营管理水平、产业结构,重大事项等将对自身发行的股票、权证、债券等产生影响,因此,基金公司在投资时除了考虑宏观经济数据外,还需要研究筹资公司本身,来决定是否买卖该公司的股票/债券等。,重要元素的归纳和关系,业务概念归纳,业务概念归纳的重要原则是确定边界,使得每个业务概念之间的边界是清晰,业务概念之间的连接用关系来表示,业务概念是对业务模型中的重要元素的高度抽象,各个业

22、务概念的连接可以描述企业日常经营活动的各个业务活动。,业务人员访谈,通过和业务人员的访谈,来对概念模型进行验证。这是个反复交互的过程,数据映射验证,数据源调研的目的,一方面是对数据内容的梳理,并将数据内容向业务概念模型进行映射,以便验证是否有些数据源内容超出了业务概念模型的范畴,另一方面,为逻辑模型的设计奠定基础,设计逻辑模型,抽象实体的一些细致的属性。通过逻辑建模阶段,才能够将整个概念模型完整串联成一个有机的实体,才能够完整的表达出业务之间的关联性 主要工作如下:确定所有实体及其之间的关系确定每个实体的属性确定所有主键和外键规范化(Normalization)和聚集,设计物理模型,物理建模阶

23、段是整个数据建模的最后一个过程,这个过程其实是将前面的逻辑数据模型落地的一个过程 主要工作如下:生成创建表的脚本。不同的数据仓库平台可能生成不同的脚本。针对不同的数据仓库平台,进行一些相应的优化工作。针对数据集市的需要,按照维度建模的方法,生成一些事实表,维表等工作。针对数据仓库的ETL和元数据管理的需要,生成一些数据仓库维护的表,例如:日志表等。,逻辑建模与物理建模分离,良好的逻辑建模实践关注问题域的本质,解决“什么”之类的问题 物理建模为模型解决“如何”之类的问题,这表示给定的计算环境中实现的真实性。将两者分离,可保证逻辑模型的延续性,不会因为实际环境的变化而进行调整。,菲奈特税务底层模型

24、示例,需要注意的几点,搭建整个综合平台 or 基于需求来定义?所有信息都抽取过来 or 选择性的抽取?平衡点?维护成本投入人力成本投入经费底层模型建设是一个不断发展和完善的过程,总结,底层模型特征底层模型设计步骤概念、逻辑和物理模型的设计需要注意的几点内容,数据仓库建模过程,底层模型设计分析模型设计OLAP模型设计,分析模型设计,分析模型分类分析模型基本元素维表与事实表的设计,星型模型是由单个事实数据表和一些维度表组成的构架模型。在这种模型中每个维度表均联接到事实数据表上。,星型模型,雪花型架构比星型模型增加了次要维表,有一个或多个维表是联接到其它维表上,而非事实数据表上。,雪花型模型,分析模

25、型设计,分析模型分类分析模型基本元素维表与事实表的设计,事实表事实表是用于存放经过汇总的历史信息,也就是事实数据的表,是星型架构或雪花型架构的中心。每个数据仓库或数据集市都包括一个或多个事实表。事实表一般不包含描述性信息,具有可以聚合的特点。维表维度表是存储描述事实表中事实数据特性的表,每个维表都是独立于其它维表的,并且包含了事实特性的层次结构信息。,分析模型基本元素,分析模型设计,分析模型分类分析模型基本元素维表与事实表的设计,每个事实数据表都应该由两个部分组成,一个由多个部分组成的索引和一些由这些索引所描述的数据。索引部分索引部分包含着与描述事实数据特征的维表相关联的外键信息。数据部分数据

26、部分是事实表中真正要存放的事实数据,即指标。,事实表设计,前五列为索引部分,后三列是事实数据部分,事实表示例,设计事实表应注意问题,事实表中一般不应包含描述性信息,也不应包含除事实表与维表中间对应的关联字段之外的任何数据。事实表中的数据应该是经过适当聚合的数据事实表中数据的粒度应该是一致的事实表的设计应该考虑增量数据更新的需要,例如是否需要增加时间戳字段等。,维表设计中由于维度类型的不同,其维表结构也会相应有不同特点。维度分类普通维普通维是基于一个维表的维度,由维表中的不同列来表示维度中的不同级别。雪花维雪花维是基于多个维表的维度,各个维表间以外键关联,分别存储同一维度中不同级别的成员列值。父

27、子维父子维是基于两个维表列的维度,由维表中的两列来共同定义各个成员的隶属关系。一列称为成员键列,标识每个成员;另一列称为父键列,标识每个成员的父代。,维表设计,普通维普通维中的层次是根据维表的列而定义的,所以维表中列的定义会直接影响到维度中层次的定义。设计普通维度的维表必须充分考虑维度的扩展性。示例:例如下图中典型的时间维度如左图所示,则每一个层次在维表中均应有对应的列。,普通维,雪花维由于雪花维是基于不同维表建立的,所以针对雪花维而设计的维表必然有多个,各维表分别存储维度中不同级别的成员值,维表间以外键关联。示例:例如,典型的地区维中地市维表可以存储全国所有的城市名称和编码,以及所属省份的编

28、码,而在省份维表中则只存储省份名称和编码,两维表以省份编码关联。,雪花维,父子维由于父子维中的层次关系是由维表中的两个列来共同定义的,所以其维度层次结构是由维表中的列值决定的,且维度层次分布是不均衡的。示例:例如,典型的机构维中除了最上层的机构外其它机构都具有其本身机构信息和上级机构信息两项属性。由此,维表中也必须包含此两项信息的设计。,父子维,模型构架尽量使用星型架构,使用雪花架构的目的是使事实表第一级的维表数量达到最小。维表设计设计维表应包含需要分析的有关事实的有意义信息,例如行业门类大类小类。事实表设计不要在事实数据表中进行过度的汇总,以保证在必要时可以进行所需粒度的数据访问。,分析模型

29、设计建议,总结,分析模型分类分析模型基本元素维表与事实表的设计分析模型设计建议,数据仓库建模过程,底层模型设计分析模型设计OLAP模型设计,OLAP模型设计,概要设计,概要设计是在需求整理、讨论中进行的,需求分析的成果最终要在OLAP设计中体现。较好的需求分析,既能完成业务部门提出的需求,又能减轻设计上的压力和反复修改的次数。,物理设计,物理设计决定数据的计算方式和存储方式。较好的物理设计,充分利用硬件的性能,能极大提高数据的计算速度和存储空间,却又不会影响到查询速度。,优化设计,最重要的优化工作体现在概要设计和物理设计中,概要设计,确定分析主题确定分析指标确定分析维度确定维度层次,确定分析主

30、题,从业务上确定分析主题的大类、小类例如:税款分析,可以有入库税款分析、应征税款分析等。,确定分析指标,确定各分析主题需要分析哪些指标确定哪些指标在关系数据库中计算、哪些指标在多维模型中计算例如:在关系数据库中实现的指标:能做聚合的重要指标,称之为“元指标”,例如:余额、发生额;具有复杂计算逻辑的指标。在多维模型中实现的指标:跨维度指标,例如:同期比、前期比、占比。其它能建立在“元指标”基础之上,能做简单加减的指标,例如:优惠金额=优惠前金额-优惠后金额。,确定分析维度,确定哪些维度是用户真正关心的;哪些维度是用户经常使用的、哪些维度是维度组合式用户经常使用的;哪些维度在业务上具有较高的分析价

31、值;哪些维度在本分析主题没有较高的分析价值,却在其它分析主题有较高的分析价值。,确定维度层次,确定维度的粒度、层次、成员数;分析维度层次的重要性和合理性,维度层次是否是其不可分割的固有属性,维度分析是否有钻取的需要。例如:行业可分为一级行业、二级行业等,这是其固有属性。单独分析一级行业不够明细,单独分析二级行业缺少分类。税种可分为增值税、消费税、所得税等,往下可分为一级科目、二级科目等。,物理设计,确定存储方式确定聚合方式分区设计确定计算成员,确定存储方式,多维存储方式(MOLAP)将聚合数据和源数据的一个复本存储到分析服务器中的多维结构中的存储方式。关系数据库存储方式(ROLAP)将聚合存储

32、在一个关系型结构中,并把分区的源数据保留在它现有的关系型结构中的存储方式。混合存储方式(HOLAP)将聚合存储到分析服务器计算机上的多维结构中,并将分区的源数据保留在它现有的关系型结构中的存储方式。,确定聚合方式,聚合方式聚合方式是预先计算数据汇总的方式,聚合方式的选择直接影响着查询响应的时间和聚合结果。确定维度的加、减、乘、除、不聚合等聚合方式,确定分区,分区主要用于创建虚拟Cube 确定分区的种类 ESSBASE中常用的是透明分区(Transparent Partition),确定计算成员,计算成员 计算成员是基于多维数据集内已存在的数据(度量值)与算术运算符、数字和各种函数进行组合而创建

33、的复杂的表达式。在多维模型中使用计算成员,可以快速派生一系列指标,减少ETL处理的工作量。例如可以定义同期比、前期比、本年累计等计算公式。,OLAP模型设计示例,1、客户提出需求:A)需要了解某市每个月份的税收增长情况;B)需要了解某市每个季度按税种分类的税收及纳税户增长情况 C)需要了解某市每个区每个月份分税种的申报及税收入库情况,OLAP模型设计示例,2、抽象归纳:纳税情况分析:可以全部或部分选择时间、税务机关、登记行业、税种、纳税人性质、登记注册类型作为分析角度,选择申报税款、入库税款、纳税人数量作为分析指标,进行比较分析,OLAP模型设计示例,3、讨论细化,概要设计:,OLAP模型设计

34、示例,4、详细设计及实现:,总结,概要设计、详细设计过程设计示例,数据仓库建模概述数据仓库建模类型数据仓库建模过程数据仓库建模工具,内容,数据仓库建模工具,底层模型与分析模型ERWin、PowerDesigner等工具OLAP模型多维模型产品,比如Hyperion Essbase、DB2 CubeView、MS Analysis Services等,常用网站,http:/,Questions,保密须知:本文件及其书面或其他任何形式的附件乃以保密形式提供,其著作权归属于本公司,仅供阁下内部使用。未经过本公司的审核、确认及书面授权,阁下不得以任何方式在任何媒体(包括互联网)上公开引用或在阁下的任何资料中引用本文件及其附件中的任何数据和信息,不得以任何方式将本文件及其附件中的任何内容提供、披露给其他单位或个人。敬希阁下与我们共同遵守法律。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号