《互联网数据库串讲.ppt》由会员分享,可在线阅读,更多相关《互联网数据库串讲.ppt(33页珍藏版)》请在三一办公上搜索。
1、第十一章 数据库新技术,学习目的和要求 了解面向对象数据库系统的概念及特点了解并行数据库系统的概念及特点了解多媒体数据库系统的概念及特点往年频繁考点:数据库技术的三个发展阶段面向对象数据库系统的概念、特点并行数据库系统的三种基本结构多媒体数据库系统的概念、特点,第一节 数据库技术新发展,数据库技术的三个发展阶段 第一代的网状、层次数据库系统支持三级模式的体系结构用存取路径来表示数据之间的联系独立的数据定义语言导航的数据操纵语言,第一节 数据库技术新发展,第二代的关系数据库系统关系模型的概念单一,实体以及实体之间的联系都用关系来表示;以关系代数为基础,形式化基础好;数据独立性强,数据的物理存储和
2、存取路径对用户隐蔽;关系数据库语言是非过程化的,将用户从编程数据库记录的导航式检索中解脱出来,大大降低了用户编程的难度。,第一节 数据库技术新发展,第三代以面向对象模型为主要特征的数据库系统。第三代数据库系统应支持数据管理、对象管理和知识管理第三代数据库系统必须保持或继承第二代数据库系统的技术第三代数据库系统必须对其他系统开放,第二节 面向对象数据库系统,面向对象数据库系统是数据库技术与面向对象程序设计方法相结合的产物。面向对象程序设计的基本思想是封装和可扩展性。,第二节 面向对象数据库系统,OO模型的核心概念:对象与对象标识OID:现实世界的任一实体都被统一地模型化为一个对象,每个对象有一个
3、唯一的标识,称为对象标识(OID)。封装:每一个对象是其状态与行为的封装,其中状态是该对象一系列属性值的集合,而行为是在对象状态上操作的集合,操作也称为方法。类:共享同样属性和方法集的所有对象构成了一个对象类(简称类),一个对象是某一类的一个实例。类层次(结构):在一个面向对象数据库模式中,可以定义一个类(如C1)的子类(如C2),类C1称为类C2的超类(或父类)。子类(如C2)还可以再定义子类(如C3)。这样,面向对象数据库模式的一组类形成一个有限的层次结构,称为类层次。消息:由于对象是封装的,对象与外部的通信一般只能通过显式的消息传递,即消息从外部传送给对象,存取和调用对象中的属性和方法,
4、在内部执行所要求的操作,操作的结果仍以消息的形式返回。,第二节 面向对象数据库系统,OODB语言内容包括:对象定义语言(ODL)对象操纵语言(OML),对象操纵语言中一个重要子集是对象查询语言(OQL)OODB语言一般应具备下述功能:类的定义与操纵操作方法的定义对象的操纵OODBS除了具有原来的特点外,还应提供以下特点:扩充数据类型支持复杂对象支持继承的概念提供通用的规则系统,第三节 并行数据库系统,并行数据库系统是在并行机上运行的具有并行处理能力的数据库系统,是数据库技术与并行计算技术相结合的产物。并行数据库系统的目标高性能高可用性可扩充性,第三节 并行数据库系统,并行计算机分为三种基本的体
5、系结构:共享内存结构:SM并行结构由多个处理机、一个共享内存和多个磁盘存储器构成。多处理机和共享内存由高速通信网络连接,每个处理机可直接存取一个或多个磁盘,即所有内存与磁盘为所有处理机共享。SM方案的优势在于实现简单和负载均衡,但是这种结构的系统成本高、可扩充性较差、系统可用性不是很好。,第三节 并行数据库系统,共享磁盘结构:SD并行结构由多个具有独立内存的处理机和多个磁盘构成。每个处理机都可以读写任何磁盘。多个处理机和磁盘存储器由高速通信网络连接。SD方案具有成本低、可扩充性好、可用性强。容易从单处理机系统迁移以及负载均衡等优点。该结构的不足在于实现起来复杂以及存在潜在的性能问题。无共享资源
6、结构:SN并行结构由多个处理结点构成。每个处理结点具有自己独立的处理机、内存和磁盘存储器。多个处理机结点由高速通信网络连接。SN结构成本较低,具有极佳的可伸缩性,通过在多个结点上复制数据又可实现高可用性。该方案的不足在于实现复杂以及结点负荷难以均衡。,第四节 多媒体数据库系统,多媒体数据库是多媒体技术与数据库技术相结合产生的一种新型的数据库。多媒体是指多种媒体的有机结合。计算机的多媒体数据具有以下特点:对象复杂存储分散时空同步多媒体技术是实现基于计算机的多媒体应用环境的技术。多媒体技术以计算机为平台,应用数字化技术,以交互控制方式把多媒体集成于一体,形成一个完整的相互作用的整体,以实现对多媒体
7、数据的存储与组织、查询与检索、显示与演播、编辑与处理、传输与管理等,其中多媒体数据的管理是关键技术。,第四节 多媒体数据库系统,多媒体数据库与传统的数据库有较大的差别,主要表现在:处理的数据对象、数据类型、数据结构、数据模型和应用对象都不同,处理的方式也不同。多媒体数据库存储和处理复杂对象,其存储技术需要增加新的处理功能,如数据压缩和解压。多媒体数据库面向应用,没有单一的数据模型适应所有情况,随应用领域和对象而建立相应的数据模型。,第四节 多媒体数据库系统,多媒体数据库强调媒体独立性,用户应最大限度地忽略各媒体间的差别而实现对多种媒体数据的管理和操作。多媒体数据库强调对象的物理表现和交互方式,
8、强调终端用户界面的灵活性和多样性。多媒体数据库具有更强的对象访问手段,比如特征访问、浏览访问、近似性查询等。,第四节 多媒体数据库系统,多媒体的建模常见的有以下三种方法:1)扩充关系模型:在传统的关系数据模型基础上引入新的多媒体数据类型,以及相应的存取和操作功能。2)语义模型:语义数据模型的目标是提供更自然的处理现实世界的数据及其联系,它在实体的表示、相互间联系、抽象等机制上具有特点。有两种语义模型可支持多媒体数据的描述:一种是基于实体联系的语义数据模型;另一种是用于处理数据库动态变化的数据模型,在进行数据抽象的同时,对抽象数据的更新操作也使用抽象。,第四节 多媒体数据库系统,3)面向对象模型
9、:面向对象的方法最适合于描述复杂对象,引入了封装、继承、对象、类等概念,可以有效地描述各种对象及其内部结构和联系。具体有以下三种实现途径:一是在数据库系统中引入面向对象机制;二是在面向对象程序设计语言中引入数据库机制,使其支持永久数据管理;三是开发全新的面向对象数据库管理系统。,第十二章 分布式数据库系统,学习目的和要求 了解分布式数据库系统的基本概念了解分布式数据库系统的体系结构了解分布式数据库系统的数据分布策略。对本章的要求是达到“识记”层次。往年频繁考点:分布式数据库系统的概念、特点数据分布带来的问题,第一节 分布式数据库系统概述,分布式数据库系统的定义分布式数据库系统是由一组数据组成的
10、,这组数据分布在计算机网络的不同计算机上,网络中的每个结点具有独立处理的能力(称为场地自治),可以执行局部应用。同时,每个结点也能通过网络通信子系统执行全局应用。分布式数据库系统的特点:(1)数据的独立性;(2)集中与自治相结合的控制结构;(3)适当增加数据冗余度;(4)全局的一致性、可串行性和可恢复性。,第一节 分布式数据库系统概述,分布式数据库系统的目标:(1)适应部门分布的组织机构,降低费用;(2)提高系统的可靠性和可用性;(3)充分利用数据库资源,提高现有集中式数据库的利用率;(4)逐步扩展处理能力和系统规模。,第二节 数据分布策略,数据分布的目的:提高访问的局部性数据分布的方式:(1
11、)划分式;(2)全重复式;(3)部分重复式。关系的三种分割方式:水平分割按元组分割;垂直分割按属性分割;混合分割或是先水平分割,再垂直分割;或是先垂直分割,再水平分割。,第二节 数据分布策略,关系分割遵守的3条准则:完备性:全局关系的所有数据都要分配到相应的裂片中,否则,将会因分割而丢失数据。可重构性:即可以由裂片重构全局关系。不相交性:只对水平分割适用,即在水平分割的裂片中,应该没有重复的元组。数据分布带来的问题保持多副本一致性。保持分布的一致性。全局查询的处理。分布事务的管理。,第三节 分布式数据库系统的体系结构,分布式数据库系统结构的分类:物理上分布、逻辑上集中物理上、逻辑上均分布分布式
12、数据库管理系统(Distributed DataBase Management System,简称DDBMS)是建立、管理和维护数据库的一组软件。DDBMS的组成:LDBMS(Local DBMS),局部场地上的数据库管理系统GDBMS(Global DBMS),全局数据库管理系统全局数据字典通信管理,第三节 分布式数据库系统的体系结构,DDBMS分类按全局控制方式分类全局控制集中的DDBMS:中心站点控制全局控制分散的DDBMS:各站包含全局控制信息全局控制部分分散的DDBMS:(主从型)分为主站点:包含全局控制信息 辅站点:不包含全局控制信息按局部DBMS的类型分类 同构型DBMS 同构同
13、质:模型相同、厂家相同 同构异质:模型相同、厂家不同 异构型DBMS:模型不同,第十三章 数据仓库,学习目的和要求 了解数据仓库的基本概念、框架以及基本操作对OLAP有一定的了解对本章的要求是达到“识记”层次往年频繁考点:数据仓库的概念,第一节 数据仓库概述,数据仓库的定义在支持管理的决策生成过程中,一个面向主题的、集成的、时变的、非易失的数据集合。数据仓库的最终目的:将企业范围内的全体数据集成到一个数据仓库中,用户可以方便地从中进行信息查询、产生报表和进行数据分析等。数据仓库是一个决策支撑环境,它从不同的数据源得到数据,组织数据,使得数据有效地支持企业决策。总之,数据仓库是数据管理和数据分析
14、的技术。,第一节 数据仓库概述,数据仓库的好处提高公司决策能力竞争优势潜在的高投资回报 开发和管理数据仓库的问题 低估数据装载工作源系统隐藏的问题从现存的数据源捕捉不到的数据终端用户的需求不断增长数据差异被忽略对资源过高需求数据的所有权问题高维护性集成的复杂性。,第二节 数据仓库框架,数据仓库的框架,第二节 数据仓库框架,提高数据仓库的性能通常采取的措施采用并行系统结构;对数据仓库中用得多、开销大的处理,例如聚集函数的计算,采用新的查询优化策略和索引结构;针对数据仓库以读为主的特点,把查询中常用的中间结果定义为视图,且将事先计算好的视图存于数据仓库中;在需要的时候只要读出即可,无需临时计算。,
15、第二节 数据仓库框架,数据仓库所需的技术支持异构多数据源集成技术;RDBMS对数据仓库的支撑技术,包括OLAP和并行处理等技术;硬件系统,包括并行处理结构、大容量磁盘阵列系统等;数据模式设计,包括对决策主题的需求分析、基表和实现图的模式设计、各种索引的合理配置等;决策用的工具和接口软件。,第三节 数据仓库的基本数据模式,以事实表为中心,加上若干维表,组成星型数据模式(star schema)。,第三节 数据仓库的基本数据模式,若将维表按层次关系分解,则数据模式将成为雪花模式(snowflake schema)。雪花模式实际上是星型模式的规范化形式。用雪花模式表示,可以节省存储空间,但在访问维表
16、时,要多做连接操作。,第四节 数据仓库的基本操作,数据仓库中的基本操作:(1)基本聚集函数SQL提供五种聚集函数:SUM,COUNT,AVG,MAX和MIN(2)立方体操作在立方体的基础上,可进行切片、切块操作,即以某一个维度为基准,对立方体进行切割的操作。(3)上卷和下探操作上卷操作就是由细粒度分组的聚集函数推算出粗粒度分组的过程。下探操作是上卷操作的逆操作,即通过细化维的粒度,查询较详细的数据。,第五节 联机分析处理(OLAP)简介,OLAP的三层C/S结构 第一层为客户机,实现最终用户功能,能够方便地浏览数据仓库中的数据,能够生成数据立方体,支持各种OLAP操作,如切片、切块、旋转、趋势
17、分析、比较等处理,实施决策。第二层为分析服务器,存储数据仓库中的综合数据。第三层是企业服务器,存储数据仓库中的细节数据,它来自基层数据库。OLAP的数据组织模式:(1)多维OLAP(MD-OLAP)的综合数据组织模式;(2)关系OLAP(ROLAP)的综合数据组织模式。,第五节 联机分析处理(OLAP)简介,OLAP实现的关键技术:(1)实视图及其维护;“实视图”,它与数据库的“视图”概念不同之处在于:它不是虚拟的,而是经过计算,含有大量数据,并存储在数据仓库的一张实实在在的表中。(2)立方体计算;(3)查询优化与并行处理技术;(4)数据集成。OLAP的局限性:(1)OLAP分析技术的局限性;(2)OLAP解决方案的局限性。,