中科院分布式数据库系统及其应用.ppt

上传人:laozhun 文档编号:2330921 上传时间:2023-02-11 格式:PPT 页数:59 大小:890.02KB
返回 下载 相关 举报
中科院分布式数据库系统及其应用.ppt_第1页
第1页 / 共59页
中科院分布式数据库系统及其应用.ppt_第2页
第2页 / 共59页
中科院分布式数据库系统及其应用.ppt_第3页
第3页 / 共59页
中科院分布式数据库系统及其应用.ppt_第4页
第4页 / 共59页
中科院分布式数据库系统及其应用.ppt_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《中科院分布式数据库系统及其应用.ppt》由会员分享,可在线阅读,更多相关《中科院分布式数据库系统及其应用.ppt(59页珍藏版)》请在三一办公上搜索。

1、徐俊刚(),分布式数据库系统及其应用,2009年2月2009年6月,课程信息,分布式数据库系统及其应用60学时/3学分,专业基础课,可作为学位课课程QQ群:21771308,通知/课件/交流课程网站:http:/210.76.200.33/course/view.php?id=1294课程信箱:xujg_助教:裴莹,电话:13701174897,教师信息,徐俊刚山东聊城人中科院研究生院信息学院专任教师主要研究方向是数据管理、数据挖掘和企业信息化联系方式:QQ:110391551;邮箱:;手机:13910929321,通过本课程的学习,使得同学们对分布式数据库学科的重要技术不仅知其然,更要知其所

2、以然。掌握分布式数据库系统的理论、结构、技术和方法。了解实现分布式数据库的关键和难点。认清数据库学科的发展趋势和前景。能够设计和开发简单的分布式数据库系统。为今后从事分布式数据库研究和应用打下良好的专业基础。,课 程 目 标,课 程 内 容(1),第1章 分布式数据库系统概述第2章 分布式数据库系统的设计第3章 分布式数据库中的查询处理和优化第4章 分布式数据库中的事务管理和恢复第5章 分布式数据库中的并发控制第6章 分布式数据库中的可靠性 第7章 分布式数据库的安全性与目录管理 第8章 分布式数据库与客户机/服务器模式第9章 分布式数据库与WWW数据库和移动数据库第10章 云计算第11章 分

3、布式数据库系统的发展趋势,课程讲授(约50学时),教材:邵佩英:分布式数据库系统及其应用(第2版),科学出版社,北京,2005,课 程 内 容(2),集体上机操作(约10学时),使用关系数据库管理系统Oracle 9i中文版。练习Oracle9i数据库基本操作 大作业之实验项目的编程实验,参 考 书 籍(1),参考书籍,Principles of Distributed Database Systems(分布式数据库原理(第2版),M.Tamer Ozsu,Patrick Valduriez Prentice Hall&Tsinghua University Press,2002.,考核方式,

4、1.大作业之实验项目(25%)2.大作业之翻译相关英文资料(15%)3.最后闭卷考试(60%),数据库系统知识回顾计算机网络知识回顾分布式数据库系统的由来和发展分布式数据库系统的定义和分类分布式数据库系统的体系结构和组成部分分布式数据库系统中数据的独立性与分布透明性分布式数据库系统的优点和存在的技术问题,分布式数据库系统概述,第1章,数据库系统知识回顾,数据库(DB:DataBase),长期储存在计算机内的有组织的、可共享的相关数据的集合。,数据库技术,数据库系统软硬件层次关系,1,1,数据库系统知识回顾,DBMS,数 据 库,系统分析员,应用程序员,最终用户 2,最终用户 1,最终用户 3,

5、数据库管理员,DBMS设计和实现者,数据库系统工具开发者,操作员和系统维护人员,数据库设计者,数据库系统用户,1.2,1 数据库系统知识回顾,数据抽象,视图抽象外模式概念抽象概念模式物理抽象内模式,概念模式,内模式,现实世界,视图抽象,概念抽象,物理抽象,外模式,视图2,视图1,视图3,1.数据库系统知识回顾,数据间的联系,一对一的联系,记为 11 一对多的联系,记为 1n 多对多的联系,记为 mn,实体联系类型,实体内部联系实体之间的联系同一实体型的实体之间的联系不同实体型的实体之间的联系,E-R模型,实体联系模型(Entity Relationship Model)。该模型直接从现实世界中

6、抽象出实体类型及实体间联系,然后用E-R图表示的数据模型。,在信息世界中建立的,完全不涉及信息在计算机系统中的表示(独立 子计算机系统)的数据模型,称为概念数据模型,简称概念模型。最典型的是“实体联系模型”即E-R模型。,实体名,属性名,E-R图的四个基本成分:,矩形框表示实体型,椭圆形表示属性,菱形表示联系,连接实体型与联系类型,也可用于表示实体与属性的联系并注明种类;对构成码的属性,在属性名下画一横线表示。,1 数据库系统知识回顾,1.5,E-R模型,例:学生选修课程,学生,课程,选修,姓名,学号,系别,课程号,课程名,学分,成绩,用矩形表示实体,用椭圆表示实体的属性,用无向边把实体与其属

7、性连接起来,用菱形表示实体间的联系,实体与联系用线段连接并注明类型,m,n,1 数据库系统知识回顾,1.6,E-R模型示例,数据库系统知识回顾,数据模型(Data Model),1,1.7,数据结构 数据操作 完整性约束,用于描述系统的静态特性;是所研究的对象类型(Object type)的集合,包括:数据的类型、内容和性质的对象(事物);数据之间联系的对象(联系)。,数据模型的三要素,1.数据结构:,是一组完整性规则(条件)的集合。给出数据及其联系所具有的制约、依赖和存储规则,用于限定数据库的状态和状态变化,保证数据库中的数据的正确、有效、完全和相容。,3.完整性约束(Integrity C

8、onstraint):,用于描述系统的动态特性,是对数据库中的各种对象的实例(值)允许执行的操作的集合。主要有查询和更新(插入、删除、修改)两类操作。,2.数据操作(Data Manipulation):,3.SQL(Structured Query Language),是一种综合DDL和DML的数据库语言,用来表示用户对数据库的操作请求,主要有以下操作:查询、插入、删除和修改。包括两类语言:过程性语言(数据库中什么数据,如何搜索这些数据都要说明)和非过程性语言(只说明数据库中的什么数据)。,2.数据操纵子语言(Data Manipulation Language),数据库语言,1.8,包括数

9、据库模式定义和数据库存储结构与存取方法定义两个方面,相应的程序也包括两部分:一部分是数据库模式定义处理程序,一部分是存储结构和存储方法定义处理程序。,1.数据定义子语言(Data Description Language),数据库系统知识回顾,1,1.9,数据库系统结构,数据库系统知识回顾,1,1模式:也称为概念模式,是数据库全体数据的全局逻辑结构和特征的描述。2外模式:是关于用户数据的局部逻辑结构和特征的描述,是模式的逻辑子集。3内模式:是数据库数据的物理结构和存储结构的描述。,4模式/内模式映象:该映象存在于模式与内模式之间,用于定义模式与内模 式之间的对应性。本映象一般在内模式中描述。,

10、5外模式/模式映象:该映象存在于外模式与模式之间,用于定义外模式和模 式之间的对应性。本映象一般在外模式中描述。,在数据库系统的三级模式结构中,存在模式/内模式的映 象,当内模式发生变化时,只要修改模式/内模式的映象,就可以保持模式不变,从而保证程序与数据的物理独立性。,6物理独立性:,在数据库系统的三级模式结构中,存在外模式/模式的映象,当模式发生变化时,只要修改外模式/模式的映象,即可保持外模式不变,从而保证程序和数据的逻辑独立性。,7逻辑独立性:,1.9,数据库系统结构,数据库系统知识回顾,1,传统的集合运算,1.10 关系代数,并运算 差运算 交运算 广义笛卡尔积,RS,R-S,R x

11、 S,数据库系统知识回顾,1,选择运算是从关系中选取使公式为真的元组。这是从行的角度进行的运算。,在关系R中选择满足给定条件的元组,记做:F(R)=r|r R F(r)=真 F是一个公式,表示形式为由逻辑运算符(,)连接各算术表达式组成。算术表达式的基本形式为:XY.=,=,.X,Y是属性名或常量或简单函数。,例1 求计算机科学系CS的学生,SD=CS(S),SD=CS(S),选择运算,投影运算,这是从列的角度进行的运算。,例2 SN,SD(S)即求得学生关系S在学生姓名和所在系这两个属性上的投影结果。,SN,SD(S),关系R上的投影是从R中选择若干属性组A组成新的关系。记做:A(R)=rA

12、|r R投影之后不仅取消了某些列,还可能取消某些元组。,SA(S),连接运算是从两个关系的笛卡尔积中选取属性间满足一定条件的元组。记做:R S.其中,F是条件表达式,它涉及到对两个关系中的属性的比较。如果F仅仅是一个相等条件,即等值连接。,连接运算,F,例3 设关系R、S如下图:,DATABASE TABLECREATE VIEW INDEX SQL DDL:ALTERDROP SQL QUERY:SELECT FROM INSERT SQL SQL DML:UPDATE DELETE GRANT SQL DCL:REVOKEAUDIT 嵌入式SQL:,1.11 SQL组成(分类),数据库系统

13、知识回顾,1,数据库系统知识回顾,数据库建设是硬件、软件和干件(技术与管理的界面称为干件)的结合。“三分技术,七分管理,十二分基础数据”是数据库建设的基本规律结构(数据)设计应该和行为(处理)设计密切结合,也就是说,整个设计过程中要把数据库结构设计和对数据的处理设计(应用系统功能设计)密切结合起来。,1,1.12 数据库设计,11NF定义:如果一个关系模式的所有属性都是不可分的基本数据项,则R1NF。任何一个关系模式都是1NF,不满足第一范式的数据库模式不能称为关系数据库。22NF定义:若关系模式RlNF,并且每一个非主属性都完全函数依赖于R的键(或码),则R 2NF。2NF就是不允许关系模式

14、的属性之间有这样的函数依赖XY,其中X是键的真子集,Y是非主属性。显然,键只包含一个属性的关系模式如果属于1NF,那么它一定属于2NF。33NF定义:如果关系模式R中不存在候选键X、属性组Y以及非主属性Z(ZY),使得XY,YZ,YX成立,则R3NF。,数据库系统知识回顾,1,计算机网络:定义为相互联接、彼此独立的计算机系统的集合。相互联接指两台或多台计算机通过信道互连,从而可进行通信;彼此独立则强调在网络中,计算机之间不存在明显的主从关系,即网络中的计算机不具备控制其他计算机的能力,每台计算机都具有独立的操作系统。,计算机网络的组成:通信子网和资源子网,计算机网络的功能:1数据通信(1)传输

15、文件(2)使用电子邮件(E-mail)2资源共享(1)共享硬件资源(2)共享软件资源(3)共享数据资源。3提高计算机系统的可靠性和可用性4易于进行分布处理,一、按地理范围分类 1.局域网(Local Area Network)特点:(1)采用的传输介质类型相对较少。(2)数据传输速率快。(3)传输延迟小,且误码率较低。(4)组网比较灵活、方便、成本较低。2.城域网(Metropolitan Area Network 一般不超过几十公里)特点:(1)采用的传输介质相对要复杂。(2)数据传输速率次于局域网。(3)数据传输距离相对局域网要长,信号容易受到干扰。(4)组网比较复杂,成本较高。3.广域网

16、(Wide Area Network,最常见的就是Internet)特点:(1)传输介质复杂(2)数据传输速率较低(3)采用的技术比较复杂(4)是一个公共的网络,即不属于一个机构或国家。,二.按通信介质分1.有线网络:网络中的通信介质全部为有线介质的网络,常见的介质有同轴电缆、双绞线、光缆、电话线等。其特点是:技术成熟;产品较多;实施方便;成本较低;受气候环境的影响较小。2.无线网络:采用无线电波、卫星、微波、红外线、激光等无线形式来传输数据的网络,即网络中的节点之间没有线缆的连接。优点:(1)高移动性;(2)保密性强;(3)抗干扰性好;(4)架设与维护容易;(5)支持移动计算机,缺点:(1)

17、技术发展较慢;(2)费用较高;(3)易受环境因素的影响;(4)安装实施要求的技术高。,三.其他分类方法1.按使用网络的对象来分(1)公用网络,是为全社会所有的人提供服务的网络。(2)专用网络,只为拥有者提供服务,一般不向本系统以外的人提供服务。2.按网络的连接方式来分(1)全连通型网络 全连通型网络是指所有节点之间的相互通信均可通过相邻的节点实现,可靠性最好。(2)交换型网络 交换型网络两个端节点之间可以通过中间节点(即转接节点)实现连 接。(3)广播型网络。3.按照通信子网的交换方式 按照通信子网的交换方式不同,网络可分为公用电路交换网、报文交换网、分组交换网、ATM交换网等。,1.星型结构

18、 星型拓扑结构即任何两节点之间的通信都要通过中心节点进行转发,中心节点通常是集线器。特点:(1)结构简单、便于集中控制和管理(2)网络易于扩展(3)故障检测和隔离方便(4)延迟时间小(5)传输误码率低中心节点负担重 网络脆弱,2.总线型结构 总线型网络是将若干个节点平等地连接到一条高速公用总线上的网络。特点:(1)结构简单灵活,便于扩充。(2)可靠性高(3)网络节点响应速度快(4)易于布线,成本较低。(5)实时性差 物理安全性差 故障诊断困难,3 环型结构 环型结构的网络指网络中的每个节点均与下一个节点连接,最后一个节点 与第一个节点连接,构成一个闭合的环路特点:(1)网络结构简单(2)路径选

19、择的控制得到简化(3)扩充不方便(4)环上节点过多时,传输效率严重下降。(5)当环中某一节点出现故障时整个网络将瘫痪,查找故障点不易。,4.树型结构 树形结构是由星型结构演变而来的。其实质是星型结构的层次堆叠特点:(1)扩展方便。(2)故障隔离容易。(3)高层节点性能要求高。,5.网状结构 网状结构是由星型、总线型、环型演变而来的,是前三种基本拓扑混合应用的结果。,Intranet提供的服务主要有:1.WWW服务WWW即World Wide Web,又称“万维网”它是互联网上集文本、声音、图像、视频等多种媒体信息于一身的信息服务系统。2.电子邮件服务即E-mail,以电子方式传递。只要通信双方

20、都有电子邮件地址,便可以交互往返邮件。3.DNS服务DNS服务用来解析域名与IP地址之间的转换工作4.FTP服务文件传输协议FTP(File Transfer Protocol)把客户的请求告诉服务器,并将服务器发回的结果显示出来。5.数据库服务传统的数据库分为集中式数据库和分布式数据库两种。(1)集中式数据库集中式数据库是以系统共享主存储器为特征。()分布式数据库分布式数据库主要用于网络系统,特别适合于网络管理信息系统,计算机平台环境的改变(P.1)卫星通信蜂窝通信局域网广域网IntranetInternet信息系统应用需求(P.1)地域上分散、管理集中的企业越来越多既要求实现本地数据管理,

21、就要求存取异地的数据既要有各部门的局部控制和分散管理;又要有整个组织的全局控制和高层次的协同管理,分布式数据库发展阶段(P.2)20世纪70年代末期产生20世纪80年代成长阶段20世纪90年代商品化应用阶段21世纪大规模应用阶段分布式数据库系统的12条规则(P.2)本地自治性不依赖于中心节点可连续操作性位置独立性数据分片独立性数据复制独立性,分布式查询处理分布式事务处理硬件独立性操作系统独立性网络独立性数据库管理系统独立性,分布式数据库定义(P.4):物理上分散而逻辑上集中的系统,它使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位(通常是集中式数据库系统)连接起来,共同

22、组成一个统一的数据库系统。分布式数据库系统可以看成是计算机网络和数据库系统的有机结合。分布式数据库系统的特点(P.45)物理分布性:数据不是存放在一个站点上逻辑整体性:是与分散式数据库系统的区别站点自治性:是与多处理机系统的区别数据分布透明性集中与自治相结合存在适当的数据冗余度事务管理的分布性,分布式数据库系统示意图(P.6),按局部DBMS的数据模型分类(P.7)同构型DDBS同构同质型同构异质型异构型DDBS按DDBS的全局控制类型分类(P.8)全局控制集中型DDBS:全局控制机制和全局数据词典位于中心站点全局控制分散型DDBS:全局控制机制和全局数据词典分散在网络的各个站点上。全局控制可

23、变型DDBS:也称主从型DDBS。分成两组站点,一组包含全局控制机制和全局控制词典,另外一组不包含。,分布式数据库系统的体系结构(P.9),数据(P.9)分布式数据库的主体局部数据:只提供本站点的局部应用所需要的数据。全局数据:虽然物理上存储在个站点上,但是参与全局应用。数据目录(P.9)数据结构的定义、全局数据的分片、分布、授权、事务恢复等描述局部数据目录:局部站点上的数据词典全局数据目录:提供全局数据的描述和管理相关信息,数据分片(P.10)又称数据分割、数据分段,局部数据库是由全局数据库分割而成水平分片(对全局关系施加选择运算)垂直分片(对全局关系施加投影运算)混合分片(两种方法的混合)

24、数据分片要遵守的原则:完备性原则:要把所有的数据映射到各个片断中可重构原则:关系分片后的各个片断可重构整个关系不相交原则:关系分片后的各个片断不能重叠,2.数据分布(P.11)根据某种策略把数据分片所得的逻辑片断分散地存储在各个站点上集中式(安排在同一站点上)分割式(分布在不同站点上)复制式(每个站点都有一个副本)混合式(分割和复制式的混合),分布式数据库是多层的,国内分为四层:全局外层:全局外模式全局概念层:全局概念模式、分片模式和分配模式局部概念层:局部概念模式(例1.4,p14)局部内层:局部内模式,分布式数据库的模式结构(P.12),除集中式数据库的基本功能,DDBMS必须提供的附加功

25、能:数据跟踪:利用日志记录数据分布、分片和复制的能力分布式查询处理:通过网络查询远程站点数据,站点间传送数据和请求分布式事务处理:为分布式查询和更新等操作设计执行策略复制数据的管理:故障后数据恢复的管理安全性:用户授权/存取权限的安全管理分布式目录管理DDBMS功能模块:查询处理、完整性处理、调度处理、可靠性处理,DDBMS的一般功能结构(P.17),DDBMS的一种参考模型(P.18),用户处理器的组成(P.19),数据处理器的组成(P.20),全局数据库控制和通信子系统的组成(P.22),集中式数据库中的数据独立性(P.25)逻辑独立性物理独立性分布式数据库中的数据独立性(P.25)逻辑独

26、立性物理独立性分布独立性(分布透明性),分三个层次(图1.3中的映像):分片透明性(完全分布透明性):映像2位置透明性(中级分布透明性):映像3局部数据模型透明性(低级分布透明性):映像4无分布透明性:异构数据,SUPPLIER(SNO,SNAME,CITY),良好的可靠性和可用性(P.34)提高系统效率,降低通信费用(P.34)较大的灵活性和可伸缩性(P.35)经济性和保护投资(P.35)适应组织的分布式管理和控制(P.35)数据分布具有透明性和站点具有较好的自治性(P.35),最重要的问题是通信网络速度问题如何控制数据的分片、分布与冗余度(P.35)如何实现异构数据库的互联(P.36)如何优化分布式数据库的查询处理(P.36)如何更好地实现分布式数据库的更新处理(P.36)如何实现分布式数据库的并发控制机制(P.36)如何实现分布式数据库的恢复控制机制(P.36)如何实现目录管理(P.36),总 结,数据库知识回顾 计算机网络知识回顾 DDBS由来和发展 DDBS基本概念和分类 DDBS体系结构和组成 DDMS中数据独立性和分布透明性 DDMS的优点和技术问题,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号