哈工大数据库课件-第七讲数据库系统体系结构.ppt

上传人:牧羊曲112 文档编号:6556349 上传时间:2023-11-12 格式:PPT 页数:88 大小:645KB
返回 下载 相关 举报
哈工大数据库课件-第七讲数据库系统体系结构.ppt_第1页
第1页 / 共88页
哈工大数据库课件-第七讲数据库系统体系结构.ppt_第2页
第2页 / 共88页
哈工大数据库课件-第七讲数据库系统体系结构.ppt_第3页
第3页 / 共88页
哈工大数据库课件-第七讲数据库系统体系结构.ppt_第4页
第4页 / 共88页
哈工大数据库课件-第七讲数据库系统体系结构.ppt_第5页
第5页 / 共88页
点击查看更多>>
资源描述

《哈工大数据库课件-第七讲数据库系统体系结构.ppt》由会员分享,可在线阅读,更多相关《哈工大数据库课件-第七讲数据库系统体系结构.ppt(88页珍藏版)》请在三一办公上搜索。

1、教学目的本章在一个更高的层次上认识数据库系统,首先简要介绍一下数据库的存储结构,然后从传统的集中式系统开始,依次讨论客户-服务器系统、并行数据库系统和分布式数据库系统,使学生了解如何根据不同的计算环境搭建与之相适应的数据库系统。主要内容数据存储,数据库系统体系结构概述,集中式数据库系统,数据库系统,并行数据库系统,分布式数据库系统教学方法课堂讲授为主重点集中式数据库系统、数据库系统、并行数据库系统、分布式数据库系统的概念及特点,分布式查询处理难点分布式查询处理,第七章 数据库系统体系结构,第七章 数据库系统体系结构,内容出处:1.Abraham Silberschatz数据库系统概念第十一章1

2、-3节,第十八章,第十九章2,7节,物理存储介质,特性数据存取速度每单位数据的成本可靠性电源故障或系统崩溃时的数据丢失介质故障介质分类易失介质(volatile storage)电源关时数据丢失非易失介质(non-volatile storage)电源关时数据持久保留,包括二级和三级存储,物理存储介质,高速缓冲存储器(Cache)最快最昂贵的存储介质,一般由操作系统来管理主存储器(Main memory)用于存放可被处理的数据的存储介质快速访问,但一般不能存放整个数据库如果发生电源故障或系统崩溃,主存储器中的数据会丢失快闪存储器(Flash memory)EEPROM:电可擦可编程只读存储器电

3、源故障时数据会保存读速度:0.1s;写速度:10s,物理存储介质,磁盘存储器(Magnetic-disk storage)用于长期联机数据存储一般存放整个数据库数据必须从磁盘移入主存才能访问直接存取(direct-access)按任意顺序存取数据如果发生电源故障或系统崩溃,数据不会丢失光盘存储(Optical storage)CD-ROM:只读,提供预先记录的数据WORM:一次写,多次读,用于数据归档,物理存储介质,磁带存储(Tape storage)用于数据的备份和归档顺序访问(sequential-access)速度慢容量大价格低,存储层次,基本存储,辅助存储,三级存储,易失性存储,非易失

4、性存储,存储层次,基本存储(primary storage)快速但易失cache,main memory辅助存储(secondary storage)非易失,相对快速 联机存储(on-line storage)flash memory,magnetic disks三级存储(tertiary storage)非易失,速度慢相对快速脱机存储(off-line storage)magnetic tape,optical storage,磁盘结构,磁盘性能估计,访问时间从发出请求到数据开始传输之间的时间寻道时间(Seek time)磁盘臂定位时间,即磁盘臂移动到正确的磁道所需时间与移动距离成正比,平均

5、寻道时间是最坏时间的1/3旋转等待时间(Rotational latency)寻道结束后,等待被存取的扇区出现在读写头下面的时间平均旋转等待时间是磁盘旋转一周时间的1/2数据传输率从磁盘获得数据或向磁盘存储数据的速率平均故障时间(MTTF)预期系统无故障连续运行的时间是指基于全新磁盘发生故障的可能性,RAID,廉价磁盘冗余阵列(RAID)Redundant Arrays of Inexpensive Disks是一种利用大量廉价磁盘进行磁盘组织的技术价格上,大量廉价的磁盘比少量昂贵的大磁盘合算得多性能上,使用大量磁盘可以提高数据的并行存取可靠性上,冗余数据可以存放在多个磁盘上,因此一个磁盘的故

6、障不会导致数据丢失过去RAID是大而昂贵的磁盘的替代方法;今天,使用RAID是因为它的高可靠性和高数据传输率;因此“I”代表independent,而非inexpensive,RAID,通过冗余提高可靠性N个磁盘组成的集合中某个磁盘发生故障的概率比特定的单个磁盘发生故障的概率高很多 假定单个磁盘的MTTF是100,000小时(约为11年),则由100个磁盘组成的阵列的MTTF是1000小时(约为41天)冗余(Redundancy)存储额外的信息,以便当磁盘故障时能从中重建镜像(Mirroring or shadowing)一个逻辑磁盘由两个物理磁盘组成,写操作在每个磁盘上执行如果其中一个发生故

7、障,数据可以从另一个磁盘读出只有第一个磁盘的故障尚未恢复,第二个磁盘也发生故障,这时才会发生数据丢失假定一个磁盘的MTTF是100,000小时,修复时间是10小时,则镜像磁盘系统的MTTF是100,0002/(2*10)=500*106小时,约为57000年,RAID,通过并行提高性能负载平衡多个小的存取操作(即页面存取),以提高这种存取操作的吞吐量并行执行大的存取操作,以减少大的存取操作的响应时间通过在多个磁盘上对数据进行拆分来提高传输率比特级拆分(Bit-level striping)将每个字节按比特分开,存储到多个磁盘上例如,对于一个由8个磁盘组成的阵列,将每个字节的第i个比特位写到第i

8、个磁盘上;它的存取速度是单个磁盘的8倍对于由4个磁盘组成的阵列,将每个字节的第i个比特位和第i+4个比特位写到第i个磁盘上块级拆分(Block-level striping)对于由n个磁盘构成的阵列,文件的第i块 存放在第(i mod n)+1个磁盘上,RAID,RAID级别镜像提供高可靠性,拆分提供高数据传输率,通过利用与奇偶校验相结合的磁盘拆分思想,可以实现以较低成本提供冗余的方案不同的RAID级别,具有不同的代价、性能和可靠性,C,P,代表数据的第二个拷贝,表示纠错位,RAID,RAID 0块级拆分且没有任何冗余(如镜像或奇偶校验位)的磁盘阵列用于高性能访问并且数据丢失不十分重要的应用场

9、合,RAID,RAID 1带块级拆分的磁盘镜像完全容错,成本高一般用于类似于数据库系统中日志文件存储的应用场合,RAID,RAID 2按比特级拆分,具有内存风格的纠错码纠错码(ECC:Error-Correcting-Codes)内存中每个字节都有一个奇偶校验位与之相连,它记录这个字节中为1的比特位的总数是偶数(=0)还是奇数(=1),如果字节中有一位被破坏,则字节的ECC与存储的ECC就不会相匹配;通过ECC可以检测到所有的1位错误;通过更多的附加位,当数据遭到破坏时,还可以重建数据,RAID,RAID 3磁盘控制器能够检测一个扇区是否被正确的读出如果一个扇区被破坏,我们先能准确地知道是哪个

10、扇区坏了,然后对扇区的每一位,通过计算其他磁盘上对应扇区的对应位的奇偶值来推断该位是1还是0。如果其余位的奇偶值等于存储的奇偶值,则丢失的位是0,反之为1RAID 3效果与RAID 2一样,但只有一个磁盘的额外开销使用N道数据拆分的RAID 3对一个字节的读写散布在多个磁盘中,因此读写一个块的传输率是使用N道数据拆分的RAID 1的N倍每个磁盘参与每个I/O请求,每秒RAID 3支持的I/O数较少,RAID,RAID 4块级拆分,在一个独立的磁盘上为其他N个磁盘上对应的块保留一个奇偶校验块读取一个块只访问一个磁盘每个存取操作的传输率低,但可以并行地执行多个读操作,从而产生较高的总的I/O率读取

11、大量数据的操作有很高的传输率,因为所有磁盘可以并行地读,RAID,RAID 5将数据和奇偶校验位都分布到所有的N+1个磁盘上;对每个块,一个磁盘存储奇偶校验位,其余磁盘存储数据例如由5个磁盘组成的阵列,第n块的奇偶校验位存储在第(n mod 5)+1上,其余4个磁盘的第n块存储了对应这个块的实际数据奇偶校验块不能和这个块对应的数据存储在同一个磁盘上所有磁盘都参与对读请求的服务,而RAID 4中奇偶校验磁盘不参与读操作RAID 5包容了RAID 4,同时在相同成本下,提供了更好的读写性能,RAID 5:块交叉的分布奇偶校验,P,P,P,P,P,RAID,RAID 6类似于RAID 5,存储了额外

12、的冗余信息不采用奇偶校验位的方法,使用类似Reed-Solomon码的编码对每4位数据存储2位冗余信息可以容忍两个磁盘发生故障,RAID 6:P+Q冗余,P,P,P,P,P,P,高性能可靠性差,完全容错成本高,高数据传输率大数据量,高的总I/O率适合随机读大数据量,高可靠性,用于数据安全性不是很重要的高性能应用,相对于RAID5,RAID3很少使用,适于日志文件的存储,相对于RAID1,具有较低的存储开销,但写操作开销高,因此适于经常进行读而很少写的应用,适于数据安全十分重要的应用,数据库系统体系结构,数据库系统体系结构,数据库系统体系结构概述集中式数据库系统数据库系统并行数据库系统分布式数据

13、库系统,数据库系统体系结构概述,数据库系统的体系结构与计算机系统的体系结构密切相关集中式体系结构 集中式数据库系统计算机的联网 客户/服务器数据库系统并行处理能力 并行数据库系统分布计算能力 分布式数据库系统,集中式体系结构,集中式系统,集中式系统运行在一台机器上,数据集中存储在一台计算机中,并且不与其他计算机系统交互的数据库系统单用户系统个人使用的桌面系统单CPU,1至2个硬盘,OS可以只支持单用户数据库系统不支持并发控制,故障恢复能力没有或非常有限,用户接口类似QBE多用户系统服务大量用户,用户通过终端与之相连多个磁盘,多个主存储器,多个CPU,多用户OS具有并发控制、故障恢复等能力,客户

14、-服务器系统,PC的速度更快,能力更强,价格更低连接到集中式系统的终端被PC代替;以前由集中式系统执行的诸如用户界面功能由PC来处理;集中式系统变成服务器系统的作用,来响应客户系统产生的请求,客户-服务器系统,集中式或分布式-单服务器与多服务器系统单服务器系统:多个客户共享一个服务器多服务器系统:一个客户可以对多个服务器进行访问。,客户-服务器系统,数据库功能的划分后端(Back-end)存取结构、查询计算和优化、并发控制、故障恢复前端(Front-end)表格生成工具、报表书写工具、图形用户界面工具前端和后端的接口通过SQL或应用程序接口,客户-服务器系统,客户/服务器优点有利于充分利用网络

15、中的计算资源减少网络上的传输量高性能/价格比可扩展性友好的用户接口易维护,客户-服务器系统,服务器系统的分类事务服务器又称查询服务器或SQL服务器广泛用于关系数据库系统客户向服务器发送请求,事务在服务器端执行,结果返回给客户端可以以SQL表达请求,也可以通过应用程序接口,使用远程过程调用(RPC)机制来表达请求Open Database Connectivity(ODBC)使用ODBC接口的任何客户程序都可以与提供ODBC接口的任何服务器连接,客户-服务器系统,数据服务器用于局域网中客户与服务器之间具有高速连接客户机与服务器的处理能力相当,并且其执行的任务主要以计算为主数据传送到客户机器,在客

16、户机上进行所有处理,然后再把数据传回到服务器多用于面向对象数据库系统,并行系统,并行数据库系统由通过高速互连网络连接在一起的多个CPU、存储器和磁盘组成查询大数据量处理大数量的事务粗粒度并行机由几个能力强大的处理器组成细粒度并行机由数千个小处理器组成,并行系统的需求和目的,数据库应用需求查询非常大的数据库(1012字节以上)处理很大数量的事务(每秒数千个事务)引入并行的目的保证即使在数据库的规模和事务的数量都大大增长时,数据库系统仍能以可接受的速度运行。,并行系统的需求和目的,关系数据库的固有并行性数据操作间的流水线并行性age20(s)dept数据操作间的独立并行性age20(s)dno,d

17、ean(dept)单数据操作内的并行性age20(s),并行系统的需求和目的,数据库系统性能的度量吞吐量(throughput):在给定的时间区间里所能完成的任务的数量。响应时间(response time):对于单个任务从提交到完成所需的时间。对于处理大量小事务的系统,通过并行地处理许多事务可以提高吞吐量。对于处理大事务的系统,通过并行地执行每个事务中的子任务可以缩短响应时间,同时提高吞吐量。,并行系统,加速比(Speedup)通过增加并行度来在更短的时间内运行一个给定的任务目标:使处理任务所需的时间与所分配的处理器和磁盘的数量成反比例。扩展比(Scaleup)通过增加并行度来处理更大的任务

18、目标:使能够处理的任务的规模与所分配的处理器和磁盘的数量成正比例。,并行系统:加速比,线性的加速比:当较大的系统的资源是较小的系统的资源的N倍,获得的加速比也是N时,称并行系统实现了线性的加速比。亚线性的加速比:当较大的系统的资源是较小的系统的资源的N倍,而获得的加速比小于N,则称系统实现了亚线性的加速比。,并行系统:扩展比,线性的扩展比:如果TL=TS,则称并行系统ML对于任务Q实现了线性的扩展比。亚线性的扩展比:如果TL TS,则称系统实现了亚线性的扩展比。,并行系统:负影响因素,启动代价进程初始化的启动时间,影响加速比干扰竞争共享资源,影响加速比和扩展比偏斜任务的分配是有偏的最慢的并行步

19、骤起决定作用木桶效应,互连网络结构,总线(Bus)所有系统成分通过单一的通信总线来发送和接收数据适于少量处理器的情况,不适于并行度增大的情况网格(Mesh)将各种成分都安排成网格中结点,每个结点与网格中它的所有邻接结点相连接 相互间没有直接连接的结点间的通信可以通过一系列相互间有直接连接的结点来传送有较好的扩展性超立方体(Hypercube)系统各成分按二进制编码,如果某两个成分的二进制编号相差1位,那么它们之间连接起来每个成分将与log(n)个其他成分相连接,并且最多经过log(n)个链可以到达其他成分,互连网络结构,并行数据库体系结构,并行数据库体系结构,共享内存所有处理器和磁盘通过总线或

20、互连网络访问一个公共主存储器处理器间的通信效率高,共享内存中数据可以被任何处理器访问一个处理器通过写共享内存的方式来向其他处理器发送消息规模有限制,总线会成为瓶颈,一般不能超过64个处理器缺点规模不能超过32个或64个处理器,因为总线或互连网络是由所有的处理器共享的,它会变成瓶颈。,并行数据库体系结构,共享磁盘所有处理器可以通过互联网络直接访问所有的磁盘,每个处理器有自己的主存储器以较为经济的方式提供一定的容错性处理器间的通信通过网络来完成存储器总线不再成为瓶颈,但与磁盘子系统的连接成为瓶颈,并行数据库体系结构,无共享机器的每个结点包括一个处理器,一个存储器,一个或多个磁盘一个结点上的处理器通

21、过高速网络与另一个结点上的处理器通信通信代价和非本地磁盘的访问高层次的最上层是无共享体系结构低层是共享内存体系结构中间是共享磁盘体系结构,并行数据库体系结构,无共享的结构是支持并行数据库系统的最好并行结构(Stonebraker 1986年提出,得到普遍接受。)理由共享资源最少,从而由资源竞争带来的系统干扰最小。具有高可扩充性,处理器个数可扩展到数千甚至上万个而不增加处理器间的干扰。在数据库查询处理过程中需要在通讯网络上进行的数据通讯量较小。在复杂数据库查询处理和联机事务处理中可获得接近线性的加速。,分布式数据库系统,分布式数据库系统,基本定义,背景数据库系统+计算机网络,基本定义,基本特性分

22、布性数据存储在不同场地上与集中式数据库不同逻辑整体性数据逻辑上是相互联系的一个整体与分散在计算机网络不同站点上的一组没有相互联系的本地数据库区别开来,基本定义,定义描述定义D-DBS是一个数据集合,这些数据在逻辑上属于同一个系统,但在物理上分布在计算机网络的不同结点上精确定义D-DBS是一个数据集合,这些数据,分布在计算机网络的不同计算机上,网络中每个结点具有独立处理的能力,可以执行局部应用,同时每个结点也能通过网络通讯支持全局应用分布式数据库强调场地自治性(局部应用)以及自治场地之间的协作性(全局应用)“在自治的结点之间协同工作”,D-DBS的特点,数据独立性D-DBS除了集中式DBS的物理

23、独立性及逻辑独立性之外,还有数据分布的独立性,也称分布透明性,即用户不必关心数据物理位置的分布集中与自治相结合的控制结构集中式DBS中,控制是集中的,统一由DBA维护D-DBS中,控制是分层的:全局DBA:管理整个数据库本地DBA:管理本地数据库,D-DBS的特点,适当增加数据冗余集中式DBS中,尽可能减少数据冗余以避免不一致性及节省存储空间D-DBS中,适当增加冗余,在不同场地存储同一数据的多个副本提高系统可靠性、可用性:一场地发生故障,可存取另一场地同一副本提高系统性能:存取距离最近的数据副本,减少通讯代价全局的一致性、可串行性、可恢复性涉及多个结点,D-DBS的优点,经济上和组织上的理由

24、数据库的使用单位组织上、地理上是分布的既有数据库互连历史继承;数据资源共享系统规模逐步扩展增加结点,不影响现有系统运行减少通讯开销提高应用的本地化提高系统的可靠性与可用性多副本机制,D-DBS的体系结构,D-DBS的体系结构,G-外模式全局应用的用户视图。G-概念模式定义D-DBS中数据的整体逻辑结构,数据如同没有分布一样。分片模式每一个关系可以分为若干互不相交的部分,每一部分称为一个片段。分布模式定义片段的存放地点,分布式数据存储,数据在分布式数据库的存储途径复制系统维护关系的几个完全相同的副本,这些副本存储在不同的结点上分片关系被划分为几个片段,各个片段存储在不同的结点上复制+分片关系被划

25、分为几个片段,系统为每个片段维护几个副本,分布式数据存储,数据复制优点可用性增加并行度缺点一致性维护结论有利于只读事务,增加更新事务开销,分布式数据存储,数据分片优点将关系分片,有利于按用户需求组织数据的分布。如产品(内销产品,出口产品)。分片方式水平分片垂直分片导出分片混合分片,分布式数据存储,水平分片将关系r按行分为若干子集r1,r2,rn,每个子集ri称为一个水平片段一个水平片段可以看成是关系上的一个选择ri=P(i)(r)如C_S=DNO=D08(S)关系的重构可以通过并运算来实现r=r1 r2rn,分布式数据存储,垂直分片将关系r按列分为若干属性子集r1,r2,rn,每个子集ri称为

26、一个垂直片段一个垂直片段可以看成是关系上的一个投影ri=Ri(r)其中Ri是r的一个属性子集 如P_S=PNO,SAL(P)关系的重构可以通过连接运算来实现。r=r1 r2 rn所有分片都包括每个元组的唯一标识码tuple_id,分布式数据存储,导出分片导出水平分片,分片的条件不是关系本身属性条件,而是其它关系的属性条件如SC(S#,C#,G)按学生系别分片混合分片关系按某种方式分片后,得到的片段再按另一种方式继续分片如SC(S#,C#,G)按学生系别分片,再对每个片段按成绩(及格,不及格)分片,分布式数据存储,分布(网络)透明性分片透明性用户或应用程序只对全局关系进行操作而不必考虑关系的分片

27、。如果分片模式改变了,通过调整全局模式与分片模式之间的映象关系来保持全局模式不变位置透明性用户或应用程序不必了解片段的存储位置局部数据模型透明性用户或应用程序不必了解局部场地上使用的是哪种数据模型,分布式数据存储,示例:设有全局关系S,它被划分为两个片段S-A(本科生),S-B(研究生),S-B有两个副本,分布式数据存储,写一个查询,输入学号,输出学生姓名系统具有分片透明性scanf(“%s”,S_NO);EXEC SQL select SN into:S_NAME from S where SNO=:S_NO;printf(“%d,%s”,S_NO,S_NAME);,分布式数据存储,系统具有

28、位置透明性,但不具有分片透明性scanf(“%s”,S_NO);EXEC SQL select SN into:S_NAME from S_A where SNO=:S_NO;if(!FOUND)EXEC SQL select SN into:S_NAME from S_B where SNO=:S_NO;printf(“%d,%s”,S_NO,S_NAME);,分布式数据存储,系统具有局部模型透明性,但不具有位置透明性scanf(“%s”,S_NO);EXEC SQL select SN into:S_NAME from S_A at Site_1 where SNO=:S_NO;if(!F

29、OUND)EXEC SQL select SN into:S_NAME from S_B at Site_2(或Site_3)where SNO=:S_NO;printf(“%d,%s”,S_NO,S_NAME);,分布式数据存储,数据项的命名每个数据项(关系、副本、片段)必须有唯一的名字,在分布式数据库系统中必须保证在不同的结点上不会用同一个名字来代表不同的数据项途径1:名字服务器所有名字都在名字服务器中注册,每个名字对应一个数据项缺陷:名字服务器成为名字解析的瓶颈;依赖性大途径2:将结点标识作为前缀加到该结点数据项的名字前面(site1.Tom,site2.Jerry)保证唯一性,不须中央

30、控制;不能保证网络透明性,分布式数据存储,途径3:别名用户使用简单的别名引用数据,别名被系统翻译成完整的名字别名到真实名字的映射形成一张别名表被存储在系统的每一个结点上。当用户引用别名时,系统通过查找别名表找到实际的数据项对照路由表,分布式查询处理,假定每条元组100bit大小求供应红色零件的、北京的供应商号码select S.S#from S,P,SPwhere S.CITY=北京 and S.S#=SP.S#and SP.P#=P.P#and P.COLOR=红色,分布式查询处理,把关系P从B站传送到A站,在A站进行查询传送时间T=1+105 100/104=103s,S,SP,P,传P,

31、传送时间T=总传输延迟+总数据量/传输速度,分布式查询处理,把关系S,SP从A站传送到B站,在B站进行查询传送时间T=2+(104+106)100/104104s,S,SP,P,传S,SP,分布式查询处理,在A站连接S与SP,选出城市为北京的元组(假定有105个),然后对其中每个元组的P#,询问B站,看其是否为红色传送时间T=2 105s,S,SP,P,问,答,分布式查询处理,在B站选出红色零件(假定有10个),然后对每个元组询问A站,看北京的供应商是否供应此零件传送时间T=2 10=20s,S,SP,P,问,答,分布式查询处理,在A站选出北京的供应商(105个),传送到B站,在B站完成查询传

32、送时间T=1+105100/104=103s,S,SP,P,传(S)SP,分布式查询处理,在B站选出红色零件(10个),把结果传送到A站,在A站完成查询传送时间T=1+10100/104=1.1s,S,SP,P,传(P),分布式查询处理,场地1:EMP(ENO,ENAME,ADDRESS,SEX,DNO)ENO(9),ENAME(10),ADDRESS(20),DNO(4),有10000条记录,每条记录100字节,共106字节场地2:DEPT(DNO,DNAME,MGR,MGRSTARTDATE)DNO(4),DNAME(10),MGR(9),DNO(4),有100条记录,每条记录35字节,共

33、3500字节在场地2查询每个部门的名字和其经理的姓名和地址,分布式查询处理,方法1:把数据从场地1传到场地2,传输数据量为106字节方法2:把数据从场地2传到场地1,再将结果传回场地2,传输数据量为 3500+100*(10+10+20)=7500字节缺点以整个关系作为传输单位有些属性或元组并不参与连接改进:只传输有用的数据项,分布式查询处理,半连接示例step1:在场地2,用投影操作将DEPT中参与连接的属性找出来,把投影结果 传到场地1,传输数据量为4*100=400step2:在场地1,执行连接操作,用投影求出所需属性,把结果送到场地2,传输数据量为100*(9+10+20)=3900s

34、tep3:在场地2,执行连接操作:总传输数据量为400+3900=4300,分布式查询处理,半连接运算定义半连接R S=R(R S),=,分布式查询处理,=,分布式查询处理,R,S,R S,R S,S R,分布式查询处理,半连接作用找出R中能够与S中元组相连接的元组来,类似于在连接之前先做选择和投影半连接的非对称性,分布式查询处理,半连接在分布式数据库中的应用R与S位于不同场地S1,S2上,其属性组分别为R1,R2,要在S1场地求R和S的连接结果在S1场地对R做投影,将R缩减为RR=R1R2(R)将R 送往场地S2在S2场地完成S与R的半连接操作,将S缩减为SS=S R将S送回场地S1 在S1

35、场地完成R与S的连接操作R S=R S,分布式查询处理,通讯代价模型TC(X)=C0+X*C1其中X为数据传输量,C0为两结点初始化一次传输所花费的开销,C1为传输率,即单位数据传输所花费的时间采用半连接的通讯代价:CSJ=2C0+(size(R)*card(R)+size(S)*card(S)*C1不采用半连接的通讯代价:CJN=C0+size(S)*card(S)*C1size(S):S中元组的长度;card(S):S的元组数当S中参与连接的元组足够少时采用半连接策略更有利,主要内容数据存储磁盘结构,RAID数据库系统体系结构集中式数据库系统数据库系统并行数据库系统分布式数据库系统学生应掌握的内容集中式数据库系统、数据库系统、并行数据库系统、分布式数据库系统的概念及特点,分布式查询处理,本章总结,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号