《《物理模式设计》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《物理模式设计》PPT课件.ppt(24页珍藏版)》请在三一办公上搜索。
1、2023年7月20日星期四,1,第5章:物理模式设计,主要内容5.1物理模式设计简介5.2索引的原理与设计原则,2023年7月20日星期四,2,数据库系统概念-导论,5.1数据库的三级模式,物理模式数据的存储结构,研究数据如何存储也称作称存储模式、内模式 逻辑模式全体数据的逻辑结构又称作全局模式外模式具体用户看到的数据的逻辑结构又称作子模式、用户模式,2023年7月20日星期四,3,数据库系统概念-导论,5.1数据库的三级模式关系示意图,5.1物理模式设计的目标,物理模式设计目标在硬件及系统环境限制下,为逻辑模式的实现提供最理想的支持主要是性能支持,2023年7月20日星期四,4,5.1物理模
2、式设计在工程中的位置,数据的物理独立性当物理模式发生变化时,通过调整物理/逻辑模式映像,可以保持逻辑模式不变,进而应用程序不需改变;这种数据和程序的独立性,称为数据的物理独立性。物理模式设计在工程中的位置在逻辑模式设计完成后、程序开发之前进行可以在系统上线实施调整在系统运行期间,根据实际情况继续调整,2023年7月20日星期四,5,5.2索引的原理与设计原则,本节要点数据访问类型分析索引的基本工作原理介绍顺序文件与主索引辅助索引常见的索引结构索引的相关说明索引设计的原则,2023年7月20日星期四,6,2023年7月20日星期四,7,5.2.1:数据访问类型分析,数据访问的类型查询修改据调查:
3、数据查询的访问数量远大于数据修改的数量数据查询的类型特定值查询例如:select*from s where sno=2009012689值范围查询例如:select*from sc where score=60 and score70,2023年7月20日星期四,8,索引的基本工作原理,许多查询只涉及文件中的少量记录找出计算机系的所有女学生找出学号为s01的学生姓名只涉及少量记录查询的实现读取所有记录并一一检查:非常低效理想目标:快速甚至直接定位查询记录索引为了实现快速数据定位,对数据文件设计的附加结构与图书馆中图书索引的原理相同,2023年7月20日星期四,9,5.2.2:索引设计基本原理示
4、意,S9999,S0002,S0001,B5826,T1,T2,T5,T9997,T9998,T9999,B1B5555,Select*from S where Sno=S4567;全表扫描,O(n),n=10,000,平均读入1700磁盘块索引扫描,O(logn),n=10,000,除去索引块,只需读入1磁盘块,而索引所占空间小的多,索引,5.2.3:顺序文件与主索引,数据块可用的磁盘空间被划分为很多块块是磁盘空间输入和输出的最小单位索引记录(索引项)由一个搜索码值和指向具有该搜索码值的一个或多个记录的指针构成指向记录的指针包括磁盘块的标识和标识磁盘块内记录的块内偏移量顺序文件元组在块中按照
5、搜索码的升序存储主索引(聚集索引)顺序文件中搜索码对应的索引有主索引的顺序文件称作索引顺序文件,2023年7月20日星期四,10,2023年7月20日星期四,11,5.2.3:顺序文件与主索引示意,顺序文件与主索引示意主索引可以采用稀疏索引稀疏索引只为搜索码的某些值建立索引主索引一般可以驻留内存特定值查询、值范围查询:非常高效一个表至多有一个主索引,2023年7月20日星期四,12,5.2.4:辅助索引,辅助索引(非聚集索引)文件中元组物理存储顺序与搜索码顺序不同的索引一个表可以有多个辅助索引辅助索引必须采用稠密索引,2023年7月20日星期四,13,常见的索引结构,索引文件的主要组织类型散列
6、索引顺序索引散列索引将值平均分布到若干散列桶中能很好地支持特定值查询不能有效支持值范围查询顺序索引基于值的大小顺序组织的索引能很好地支持特定值查询、值范围查询典型代表:B+树索引,是目前主流的索引结构,5.2.5:B树简介,一棵 m 序B树是一颗满足下列条件的树:1、每个结点至多有m个孩子;2、除根结点和叶结点外,其它每个结点至少有 m/2个孩子;3、根结点至少有两个孩子;4、所有叶结点在同一层,叶结点不包含任何关 键字信息;5、有K个孩子的非叶结点恰好包含K-1个关键字。,2023年7月20日星期四,14,5.2.5:B树示意,一个3序B树示意,2023年7月20日星期四,15,5.2.5:
7、B树查询的高效性分析,每个结点包含1000个关键字,故在第三层上有100多万个叶结点,这些叶节点可容纳10亿多个关键字。通常根结点可始终置于内存中,因此在这棵B树中查找任一关键字至多只需二次访问外存。,2023年7月20日星期四,16,5.2.5:B+树简介,B+树是一种B树的变形一棵m阶的B+树和B树的差异在于:所有的叶子结点中包含了全部关键字的信息,及指向含这些关键字记录的指针,且叶结点依关键字的大小从小到大顺序链接。非叶结点仅具有索引作用,结点中仅含有其子树中最小关键字。(B树键值只出现一次)叶结点的关键字可以多于m,也可以少于m。,2023年7月20日星期四,17,5.2.5:一个B+
8、树示意,一个3序B+树示意,2023年7月20日星期四,18,2023年7月20日星期四,19,5.2.6:索引 的相关说明,索引的有关说明可以动态地定义索引,即可以随时建立和删除索引不允许用户在数据操作中引用索引,索引是否使用、如何使用、如何维护完全由系统决定;一个表上可建多个索引。索引可以提高查询效率,但索引过多耗费空间,且降低了插入、删除、更新的效率,并且会增加系统选择索引的时间代价有些DBMS自动建立以下列上的索引 PRIMARY KEY UNIQUE,2023年7月20日星期四,20,5.2.6:索引 的相关说明,索引的定义格式create unique/distinct clust
9、er index 索引名on 表名(列名 asc/desc,列名asc/desc)unique(distinct):唯一性索引,不允许表中不同的行在索引列上取相同值。若已有相同值存在,则系统给出相关信息,不建此索引。系统并拒绝违背唯一性的插入、更新 cluster:聚集索引,表中元组按索引项的值排序并物理地聚集在一起。一个基本表上只能建一个聚集索引 asc/desc:索引表中索引值的排序次序,缺省为asc,2023年7月20日星期四,21,5.2.6:索引 的相关说明,示例:create cluster index s-index on S(SN)索引的删除格式 drop index 索引名索
10、引连接(INDEX-JOIN)对表2按连接字段建立索引对表1中的每个元组,依次根据其连接字段值查询表2的索引,从中找到满足条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组,2023年7月20日星期四,22,5.2.7:索引设计的原则,索引建立原则:不必为小表创建索引为表的主码建立索引为检索数据时大量使用的列建立辅助索引(如 name)若经常基于外码访问数据,则为该外码建立辅助索引为经常有如下情况的列建立辅助索引:选择或连接条件;ORDER BY;GROUP BY;其他含有排序的操作(如 UNION 或 DISTINCT)慎重为经常被更新的列或表建立索引如果查询将检
11、索表中记录的大部分(如25%),即使表很大,也不建立索引。这时查询整表要比用索引查询更有效(选择率),2023年7月20日星期四,23,5.2.7:索引设计的原则,索引与查询优化有些DBMS允许检查优化器的策略,从而可以分析改善查询的性能;Oracle EXPLAIN PLAN,DB2 EXPLAIN,ACCESS性能分析器查询优化器依赖于存储在系统目录中的数据库统计来选择最佳策略,每当创建索引时,DBMS自动将此索引增加到系统目录中。但是,系统目录中与表和索引相关的统计信息的更新,需要数据库用户自己使用DBMS提供的工具完成索引的删除如果维护索引可能会降低重要的更新事务,就考虑删除索引如果大量的记录被插入到有索引的表中,可以先删除索引,再执行插入,然后重建索引(若增加表大小超过10%),2023年7月20日星期四,24,数据库系统概念-E-R,练习,思考与练习:对下述关系模式,应该建立哪些索引?为什么?Dept(dno,dname)Student(sno,sname,dno,time)/dno references dept(dno)Course(cno,cname)SC(sno,cno,score),