数据库的逻辑设计.ppt

上传人:小飞机 文档编号:5985698 上传时间:2023-09-11 格式:PPT 页数:38 大小:214.63KB
返回 下载 相关 举报
数据库的逻辑设计.ppt_第1页
第1页 / 共38页
数据库的逻辑设计.ppt_第2页
第2页 / 共38页
数据库的逻辑设计.ppt_第3页
第3页 / 共38页
数据库的逻辑设计.ppt_第4页
第4页 / 共38页
数据库的逻辑设计.ppt_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《数据库的逻辑设计.ppt》由会员分享,可在线阅读,更多相关《数据库的逻辑设计.ppt(38页珍藏版)》请在三一办公上搜索。

1、7.4 数据库的逻辑设计,逻辑结构设计的任务把概念结构设计阶段设计好的基本E-R图转换为与选用DBMS产品所支持的数据模型相符合的逻辑结构,逻辑结构设计的步骤,7.4.1 E-R图向关系模型的转换,要解决的问题联系向模式转化一般地,实体均可转化为关系模式确定模式的属性和码,1:1联系的转化,转换为一个独立的关系模式,则与该联系相关的实体的码及其本身的属性均转化为关系的属性R1(k,a),R2(h,b),R3(k,h,s)与某一端实体对应的关系模式合并,则在关系中加入另一关系的码和联系的属性R1(k,a,h,s),R2(h,b),1:1联系转化例,病人,入住,病床,病号,姓名,性别,病因,床号,

2、长度,高度,?,1,1,1:1联系转化中存在的问题,理论上,1:1联系可以向任意一方合并,但是但在一些情况下,与不同的关系模式合并效率会大不一样。因此究竟应该与哪端的关系模式合并需要依应用的具体情况而定。由于连接操作是最费时的操作,所以一般应以尽量减少连接操作为目标。例如:上例中,如何经常要查询某病人的入院时间(用于结账),若将联系并入病床方显然会降低效率。,1:n联系的转化,转化为一个独立的关系模式,与该联系相连的各实体的码以及联系本身的属性均转换为关系的属性,而关系的码为n端实体的码与n端的关系模式合并R1(k,a),R2(h,b,k,s),K,a,E1,r,E2,h,b,s,1,n,1:

3、n联系转化例,m:n联系的转化,直接转化为一个关系,包括与联系相关的实体的码以及本身的属性 R(k,h,s),K,a,E1,r,E2,h,b,s,m,n,m:n联系转化例,学生,选秀,课程,学号,姓名,性别,出生,课号,课名,学分,?,n,m,三个或三个以上实体间的一个多元联系转换为一个关系模式,包含了相关实体的码及其自身的属性,多元联系的转化,具有相同码的关系模式可以合并,例如班级(班号,班名,人数)班主任(班号,姓名,性别),课本第223页,提问,7.4.2 数据模型的优化,得到初步数据模型后,还应该适当地修改、调整数据模型的结构,以进一步提高数据库应用系统的性能,这就是数据模型的优化关系

4、数据模型的优化通常以规范化理论为指导,数据模型优化的步骤,确定函数依赖关系消除冗余确定范式对于不满足要求的范式进行分解一般要求第三范式对关系模式进行必要的分解,提高数据操作的效率和存储空间的利用率(?),例:在关系模式 学生成绩单(学号,英语,数学,语文,平均成绩)中存在下列函数依赖:学号英语 学号数学 学号语文 学号平均成绩(英语,数学,语文)平均成绩,提问,7.4.3 设计用户子模式(视图),定义用户外模式时应该注意的问题 包括三个方面:(1)使用更符合用户习惯的别名(2)针对不同级别的用户定义不同的View,以满足系统对安全性的要求(3)简化用户对系统的使用,为一般顾客建立视图:产品1(

5、产品号,产品名,规格,单价)为产品销售部门建立视图:产品2(产品号,产品名,规格,单价,车间,生产负责人)顾客视图中只包含允许顾客查询的属性销售部门视图中只包含允许销售部门查询的属性生产部门则可以查询全部产品数据可以防止用户访问不允许他们查询的数据,保证系统的安全性,例 关系模式产品(产品号,产品名,规格,单价,生产车间,生产负责人,产品成本,产品合格率,质量等级),7.5 数据库的物理设计,数据库的物理设计数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,它依赖于选定的数据库管理系统为一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,就是数据库的物理设计,数据库物理设计

6、的内容和方法,设计数据库物理结构的准备工作对要运行的事务进行详细分析,获得选择物理设计所需参数充分了解所用RDBMS的内部特征,特别是系统提供的存取方法和存储结构,数据库查询事务查询的关系 查询条件所涉及的属性 连接条件所涉及的属性 查询的投影属性,选择物理数据库设计所需参数,选择物理数据库设计所需参数,数据更新事务被更新的关系每个关系上的更新操作条件所涉及的属性 修改操作要改变的属性值 每个事务在各关系上运行的频率和性能要求,7.5.2 关系模式存取方法的选择,DBMS常用存取方法索引方法目前主要是B+树索引方法经典存取方法,使用最普遍 聚簇(Cluster)方法HASH方法,索引方法一定优

7、于无索引的方法?,选择索引存取方法的一般规则如果一个(或一组)属性经常在查询条件中出现,则考虑在这个(或这组)属性上建立索引(或组合索引)如果一个属性经常作为最大值和最小值等聚集函数的参数,则考虑在这个属性上建立索引?如果一个(或一组)属性经常在连接操作的连接条件中出现,则考虑在这个(或这组)属性上建立索引关系上定义的索引数过多会带来较多的额外开销 维护索引的开销 查找索引的开销,聚簇为了提高某个属性(或属性组)的查询速度,把这个或这些属性(称为聚簇码)上具有相同值的元组集中存放在连续的物理块称为聚簇,聚簇的用途,大大提高按聚簇码进行查询的效率例:假设学生关系按所在系建有索引,现在要查询信息系

8、的所有学生名单。信息系的500名学生分布在500个不同的物理块上时,至少要执行500次I/O操作如果将同一系的学生元组集中存放,则每读一个物理块可得到多个满足查询条件的元组,从而显著地减少了访问磁盘的次数,聚簇的用途,节省存储空间 聚簇以后,聚簇码相同的元组集中在一起了,因而聚簇码值不必在每个元组中重复存储,只要在一组中存一次就行了,聚簇查询方法一定优于相同关键字设置的索引查询?,聚簇只能提高某些特定应用的性能 建立与维护聚簇的开销相当大对已有关系建立聚簇,将导致关系中元组移动其物理存储位置,并使此关系上原有的索引无效,必须重建当一个元组的聚簇码改变时,该元组的存储位置也要做相应移动,聚簇的局

9、限性,1.既适用于单个关系独立聚簇,也适用于多个关系组合聚簇例:假设用户经常要按系别查询学生成绩单,这一查询涉及学生关系和选修关系的连接操作,即需要按学号连接这两个关系,为提高连接操作的效率,可以把具有相同学号值的学生元组和选修元组在物理上聚簇在一起。这就相当于把多个关系按“预连接”的形式存放,从而大大提高连接操作的效率。,聚簇的适用范围,2.当通过聚簇码进行访问或连接是该关系的主要应用,与聚簇码无关的其他访问很少或者是次要的时,可以使用聚簇。尤其当SQL语句中包含有与聚簇码有关的ORDER BY,GROUP BY,UNION,DISTINCT等子句或短语时,使用聚簇特别有利,可以省去对结果集

10、的排序操作,聚簇的适用范围,对经常在一起进行连接操作的关系可以建立聚簇如果一个关系的一组属性经常出现在相等比较条件中,则该单个关系可建立聚簇如果一个关系的一个(或一组)属性上的值重复率很高,则此单个关系可建立聚簇。即对应每个聚簇码值的平均元组数不太少。太少了,聚簇的效果不明显,设计候选聚簇,从聚簇中删除经常进行全表扫描的关系;从聚簇中删除更新操作远多于连接操作的关系;不同的聚簇中可能包含相同的关系,一个关系可以在某一个聚簇中,但不能同时加入多个聚簇 从这多个聚簇方案(包括不建立聚簇)中选择一个较优的,即在这个聚簇上运行各种事务的总代价最小,优化聚簇设计,当一个关系满足下列两个条件时,可以选择H

11、ASH存取方法该关系的属性主要出现在等值连接条件中或主要出现在相等比较选择条件中该关系的大小可预知,而且不变;或 该关系的大小动态改变,但所选用的DBMS提供了动态HASH存取方法,选择HASH存取方法的规则,7.5.3 确定数据库的存储结构,确定数据的存放位置确定系统配置,数据存放位置的设置原则,基本原则根据应用情况将易变部分与稳定部分分开存放存取频率较高部分与存取频率较低部分,分开存放,例:数据库数据备份、日志文件备份等由于只在故障恢复时才使用,而且数据量很大,可以考虑存放在磁带上如果计算机有多个磁盘或磁盘阵列,可以考虑将表和索引分别放在不同的磁盘上,在查询时,由于磁盘驱动器并行工作,可以提高物理I/O读写的效率,例(续):可以将比较大的表分别放在两个磁盘上,以加快存取速度,这在多用户环境下特别有效可以将日志文件与数据库对象(表、索引等)放在不同的磁盘以改进系统的性能,确定系统配置,DBMS产品一般都提供了一些存储分配参数 同时使用数据库的用户数 同时打开的数据库对象数 内存分配参数 使用的缓冲区长度、个数 存储分配参数.,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号