数据库清华版6章数据库设计.ppt

上传人:小飞机 文档编号:6296509 上传时间:2023-10-14 格式:PPT 页数:286 大小:1.23MB
返回 下载 相关 举报
数据库清华版6章数据库设计.ppt_第1页
第1页 / 共286页
数据库清华版6章数据库设计.ppt_第2页
第2页 / 共286页
数据库清华版6章数据库设计.ppt_第3页
第3页 / 共286页
数据库清华版6章数据库设计.ppt_第4页
第4页 / 共286页
数据库清华版6章数据库设计.ppt_第5页
第5页 / 共286页
点击查看更多>>
资源描述

《数据库清华版6章数据库设计.ppt》由会员分享,可在线阅读,更多相关《数据库清华版6章数据库设计.ppt(286页珍藏版)》请在三一办公上搜索。

1、第6章 数据库设计,6.1 数据库设计的步骤6.2 需求分析6.3 概念结构设计6.4 逻辑结构设计6.5 数据库的物理设计6.6 数据库实施6.7 数据库运行与维护,第6章 数据库设计,6.1 数据库设计的步骤6.2 需求分析6.3 概念结构设计6.4 逻辑结构设计6.5 数据库的物理设计6.6 数据库实施6.7 数据库运行与维护,6.1 数据库设计的步骤,数据库设计的准备工作数据库设计的过程,一、数据库设计的准备工作,选定参加设计的人员数据库分析设计人员用户程序员操作员,数据库设计的准备工作(续),1.数据库分析设计人员数据库设计的核心人员自始至终参与数据库设计其水平决定了数据库系统的质量

2、,数据库设计的准备工作(续),2.用户在数据库设计中也是举足轻重的主要参加需求分析和数据库的运行维护用户积极参与带来的好处加速数据库设计提高数据库设计的质量,数据库设计的准备工作(续),3.程序员在系统实施阶段参与进来,负责编制程序4.操作员在系统实施阶段参与进来,准备软硬件环境,二.数据库设计的过程(六个阶段),需求分析阶段概念结构设计阶段逻辑结构设计阶段数据库物理设计阶段数据库实施阶段数据库运行和维护阶段,数据库设计的过程(续),需求分析阶段准确了解与分析用户需求(包括数据与处理)是整个设计过程的基础,是最困难、最耗费时间的一步,数据库设计的过程(续),概念结构设计阶段是整个数据库设计的关

3、键通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型,数据库设计的过程(续),逻辑结构设计阶段将概念结构转换为某个DBMS所支持的数据模型对其进行优化,数据库设计的过程(续),数据库物理设计阶段为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法),数据库设计的过程(续),数据库实施阶段运用DBMS提供的数据语言、工具及宿主语言,根据逻辑设计和物理设计的结果建立数据库编制与调试应用程序组织数据入库并进行试运行,数据库设计的过程(续),数据库运行和维护阶段数据库应用系统经过试运行后即可投入正式运行。在数据库系统运行过程中必须不断地对其进行评价、调整与修改。

4、,数据库设计的过程(续),设计一个完善的数据库应用系统往往是上述六个阶段的不断反复。P184图6-1,第6章 数据库设计,6.1 数据库设计的步骤6.2 需求分析6.3 概念结构设计6.4 逻辑结构设计6.5 数据库的物理设计6.6 数据库实施6.7 数据库运行与维护,6.2 需求分析,6.2.1 需求分析的任务6.2.2 需求分析的方法6.2.3 数据字典,需求分析(续),需求分析就是分析用户的需要与要求需求分析是设计数据库的起点需求分析的结果是否准确地反映了用户的实际要求,将直接影响到后面各个阶段的设计,并影响到设计结果是否合理和实用,6.2 需求分析,6.2.1 需求分析的任务6.2.2

5、 需求分析的方法6.2.3 数据字典,6.2.1 需求分析的任务,一、需求分析的任务二、需求分析的重点三、需求分析的难点,一、需求分析的任务,通过详细调查现实世界要处理的对象(组织、部门、企业等),充分了解原系统(手工系统或计算机系统)工作概况,明确用户的各种需求 在此基础上确定新系统的功能。新系统必须充分考虑今后可能的扩充和改变,不能仅仅按当前应用需求来设计数据库,二、需求分析的重点,需求分析的重点是调查、收集与分析用户在数据管理中的信息要求、处理要求、安全性与完整性要求。信息要求用户需要从数据库中获得信息的内容与性质由用户的信息要求可以导出数据要求,即在数据库中需要存储哪些数据,需求分析的

6、重点(续),处理要求对处理功能的要求对处理的响应时间的要求对处理方式的要求(批处理/联机处理)新系统的功能必须能够满足用户的信息要求、处理要求、安全性与完整性要求。,三、需求分析的难点,确定用户最终需求的难点用户缺少计算机知识,开始时无法确定计算机究竟能为自己做什么,不能做什么,因此无法一下子准确地表达自己的需求,他们所提出的需求往往不断地变化。设计人员缺少用户的专业知识,不易理解用户的真正需求,甚至误解用户的需求。新的硬件、软件技术的出现也会使用户需求发生变化。,需求分析的难点(续),解决方法设计人员必须采用有效的方法,与用户不断深入地进行交流,才能逐步得以确定用户的实际需求,6.2 需求分

7、析,6.2.1 需求分析的任务6.2.2 需求分析的方法6.2.3 数据字典,6.2.2 需求分析的方法,调查清楚用户的实际需求并进行初步分析 与用户达成共识 进一步分析与表达这些需求,一、调查与初步分析用户需求,调查组织机构情况 部门的组成情况 各部门的职责等,调查与初步分析用户需求(续),调查各部门的业务活动情况。调查重点之一。各个部门输入和使用什么数据 如何加工处理这些数据 输出什么信息 输出到什么部门 输出结果的格式是什么,调查与初步分析用户需求(续),在熟悉业务活动的基础上,协助用户明确对新系统的各种要求。调查重点之二。信息要求 处理要求 完全性与完整性要求,调查与初步分析用户需求(

8、续),对前面调查的结果进行初步分析确定新系统的边界确定哪些功能由计算机完成或将来准备让计算机完成确定哪些活动由人工完成 由计算机完成的功能就是新系统应该实现的功能。,二、常用调查方法,做需求调查时,往往需要同时采用多种方法无论使用何种调查方法,都必须有用户的积极参与和配合设计人员应该和用户取得共同的语言,帮助不熟悉计算机的用户建立数据库环境下的共同概念,并对设计工作的最后结果共同承担责任,常用调查方法(续),常用调查方法跟班作业通过亲身参加业务工作了解业务活动的情况能比较准确地理解用户的需求,但比较耗时开调查会通过与用户座谈来了解业务活动情况及用户需求请专人介绍,常用调查方法(续),询问对某些

9、调查中的问题,可以找专人询问设计调查表请用户填写如果调查表设计合理,则很有效,且易于为用户接受查阅记录查阅与原系统有关的数据记录,三、进一步分析和表达用户需求,分析和表达用户的需求的常用方法自顶向下的结构化分析方法(Structured Analysis,简称SA方法)SA方法从最上层的系统组织机构入手,采用逐层分解的方式分析系统,并用数据流图和数据字典描述系统。,进一步分析和表达用户需求(续),1首先把任何一个系统都抽象为:,进一步分析和表达用户需求(续),2分解处理功能和数据(1)分解处理功能将处理功能的具体内容分解为若干子功能,再将每个子功能继续分解,直到把系统的工作过程表达清楚为止。(

10、2)分解数据在处理功能逐步分解的同时,其所用的数据也逐级分解,形成若干层次的数据流图 数据流图表达了数据和处理过程的关系,进一步分析和表达用户需求(续),(3)表达方法 处理过程:用判定表或判定树来描述 数据:用数据字典来描述,进一步分析和表达用户需求(续),3将分析结果再次提交给用户,征得用户的认可,四、需求分析小结,P187图6-4,需求分析小结(续),实例:假设我们要开发一个学校管理系统。1经过可行性分析和初步需求调查,抽象出该系统最高层数据流图,该系统由教师管理子系统、学生管理子系统、后勤管理子系统组成,每个子系统分别配备一个开发小组。2进一步细化各个子系统。其中学生管理子系统开发小组

11、通过进行进一步的需求调查,明确了该子系统的主要功能是进行学籍管理和课程管理,包括学生报到、入学、毕业的管理,学生上课情况的管理。通过详细的信息流程分析和数据收集后,他们生成了该子系统的数据流图。,6.2 需求分析,6.2.1 需求分析的任务6.2.2 需求分析的方法6.2.3 数据字典,6.2.3 数据字典,一、数据字典的用途二、数据字典的内容,一、数据字典的用途,数据字典是各类数据描述的集合数据字典是进行详细的数据收集和数据分析所获得的主要结果数据字典在数据库设计中占有很重要的地位,二、数据字典的内容,数据字典的内容数据项数据结构数据流数据存储处理过程 数据项是数据的最小组成单位 若干个数据

12、项可以组成一个数据结构 数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。,数据项,数据项是不可再分的数据单位 对数据项的描述数据项描述数据项名,数据项含义说明,别名,数据类型,长度,取值范围,取值含义,与其他数据项的逻辑关系取值范围、与其他数据项的逻辑关系定义了数据的完整性约束条件,数据结构,数据结构反映了数据之间的组合关系。一个数据结构可以由若干个数据项组成,也可以由若干个数据结构组成,或由若干个数据项和数据结构混合组成。对数据结构的描述数据结构描述数据结构名,含义说明,组成:数据项或数据结构,数据流,数据流是数据结构在系统内传输的路径。对数据流的描述数据流描述数据流名

13、,说明,数据流来源,数据流去向,组成:数据结构,平均流量,高峰期流量数据流来源是说明该数据流来自哪个过程数据流去向是说明该数据流将到哪个过程去平均流量是指在单位时间(每天、每周、每月等)里的传输次数高峰期流量则是指在高峰时期的数据流量,数据存储,数据存储是数据结构停留或保存的地方,也是数据流的来源和去向之一。对数据存储的描述数据存储描述数据存储名,说明,编号,流入的数据流,流出的数据流,组成:数据结构,数据量,存取方式流入的数据流:指出数据来源流出的数据流:指出数据去向数据量:每次存取多少数据,每天(或每小时、每周等)存取几次等信息存取方法:批处理/联机处理;检索/更新;顺序检索/随机检索,处

14、理过程,处理过程的具体处理逻辑一般用判定表或判定树来描述。数据字典中只需要描述处理过程的说明性信息处理过程说明性信息的描述处理过程描述处理过程名,说明,输入:数据流,输出:数据流,处理:简要说明,处理过程(续),简要说明:主要说明该处理过程的功能及处理要求功能:该处理过程用来做什么处理要求:处理频度要求(如单位时间里处理多少事务,多少数据量);响应时间要求等处理要求是后面物理设计的输入及性能评价的标准,处理过程(续),例:学生学籍管理子系统的数据字典。数据项,以“学号”为例:数据项:学号 含义说明:唯一标识每个学生别名:学生编号 类型:字符型 长度:8 取值范围:00000000至999999

15、99取值含义:前两位标别该学生所在年级,后六位按顺序编号与其他数据项的逻辑关系:,处理过程(续),数据结构 以“学生”为例“学生”是该系统中的一个核心数据结构:数据结构:学生 含义说明:是学籍管理子系统的主体数据结 构,定义了一个学生的有关信息 组成:学号,姓名,性别,年龄,所在系,年级,处理过程(续),数据流“体检结果”可如下描述:数据流:体检结果 说明:学生参加体格检查的最终结果 数据流来源:体检 数据流去向:批准 组成:平均流量:高峰期流量:,处理过程(续),数据存储“学生登记表”可如下描述:数据存储:学生登记表 说明:记录学生的基本情况流入数据流:流出数据流:组成:数据量:每年3000

16、张 存取方式:随机存取,处理过程(续),处理过程“分配宿舍”可如下描述:处理过程:分配宿舍说明:为所有新生分配学生宿舍输入:学生,宿舍,输出:宿舍安排处理:在新生报到后,为所有新生分配学 生宿舍。要求同一间宿舍只能安排 同一性别的学生,同一个学生只能 安排在一个宿舍中。每个学生的居 住面积不小于3平方米。安排新生 宿舍其处理时间应不超过15分钟。,第6章 数据库设计,6.1 数据库设计的步骤6.2 需求分析6.3 概念结构设计6.4 逻辑结构设计6.5 数据库的物理设计6.6 数据库实施6.7 数据库运行与维护,6.3 概念结构设计,什么是概念结构设计需求分析阶段描述的用户应用需求是现实世界的

17、具体需求将需求分析得到的用户需求抽象为信息结构即概念模型的过程就是概念结构设计概念结构是各种数据模型的共同基础,它比数据模型更独立于机器、更抽象,从而更加稳定。概念结构设计是整个数据库设计的关键,概念结构设计(续),概念结构设计(续),概念结构设计的特点(1)能真实、充分地反映现实世界,包括事物和事物之间的联系,能满足用户对数据的处理要求。是对现实世界的一个真实模型。(2)易于理解,从而可以用它和不熟悉计算机的用户交换意见,用户的积极参与是数据库的设计成功的关键。,概念结构设计(续),概念结构设计的特点(续)(3)易于更改,当应用环境和应用要求改变时,容易对概念模型修改和扩充。(4)易于向关系

18、、网状、层次等各种数据模型转换。,概念结构设计(续),描述概念模型的工具E-R模型,6.3 概念结构设计,6.3.1 概念结构设计的方法与步骤6.3.2 数据抽象与局部视图设计6.3.3 视图的集成,6.3 概念结构设计,6.3.1 概念结构设计的方法与步骤6.3.2 数据抽象与局部视图设计6.3.3 视图的集成,6.3.1 概念结构设计的方法与步骤,设计概念结构的四类方法自顶向下 首先定义全局概念结构的框架,然后逐步细化,概念结构设计的方法与步骤(续),自顶向下策略,概念结构设计的方法与步骤(续),设计概念结构的四类方法(续)自底向上 首先定义各局部应用的概念结构,然后将它们集成起来,得到全

19、局概念结构,概念结构设计的方法与步骤(续),自底向上策略,概念结构设计的方法与步骤(续),逐步扩张 首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生成其他概念结构,直至总体概念结构混合策略 将自顶向下和自底向上相结合,用自顶向下策略设计一个全局概念结构的框架,以它为骨架集成由自底向上策略中设计的各局部概念结构。,概念结构设计的方法与步骤(续),逐步扩张,概念结构设计的方法与步骤(续),常用策略自顶向下地进行需求分析自底向上地设计概念结构,概念结构设计的方法与步骤(续),自底向上设计概念结构的步骤第1步:抽象数据并设计局部视图第2步:集成局部视图,得到全局概念结构,6.3 概念结

20、构设计,6.3.1 概念结构设计的方法与步骤6.3.2 数据抽象与局部视图设计6.3.3 视图的集成,6.3.2 数据抽象与局部视图设计,数据抽象局部视图设计,一、数据抽象,概念结构是对现实世界的一种抽象从实际的人、物、事和概念中抽取所关心的共同特性,忽略非本质的细节把这些特性用各种概念精确地加以描述这些概念组成了某种模型,数据抽象(续),三种常用抽象1.分类(Classification)定义某一类概念作为现实世界中一组对象的类型这些对象具有某些共同的特性和行为它抽象了对象值和型之间的“is member of”的语义在E-R模型中,实体型就是这种抽象,例:,数据抽象(续),2.聚集(Agg

21、regation)定义某一类型的组成成分它抽象了对象内部类型和成分之间“is part of”的语义在E-R模型中若干属性的聚集组成了实体型,就是这种抽象,例:,数据抽象(续),3.概括(Generalization)定义类型之间的一种子集联系它抽象了类型之间的“is subset of”的语义概括有一个很重要的性质:继承性。子类继承超类上定义的所有抽象。,例:,数据抽象(续),注:原E-R模型不具有概括,本书对E-R模型作了扩充,允许定义超类实体型和子类实体型。用双竖边的矩形框表示子类,用直线加小圆圈表示超类-子类的联系,数据抽象(续),数据抽象的用途对需求分析阶段收集到的数据进行分类、组织

22、(聚集),形成实体实体的属性,标识实体的码确定实体之间的联系类型(1:1,1:n,m:n),二、局部视图设计,设计分E-R图的步骤:选择局部应用逐一设计分E-R图,选择局部应用,需求分析阶段,已用多层数据流图和数据字典描述了整个系统。设计分E-R图首先需要根据系统的具体情况,在多层的数据流图中选择一个适当层次的数据流图,让这组图中每一部分对应一个局部应用,然后以这一层次的数据流图为出发点,设计分E-R图。,选择局部应用(续),通常以中层数据流图作为设计分E-R图的依据。原因:高层数据流图只能反映系统的概貌中层数据流图能较好地反映系统中各局部应用的子系统组成低层数据流图过细,选择局部应用(续),

23、例:由于学籍管理、课程管理等都不太复杂,因此可以它们入手设计学生管理子系统的分E-R图。如果局部应用比较复杂,则可以从更下层的数据流图入手。,逐一设计分E-R图,任务标定局部应用中的实体、属性、码,实体间的联系将各局部应用涉及的数据分别从数据字典中抽取出来,参照数据流图,标定各局部应用中的实体、实体的属性、标识实体的码,确定实体之间的联系及其类型(1:1,1:n,m:n),逐一设计分E-R图(续),如何抽象实体和属性实体:现实世界中一组具有某些共同特性和行为的对象就可以抽象为一个实体。对象和实体之间是“is member of的关系。例:在学校环境中,可把张三、李四等对象抽象为学生实体。,逐一

24、设计分E-R图(续),属性:对象类型的组成成分可以抽象为实体的属性。组成成分与对象类型之间是“is part of的关系。例:学号、姓名、专业、年级等可以抽象为学生实体的属性。其中学号为标识学生实体的码。,逐一设计分E-R图(续),如何区分实体和属性实体与属性是相对而言的。同一事物,在一种应用环境中作为“属性”,在另一种应用环境中就必须作为“实体”。例:学校中的系,在某种应用环境中,它只是作为“学生”实体的一个属性,表明一个学生属于哪个系;而在另一种环境中,由于需要考虑一个系的系主任、教师人数、学生人数、办公地点等,这时它就需要作为实体了。,逐一设计分E-R图(续),一般原则属性不能再具有需要

25、描述的性质。即属性必须是不可分的数据项,不能再由另一些属性组成。属性不能与其他实体具有联系。联系只发生在实体之间。符合上述两条特性的事物一般作为属性对待。为了简化E-R图的处置,现实世界中的事物凡能够作为属性对待的,应尽量作为属性。,逐一设计分E-R图(续),举例例1:“学生”由学号、姓名等属性进一步描述,根据准则,“学生”只能作为实体,不能作为属性。例2:职称通常作为教师实体的属性,但在涉及住房分配时,由于分房与职称有关,也就是说职称与住房实体之间有联系,根据准则,这时把职称作为实体来处理会更合适些。,逐一设计分E-R图(续),设计分E-R图的步骤(1)以数据字典为出发点定义E-R图。数据字

26、典中的“数据结构”、“数据流”和“数据存储”等已是若干属性的有意义的聚合(2)按上面给出的准则进行必要的调整。,逐一设计分E-R图(续),例:学籍管理局部应用中主要涉及的实体包括学生、宿舍、档案材料、班级、班主任。实体之间的联系:由于一个宿舍可以住多个学生,而一个学生只能住在某一个宿舍中,因此宿舍与学生之间是1:n的联系。由于一个班级往往有若干名学生,而一个学生只能属于一个班级,因此班级与学生之间也是1:n的联系。,逐一设计分E-R图(续),由于班主任同时还要教课,因此班主任与学生之间存在指导联系,一个班主任要教多名学生,而一个学生只对应一个班主任,因此班主任与学生之间也是1:n的联系。而学生

27、和他自己的档案材料之间,班级与班主任之间都是1:1的联系。学籍管理局部应用的分E-R图草图:,逐一设计分E-R图(续),接下来需要进一步斟酌该E-R图,做适当调整。(1)在一般情况下,性别通常作为学生实体的属性,但在本局部应用中,由于宿舍分配与学生性别有关,根据准则,应该把性别作为实体对待。(2)数据存储“学生登记表”,由于是手工填写,供存档使用,其中有用的部分已转入学生档案材料中,因此这里就不必作为实体了。最后得到学籍管理局部应用的分E-R图:,逐一设计分E-R图(续),学籍管理E-R图中省略了各个实体的属性描述:学生:学号,姓名,出生日期性别:性别档案材料:档案号,班级:班级号,学生人数班

28、主任:职工号,姓名,性别,是否为优秀班主任 宿舍:宿舍编号,地址,人数 其中有下划线的属性为实体的码。,逐一设计分E-R图(续),同样方法可以得到课程管理局部应用的分E-R图各实体的属性分别为:学生:姓名,学号,性别,年龄,所在系,年级,平均成绩课程:课程号,课程名,学分教师:职工号,姓名,性别,职称教科书:书号,书名,价钱教室:教室编号,地址,容量,6.3 概念结构设计,6.3.1 概念结构设计的方法与步骤6.3.2 数据抽象与局部视图设计6.3.3 视图的集成,6.3.4 视图的集成,各个局部视图即分E-R图建立好后,还需要对它们进行合并,集成为一个整体的数据概念结构即总E-R图。,视图的

29、集成(续),视图集成的两种方式一次集成(图6.25(a))一次集成多个分E-R图通常用于局部视图比较简单时逐步累积式(图6.25(b))首先集成两个局部视图(通常是比较关键的两个局部视图)以后每次将一个新的局部视图集成进来,视图的集成(续),集成局部E-R图的步骤1.合并2.修改与重构,视图的集成(续),一、合并分E-R图,生成初步E-R图,各分图存在冲突各个局部应用所面向的问题不同由不同的设计人员进行设计各个分E-R图之间必定会存在许多不一致的地方合并分E-R图的主要工作与关键所在:合理消除各分E-R图的冲突,合并分E-R图,生成初步E-R图(续),冲突的种类属性冲突命名冲突结构冲突,属性冲

30、突,两类属性冲突属性域冲突:属性值的类型、取值范围或取值集合不同。例1,由于学号是数字,因此某些部门(即局部应用)将学号定义为整数形式,而由于学号不用参与运算,因此另一些部门(即局部应用)将学号定义为字符型形式。例2,某些部门(即局部应用)以出生日期形式表示学生的年龄,而另一些部门(即局部应用)用整数形式表示学生的年龄。,属性冲突(续),属性取值单位冲突。例:学生的身高,有的以米为单位,有的以厘米为单位,有的以尺为单位。,属性冲突(续),属性冲突的解决方法通常用讨论、协商等行政手段加以解决,命名冲突,两类命名冲突同名异义:不同意义的对象在不同的局部应用中具有相同的名字 例,局部应用A中将教室称

31、为房间 局部应用B中将学生宿舍称为房间异名同义(一义多名):同一意义的对象在不同的局部应用中具有不同的名字 例,有的部门把教科书称为课本 有的部门则把教科书称为教材,命名冲突(续),命名冲突可能发生在属性级、实体级、联系级上。其中属性的命名冲突更为常见。命名冲突的解决方法通过讨论、协商等行政手段加以解决,结构冲突,三类结构冲突同一对象在不同应用中具有不同的抽象 例,“课程”在某一局部应用中被当作实体 在另一局部应用中则被当作属性解决方法:通常是把属性变换为实体或把实体变换为属性,使同一对象具有相同的抽象。变换时要遵循两个准则。,结构冲突(续),同一实体在不同局部视图中所包含的属性不完全相同,或

32、者属性的排列次序不完全相同。产生原因:不同的局部应用关心的是该实体的不同侧面。解决方法:使该实体的属性取各分E-R图中属性的并集,再适当设计属性的次序。,结构冲突(续),学生,学号,姓名,性别,平均成绩,(a)在局部应用A中,结构冲突(续),学生,学号,姓名,出生日期,年级,(b)在局部应用B中,所在系,结构冲突(续),学生,学号,姓名,政治面貌,(c)在局部应用C中,结构冲突(续),学生,政治面貌,学号,出生日期,年级,(d)合并后,所在系,平均成绩,姓名,性别,结构冲突(续),实体之间的联系在不同局部视图中呈现不同的类型例1,实体E1与E2在局部应用A中是多对多联系,而在局部应用B中是一对

33、多联系例2,在局部应用X中E1与E2发生联系,而在局部应用Y中E1、E2、E3三者之间有联系。解决方法:根据应用语义对实体联系的类型进行综合或调整。,合并分E-R图,生成初步E-R图实例,例:生成学校管理系统的初步E-R图以合并学籍管理局部视图,课程管理局部视图为例这两个分E-R图存在着多方面的冲突:,合并分E-R图,生成初步E-R图实例,(1)班主任实际上也属于教师,也就是说学籍管理中的班主任实体与课程管理中的教师实体在一定程度上属于异名同义,可以应将学籍管理中的班主任实体与课程管理中的教师实体统一称为教师,统一后教师实体的属性构成为:教师:职工号,姓名,性别,职称,是否为优秀班主任,合并分

34、E-R图,生成初步E-R图实例(续),(2)将班主任改为教师后,教师与学生之间的联系在两个局部视图中呈现两种不同的类型,一种是学籍管理中教师与学生之间的指导联系,一种是课程管理中教师与学生之间的教学联系,由于指导联系实际上可以包含在教学联系之中,因此可以将这两种联系综合为教学联系。,合并分E-R图,生成初步E-R图实例(续),(3)性别在两个局部应用中具有不同的抽象,它在学籍管理中为实体,在课程管理中为属性,按照前面提到的两个原则,在合并后的E-R图中性别只能作为实体,否则它无法与宿舍实体发生联系。,合并分E-R图,生成初步E-R图实例(续),(4)在两个局部E-R图中,学生实体属性组成及次序

35、都存在差异,应将所有属性综合,并重新调整次序。假设调整结果为:学生:学号,姓名,出生日期,年龄,所在系,年级,平均成绩解决上述冲突后,学籍管理分E-R图与课程管理分E-R图合并为学生管理子系统的初步E-R图,二、修改与重构,基本任务消除不必要的冗余,设计生成基本E-R图,修改与重构(续),1冗余2消除冗余的方法,1冗余,冗余的数据是指可由基本数据导出的数据,冗余的联系是指可由其他联系导出的联系。冗余数据和冗余联系容易破坏数据库的完整性,给数据库维护增加困难并不是所有的冗余数据与冗余联系都必须加以消除,有时为了提高某些应用的效率,不得不以冗余信息作为代价。,冗余(续),设计数据库概念结构时,哪些

36、冗余信息必须消除,哪些冗余信息允许存在,需要根据用户的整体需求来确定。消除不必要的冗余后的初步E-R图称为基本E-R图。,2消除冗余的方法,分析方法以数据字典和数据流图为依据,根据数据字典中关于数据项之间逻辑关系的说明来消除冗余。,消除冗余的方法(续),例,教师工资单中包括该教师的基本工资、各种补贴、应扣除的房租水电费以及实发工资。由于实发工资可以由前面各项推算出来,因此可以去掉,在需要查询实发工资时根据基本工资、各种补贴、应扣除的房租水电费数据临时生成。,消除冗余的方法(续),如果是为了提高效率,人为地保留了一些冗余数据,则应把数据字典中数据关联的说明作为完整性约束条件。一种更好的方法是把冗

37、余数据定义在视图中,消除冗余的方法(续),规范化理论函数依赖的概念提供了消除冗余联系的形式化工具,消除冗余的方法(续),方法1.确定分E-R图实体之间的数据依赖FL。实体之间一对一、一对多、多对多的联系可以用实体码之间的函数依赖来表示。例:班级和学生之间一对多的联系:学号班级号学生和课程之间多对多的联系:(学号,课程号)成绩,消除冗余的方法(续),2.求FL的最小覆盖GL,差集为 D=FL-GL。逐一考察D中的函数依赖,确定是否是冗余的联系,若是,就把它去掉。,消除冗余的方法(续),由于规范化理论受到泛关系假设的限制,应注意下面两个问题:1.冗余的联系一定在D中,而D中的联系不一定是冗余的;2

38、.当实体之间存在多种联系时要将实体之间的联系在形式上加以区分。例P229图6.30中部门和职工之间两种联系表示为:负责人.职工号部门号部门号负责人.职工号,泛关系假设,假设存在着一个单一的关系模式“假设已知一个模式S,它仅由单个关系模式组成,问题是要设计一个模式SD,它与S等价,但在某些方面更好一些”从一个关系模式出发,而不是从一组关系模式出发实行分解“等价”的定义也是一组关系模式与一个关系模式的“等价”,泛关系假设(续),泛关系假设是运用规范化理论时的障碍承认了泛关系假设,就等于承认了现实世界各实体间只能有一种联系,消除冗余,设计生成基本E-R图实例,教程198图6-16的初步E-R图中存在

39、着冗余数据和冗余联系:(1)学生实体中的年龄属性可以由出生日期推算出来,属于冗余数据,应该去掉。这样不仅可以节省存储空间,而且当某个学生的出生日期有误,进行修改后,无须相应修改年龄,减少了产生数据不一致的机会。学生:学号,姓名,出生日期,所在系,年级,平均成绩,消除冗余,设计生成基本E-R图实例(续),(2)教室实体与班级实体的上课联系可以由教室与课程之间的开设联系、课程与学生之间的选修联系、学生与班级之间的组成联系三者推导出来,因此属于冗余联系,可以消去。,消除冗余,设计生成基本E-R图实例(续),(3)学生实体中的平均成绩可以从选修联系中的成绩属性中推算出来由于应用中需要经常查询某个学生的

40、平均成绩,每次都进行这种计算效率就会太低,因此为提高效率,保留该冗余数据但定义一个触发器来保证学生的平均成绩等于该学生各科成绩的平均值。任何一科成绩修改后,或该学生学了新的科目并有成绩后,就触发该触发器去修改该学生的平均成绩属性值。,学生管理子系统初步E-R图:,修改重构后的基本E-R图:,消除冗余,设计生成基本E-R图实例(续),学生管理子系统的基本E-R图与教师管理子系统以及后勤管理子系统的基本E-R图合并后,生成整个学校管理系统的基本E-R图,三、验证整体概念结构,视图集成后形成一个整体的数据库概念结构,对该整体概念结构还必须进行进一步验证,确保它能够满足下列条件:整体概念结构内部必须具

41、有一致性,不存在互相矛盾的表达。整体概念结构能准确地反映原来的每个视图结构,包括属性、实体及实体间的联系。整体概念结构能满足需要分析阶段所确定的所有要求。,验证整体概念结构(续),整体概念结构最终还应该提交给用户,征求用户和有关人员的意见,进行评审、修改和优化,然后把它确定下来,作为数据库的概念结构,作为进一步设计数据库的依据。,数据库设计,数据库的设计过程需求分析概念结构设计逻辑结构设计物理数据库设计实施运行维护设计过程中往往还会有许多反复。,概念结构设计小结,什么是概念结构设计,概念结构设计小结,概念结构设计的步骤抽象数据并设计局部视图集成局部视图,得到全局概念结构验证整体概念结构,概念结

42、构设计小结,数据抽象分类聚集概括,概念结构设计小结,设计局部视图 选择局部应用 逐一设计分E-R图标定局部应用中的实体、属性、码,实体间的联系用E-R图描述出来,概念结构设计小结,集成局部视图1.合并分E-R图,生成初步E-R图消除冲突属性冲突命名冲突结构冲突2.修改与重构消除不必要的冗余,设计生成基本E-R图分析方法规范化理论,第6章 数据库设计,6.1 数据库设计的步骤6.2 需求分析6.3 概念结构设计6.4 逻辑结构设计6.5 数据库的物理设计6.6 数据库实施6.7 数据库运行与维护,6.4 逻辑结构设计,逻辑结构设计的任务概念结构是各种数据模型的共同基础为了能够用某一DBMS实现用

43、户需求,还必须将概念结构进一步转化为相应的数据模型,这正是数据库逻辑结构设计所要完成的任务。,6.4 逻辑结构设计,逻辑结构设计的步骤将概念结构转化为一般的关系、网状、层次模型将转化来的关系、网状、层次模型向特定DBMS支持下的数据模型转换对数据模型进行优化,6.4 逻辑结构设计,6.4.1 E-R图向数据模型的转换6.4.2 数据模型的优化6.4.3 设计用户子模式,6.4 逻辑结构设计,6.4.1 E-R图向数据模型的转换6.4.2 数据模型的优化6.4.3 设计用户子模式,6.4.1 E-R图向数据模型的转换,只介绍向关系数据模型的转换转换内容转换原则,E-R图向数据模型的转换(续),转

44、换内容E-R图由实体、实体的属性和实体之间的联系三个要素组成关系模型的逻辑结构是一组关系模式的集合将E-R图转换为关系模型:将实体、实体的属性和实体之间的联系转化为关系模式。,E-R图向关系模型的转换(续),转换原则 一个实体型转换为一个关系模式。关系的属性:实体型的属性关系的码:实体型的码例,学生实体可以转换为如下关系模式:学生(学号,姓名,出生日期,所在系,年级,平均成绩)性别、宿舍、班级、档案材料、教师、课程、教室、教科书都分别转换为一个关系模式。,E-R图向关系模型的转换(续),一个m:n联系转换为一个关系模式。关系的属性:与该联系相连的各实体的码以及联系本身的属性关系的码:各实体码的

45、组合例,“选修”联系是一个m:n联系,可以将它转换为如下关系模式,其中学号与课程号为关系的组合码:选修(学号,课程号,成绩),E-R图向关系模型的转换(续),一个1:n联系可以转换为一个独立的关系模式,也可以与n端对应的关系模式合并。1)转换为一个独立的关系模式关系的属性:与该联系相连的各实体的码以及联系本身的属性关系的码:n端实体的码,E-R图向关系模型的转换(续),一个1:n联系可以转换为一个独立的关系模式,也可以与n端对应的关系模式合并。2)与n端对应的关系模式合并合并后关系的属性:在n端关系中加入1端关系的码和联系本身的属性合并后关系的码:不变可以减少系统中的关系个数,一般情况下更倾向

46、于采用这种方法,E-R图向关系模型的转换(续),例,“组成”联系为1:n联系。将其转换为关系模式的两种方法:1)使其成为一个独立的关系模式:组成(学号,班级号)2)将其学生关系模式合并:学生(学号,姓名,出生日期,所在系,年级,班级号,平均成绩),E-R图向关系模型的转换(续),一个1:1联系可以转换为一个独立的关系模式,也可以与任意一端对应的关系模式合并。1)转换为一个独立的关系模式关系的属性:与该联系相连的各实体的码以及联系本身的属性关系的候选码:每个实体的码均是该关系的候选码,E-R图向关系模型的转换(续),一个1:1联系可以转换为一个独立的关系模式,也可以与任意一端对应的关系模式合并。

47、2)与某一端对应的关系模式合并合并后关系的属性:加入对应关系的码和联系本身的属性合并后关系的码:不变,E-R图向关系模型的转换(续),例,“管理”联系为1:1联系,可以有三种转换方法:(1)转换为一个独立的关系模式:管理(职工号,班级号)或管理(职工号,班级号)(2)“管理”联系与班级关系模式合并,则只需在班级关系中加入教师关系的码,即职工号:班级:(班级号,学生人数,职工号)(3)“管理”联系与教师关系模式合并,则只需在教师关系中加入班级关系的码,即班级号:教师:(职工号,姓名,性别,职称,班级号,是否为优秀班主任),E-R图向关系模型的转换(续),注意:从理论上讲,1:1联系可以与任意一端

48、对应的关系模式合并。但在一些情况下,与不同的关系模式合并效率会大不一样。因此究竟应该与哪端的关系模式合并需要依应用的具体情况而定。由于连接操作是最费时的操作,所以一般应以尽量减少连接操作为目标。例如,如果经常要查询某个班级的班主任姓名,则将管理联系与教师关系合并更好些。,new,E-R图向关系模型的转换(续),三个或三个以上实体间的一个多元联系转换为一个关系模式。关系的属性:与该多元联系相连的各实体的码以及联系本身的属性关系的码:各实体码的组合例,“讲授”联系是一个三元联系,可以将它转换为如下关系模式,其中课程号、职工号和书号为关系的组合码:讲授(课程号,职工号,书号),E-R图向关系模型的转

49、换(续),同一实体集的实体间的联系,即自联系,也可按上述1:1、1:n和m:n三种情况分别处理。例,如果教师实体集内部存在领导与被领导的1:n自联系,我们可以将该联系与教师实体合并,这时主码职工号将多次出现,但作用不同,可用不同的属性名加以区分:教师:职工号,姓名,性别,职称,系主任,new,E-R图向关系模型的转换(续),具有相同码的关系模式可合并。目的:减少系统中的关系个数。合并方法:将其中一个关系模式的全部属性加入到另一个关系模式中,然后去掉其中的同义属性(可能同名也可能不同名),并适当调整属性的次序。,E-R图向关系模型的转换(续),例,“拥有”关系模式:拥有(学号,性别)与学生关系模

50、式:学生(学号,姓名,出生日期,所在系,年级,班级号,平均成绩)都以学号为码,可以将它们合并为一个关系模式:学生(学号,姓名,性别,出生日期,所在系,年级,班级号,平均成绩),E-R图向关系模型的转换(续),实例按照上述七条原则,学生管理子系统中的18个实体和联系可以转换为下列关系模型:学生(学号,姓名,性别,出生日期,所在系,年级,班级号,平均成绩,档案号)性别(性别,宿舍楼)宿舍(宿舍编号,地址,性别,人数)班级(班级号,学生人数)教师(职工号,姓名,性别,职称,班级号,是否为优秀班主任),E-R图向关系模型的转换(续),教学(职工号,学号)课程(课程号,课程名,学分,教室号)选修(学号,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号