数据库基本原理hcy.ppt

上传人:小飞机 文档编号:5985542 上传时间:2023-09-11 格式:PPT 页数:63 大小:458.50KB
返回 下载 相关 举报
数据库基本原理hcy.ppt_第1页
第1页 / 共63页
数据库基本原理hcy.ppt_第2页
第2页 / 共63页
数据库基本原理hcy.ppt_第3页
第3页 / 共63页
数据库基本原理hcy.ppt_第4页
第4页 / 共63页
数据库基本原理hcy.ppt_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《数据库基本原理hcy.ppt》由会员分享,可在线阅读,更多相关《数据库基本原理hcy.ppt(63页珍藏版)》请在三一办公上搜索。

1、Access 应用技术,任课教师:黄朝阳厦门海洋职业技术学院 信息技术系 e_mail:Tel:8954063,第1章 数据库基本原理,1.1 数据库概述1.2 数据模型1.3 关系的完整性1.4 关系模型的规范化,1.1 数据库概述,1.1.1 数据库的产生和发展,关系数据库仍然占绝对的主导地位,并将影响着数据库技术的发展。数据库技术的发展已经历了4个发展阶段:1.人工管理数据阶段的特点 2.文件系统管理阶段的特点 3.数据库系统阶段的特点4.高级数据库阶段,1.1.2 现实世界、信息世界、数据世界,1.1.3 数据库基本概念,数据库数据库指长期存储在计算机内的有组织的、可共享的、相关数据的

2、集合。,数据库管理系统数据库管理系统(Database Management System,简称DBMS)是一种计算机软件系统。以数据库管理系统为核心的应用系统称为管理信息系统(Management Information System,简称MIS)。,数据库系统数据库系统(Database System,简称DBS)就是以数据库应用为基础的计算机系统。数据库系统不仅包括必须存储的数据,还包括相应的硬件、软件和各类工作人员。,硬件,数据库在计算机系统中的地位,应用系统,应用开发工具,DBMS,操作系统,1.2 数据模型,概念模型(Idea Model)是现实世界到信息世界的抽象,又称为信息模型

3、。数据模型(Data Model)是信息世界到数据世界的抽象。数据库领域最常见的数据模型有4种:层次模型、网状模型、关系模型和面向对象模型。其中层次模型和网状模型统称为非关系模型。目前,关系模型是最常用的数据模型。以关系模型为基础建立的数据库管理系统称为关系数据库管理系统(RDBMS)。,信息世界的主要概念,1.实体实体(Entity)就是现实世界中客观存在并可相互区分的事物。实体既可以是看得见摸得着的具体的事物,也可以是抽象的概念或联系。例如,某一本书、某一架飞机、某个学生等都是实体。,2.属性实体所具有的某一特征称为属性(Attribute)。一个实体由若干个(至少一个)属性来描述。一个实

4、体的所有属性组成实体本身。例如,学生实体可以由学号、姓名、性别、出生年月日、班级等属性组成。而(0100001、冯东梅、女、1980/12/26、01电子商务1)就是一个学生(实体)的属性值。,3.码唯一标识实体的属性组称为码(Key),通常又称为关键字。如果实体有多个码,则可以选定其中一个码为主码(Primary Key),通常又称为主关键字。如果实体只有一个码,它就是主码(主关键字)。,4.域属性的允许取值的集合称为该属性的域(Domain)。例如,学号的域是7位数字(某校规定),性别的域是男、女,班级的域是该校所有班级的集合。,6.实体集同型实体的集合称为实体集(Entity set)。

5、例如,某个学校(或某个班级)的全体学生就是一个实体集。7.联系信息世界的不同实体集之间和同一实体集内部都可能存在一定的联系(Relationship)。,数据世界的概念是和信息世界的概念相对应的:数据表(Data table)是实体集的数据表示;记录(Record)是实体的数据表示;数据项(Item)是属性的数据表示。记录由若干数据项组成。,1.2.3 实体的联系,信息世界存在的联系有两种:其一是一个实体集内部的联系;其二是不同实体集之间的联系。1.实体集内部的联系实体集内部的联系通常指组成该实体的各属性之间的联系。,在表1-1中,不同实体的学号都不重复,即学号与实体间有一一对应关系。学号就是

6、学生情况这个实体集的关键字。,2.实体集之间的联系 对于两个不同的实体集A和B,它们之间的联系通常有以下三种方式:,一对一联系(1:1)一对多联系(1:n)多对多联系(m:n),表示概念模型最常用的是实体联系方法(entity-relationship approach)。该方法用ER图来描述。在ER图中,实体型、属性和联系的表示方法如下:(1)实体型:用矩形表示,矩形框内写实体名;,1.2.4 概念模型,(2)属性:用椭圆表示,并用无向线段与相应的实体连接;(3)联系:用菱形表示,菱形框内写明联系名,并用无向线段与有关的实体连接。同时在无向线段旁标上联系的类型(1:1,1:n或m:n)。联系

7、本身也是一种实体型,也可以有属性。如果一个联系有属性,也用无向线段将属性与该联系连接。,(a)1:1联系(b)1:n联系(c)m:n联系两个实体之间的三类联系,学生实体、课程实体及其属性 将多对多联系转化为一对多联系的一般方法是:增加一个新的实体集,并且这个新的实体集和原来的两个实体集之间都是一对多联系。,学生学习成绩管理概念模型,这个例子也给出了将多对多联系转化为一对多联系的一般方法,这就是:增加一个新的实体集,并且这个新的实体集和原来的两个实体集之间都是一对多联系。,1.2.5 层次模型,层次模型(Hierarchical Model)用树形结构表示各类实体以及实体间的联系。从树的观点看,

8、层次模型满足以下两个条件:(1)有且仅有一个结点无双亲结点,称之为根结点(简称根);(2)根以外的其他结点有且仅有一个双亲结点。层次模型只能反映实体之间一对多的关系。,层次模型示意图,下图所示是一个层次模型的典型。,1.2.6 网状模型,网状模型(Network Model)是比层次模型更具普遍性的一种结构。它去掉了层次模型的两个限制条件,允许有一个以上的结点无双亲结点,允许结点可以有多个双亲结点,此外它还允许两个结点之间有多种联系(称之为复合联系)。,网状模型有如下优点:(1)可以直接描述包括多对多在内的更复杂的关系。(2)具有良好的性能,存取效率较高。网状模型也有缺点:(1)对计算机的硬件

9、和软件环境要求较高。(2)数据库的独立性较差。(3)操作比较复杂。,下图表示零部件的采购使用关系,这是一个典型的网状模型。,下图表示介绍的学生选修关系这个网状模型。,1.2.7 关系模型,关系模型(Relational Model)中数据的逻辑结构是一张二维表,它由行和列组成。表1-1所示的学生情况就是一个关系模型。关系模型的主要概念关系(relation):关系模型中表示数据的整个一张二维表就是关系。元组(Tuple):二维表中的每一行即为一个元组,对应概念模型的一个实体。属性(Attribute):二维表中的每一列即为一个属性,对应概念模型的一个属性。,主码(Key):二维表中唯一标识元组

10、的某个属性组称为该关系的主码,对应概念模型的码。域(Domain):二维表中任一属性的取值范围称为该属性的域,对应概念模型的域。分量:元组中的每一个属性值称为元组的分量。关系模式(Relation schema):对关系的描述称为关系模式,通常用关系名R及其所有属性名U的集合来表示,类似概念模型中实体型的表示方法。eg:R(U)学生(学号,姓名,性别,专业号号,年龄),整个表1-1就是一个关系。表中的每一行都是一个元组。学号、姓名、性别等每一列都是属性。学号是这个关系的码。男、女、正确的日期集合分别是性别和出生年月日的域。0100001、冯东梅、女、1980-12-26、北京和1100等都是分

11、量。而学生(学号,姓名,性别,出生年月日,家庭所在地,家庭人均月收入)是这个关系的关系模式。,关系模型既可以反映属性之间一对多的关系,也可以反映属性之间多对多的关系。关系模型具有以下特点:(1)数据结构简单,概念清楚;(2)能够直接反映实体之间一对一、一对多和多对多关系;(3)通过公共属性就可以建立表与表之间的联系,从而就建立了实体之间的联系;(4)具有严格的理论基础。,1.3 关系的完整性,关系模型允许定义三类完整性:实体完整性、参照完整性和用户定义的完整性。实体完整性和参照完整性是关系模型必须满足的完整性约束条件,被称为关系的两个不变性,由关系系统自动支持。这里先列出3个例题,以便后面引用

12、。例1-1 学生实体和专业实体可以用下面的关系表示(其中主码用红色体字标识):学生(学号,姓名,性别,专业号,年龄)专业(专业号,专业名),例1-2 学生实体、课程实体、学生与课程之间的选课及成绩实体可以用如下3个关系来表示:学生(学号,姓名,性别,专业号,年龄)课程(课程号,课程名,学分)选课及成绩(学号,课程号,成绩)例1-3 另一个学生实体的关系是:学生2(学号,姓名,性别,专业号,年龄,班长学号),实体完整性(Entity Integrity)规则:若属性A是基本关系R的主属性,则属性A不能取空值。在例1-1的学生关系中,学号为主码,则学号不能取空值。实体完整性规则规定基本关系的所有主

13、属性都不能取空值,而不仅是主码整体不能取空值。例1-2的选课及成绩关系中,学号+课程号为主码,则学号和课程号两个属性都不能取空值。,1.3.1 实体完整性,1.3.2 参照完整性,学生关系中的某个属性的取值需要参照班级关系对应属性的取值。,设F是基本关系R的一个或一组属性,但不是关系R的码,如果F与基本关系S的主码K相对应,则称F是基本关系R的外码(Foreign key),并称基本关系R为参照关系(Referencing relation),基本关系S为被参照关系(Referenced relation)或目标关系(Target relation)。关系R和S不一定是不同的关系。目标关系S的

14、主码Ks和参照关系R的外码F必须定义在同一个(或一组)域上。,下图清楚地表达了例1-1、例1-2和例1-3的参照关系。,参照完整性规则就是定义外码与主码之间的引用规则。参照完整性(Referential Integrity)规则:若属性(或属性组)F是基本关系R的外码,它与基本关系S的主码Ks相对应(基本关系R和S不一定是不同的关系),则对于R中每个元组在F上的值必须为:或者取空值(F的每个属性值均为空值);或者等于S(被参照关系)中某个元组的主码值。,对于例1-1,学生关系中每个元组的专业号属性只能取下面两类值:空值,表示尚未给该学生确定所学专业;非空值,这时该值必须是专业关系中某个元组的专

15、业号值,表示该学生不可能分配到一个不存在的专业中学习。即被参照关系“专业”中一定存在一个元组,它的主码值等于该参照关系“学生”中的外码值。,对于例1-2中的选课及成绩关系,按参照完整性规则,学号和课程号属性也可以取两类值:空值或目标关系中已经存在的值。但由于学号和课程号是选课及成绩关系中的主属性,按照实体完整性规则,它们均不能取空值。所以选课及成绩关系中的学号和课程号属性实际上只能取相应被参照关系中已经存在的主码值。,参照完整性规则中,R与S可以是同一个关系。例如,对于例1-3,按照参照完整性规则,班长属性值可以取两类值:空值,表示该学生所在班级尚未选出班长;非空值,这时该值必须是本关系中某个

16、元组的学号值。,例如,某个非主属性不能取空值(如:姓名)、某个属性的取值范围限定在0100之间(如:成绩)、某个属性只能取几个特定的值(如:性别)等。关系模型应提供定义和检验这类完整性机制,以便用统一的系统的方法处理它们,而不要由应用程序承担这一功能。,1.3.3 用户定义的完整性,1.4 关系模型的规范化(三种范式),一般地说,关系模型的范式级别越高,设计的数据结构质量越高。第一范式是关系模型规范化最基本的要求,第二范式的级别比第一范式高,第三范式的级别又比第二范式高。,1.4.1 第一范式,如果关系模式R的每一个关系的属性值都是不可分的原子值,则称R属于第一范式(1NF)。属于1NF的关系

17、称为规范化关系,不属于1NF的关系称为非规范化关系。不难验证,表1-1和表1-2所示的实体集都是属于1NF的规范化关系。,实际问题中的报表结构有许多是非规范化的。例如,表1-3是不规范的。不能依这样的结构设计关系模型,必须将这样的表需要的数据(以及其它数据)进行处理,使之规范化。,1.4.2 第二范式,如果关系模式R属于1NF,并且每个非码属性都完全依赖于各个码,则称R属于第二范式(2NF)。如果某个数据库模式中的每个关系模式都是2NF,则这个数据库模式称为2NF的数据库模式。下页表1-5所示的关系模式R(学号,系名,系办地址,课程号,成绩),主码为学号课程号。某个学生某门课程的成绩(一个非码

18、属性)是完全依赖于他的学号和该课程的代号(主码)的。也就是说,知道了一个学生的学号和他参加考试的课程号(两者缺一不可),就知道了他这一门课的成绩。,他所在的系名(另一非码属性)实际上仅完全依赖于他的学号(主码中的一个属性),与课程代号(主码中的另一个属性)无关。也就是说,只要知道了一个学生的学号(并不需要知道课程号),就知道了他所在的系名和系办地址。这个关系模式不属于2NF(仅属于1NF)。如果将R分解为两个关系模式R1(学号,系名,系办地址)和R2(学号,课程号,成绩),下页表1-6和表1-7,则R1和R2都属于2NF了。,学号,课程号,系办地址,系名,成绩,学号,课程号,成绩,学号,系办地

19、址,系名,R,R1,R2,这样分解之后,减少了冗余,节省了存储空间,降低了数据维护的代价。但是,另一方面是增加了查询难度。这说明,在确定数据模型时,不能简单地说采用第二范式一定比第一范式好,采用第三范式也一定比第二范式好。到底采用哪个范式,要根据具体问题的要求确定。,1.4.3 第三范式,如果关系模式R是2NF,且每个非主属性都完全直接依赖于各个码(即既不部分依赖于码也不传递依赖于码),则称R属于第三范式(3NF)。如果某个数据库模式中的每个关系模式都是3NF,则这个数据库模式称为3NF的数据库模式。在关系R2中,主码为(学号、课程号),成绩是完全直接依赖于他的学号和该课程的代号(主码)的,故

20、R2属于3NF。,学号,课程号,系办地址,系名,成绩,学号,课程号,成绩,学号,系办地址,系名,R,R2,R1,在关系R1中,主码为(学号),知道了一个学生的学号(主码),就知道了他所在的系名,知道了他所在的系名(非码属性),也就知道了该系办公室的地址。系名是完全直接依赖于他的学号的。但系办公室的地址是通过系名间接(不是直接)依赖与他的学号的,故R1不属于3NF。正因为关系R1不属于3NF,也存在数据冗余和操作异常现象。例如,有多个学生同属于一个系,这个系的地址就多次重复。如果将关系R1分解为R11和R12(下页表1-8和表1-9),则R11和R12就都是属于3NF了。,学号,系办地址,系名,

21、R1,学号,系名,系办地址,系名,R11,R12,总之:,一个数据库满足的范式越多,数据的冗余度越小,共享性越高,所占的存储空间越少,并将数据的不一致性减少到最低程度。但是,高范式(BCNF、4NF、5NF)的数据库查询起来比较复杂。所以,不应一味追求高范式,对于包含频度很高的查询的数据库,不妨降低些范式。,作业:P22,6-9121418-202324,1-9DBS的构成:数据库系统不仅包括必须存储的数据,还包括相应的硬件、软件和各类工作人员。1-14将多对多联系转化为一对多联系的一般方法是:增加一个新的实体集,并且这个新的实体集和原来的两个实体集之间都是一对多联系。1-23唯一标识实体的属性组称为码(Key),通常又称为关键字。,作业中出现的问题:,数据库系统数据库系统(Database System,简称DBS)就是以数据库应用为基础的计算机系统。数据库系统不仅包括必须存储的数据,还包括相应的硬件、软件和各类工作人员。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号