《最常用的大数据模型.doc》由会员分享,可在线阅读,更多相关《最常用的大数据模型.doc(8页珍藏版)》请在三一办公上搜索。
1、word最常用的数据模型最常用的数据模型包括四种:注1:非关系模型在20世纪70-80年代很流行,现在逐步被关系模型取代。注2:下面讲的数据模型都是指逻辑上的数据模型,即用户眼中看到的数据围。一、层次模型定义:有只有一个结点没有双亲结点,这个结点称为根结点;根以外的其他结点有且只有一个双亲结点。代表产品:IBM公司的IMS(Information Management System)数据库管理系统。1. 数据结构根本结构用树形结构来表示各类实体以与实体间的联系。每个结点表示一个记录类型实体,结点之间的连线表示记录类型间一对多的父子联系,这种联系只能是父子联系。每个记录类型可包含假如干个字段属性
2、。图1.12 教员学生层次数据库模型图1.13 教员学生层次数据库的一个值多对多联系在层次模型中的表示必须首先将其分解成一对多联系。分解方法有两种:冗余结点法和虚拟结点法。图1.14(a) 一个学生选课的多对多联系图1.14(b) 冗余结点法将多对多联系转化为一对多联系图1.14(c) 虚拟结点法将多对多联系转化为一对多联系2. 数据操作与完整性约束数据操作:查询、插入、删除和修改。完整性约束:插入:如果没有相应的双亲结点值就不能插入子女结点值。如:图中,假如新调入一名教师,在未分配到某个教研室以前,不能将新教员插入到数据库。删除:如果删除双亲结点值,如此相应的子女结点值也被同时删除。如:图中
3、,假如删除网络教研室,需要首先删除属于网络教研室的所有教师的数据。修改:应修改所有相应记录,以保证数据的一致性。如:图1.14(b)中,假如一个学生要改,如此两处学生记录值均要修改。3. 存储结构存储容:数据本身;数据之间的联系。两种方法:邻接法;法。图 1.15(a) 数据模型图1.15(b) 数据值图1.15(c) 邻接法存储图1.16(a) 图1.15(a)的数据值图1.16(b) 法存储4. 优缺点优点数据模型比拟简单,操作简单;对于实体间联系是固定的,且预先定义好的应用系统,性能较高;提供良好的完整性支持。缺点不适合于表示非层次性的联系;对插入和删除操作的限制比拟多;查询子女结点必须
4、通过双亲结点;由于结构严密,层次命令趋于程序化。二、网状模型定义:允许一个以上的结点无双亲;一个结点可以有多于一个的双亲。代表产品:DBTG系统模型类产品。1. 数据结构用网状结构来表示各类实体以与实体间的联系,层次模型是网状模型的一个特例。每个结点表示一个记录类型实体,结点之间的连线表示记录类型间的一对多的父子联系。每个记录类型可包含假如干个字段属性。图1.17(a) 学生/选课/课程网状数据库模型图1.17(b) 学生/选课/课程网状数据库的一个值2. 数据操作与完整性约束数据操作:查询、插入、删除和修改。完整性约束:插入:允许插入尚未确定双亲结点值的子女结点值。删除:允许只删除双亲结点值
5、。修改:只需修改指定记录即可性。3. 存储结构存储容:数据本身;数据之间的联系。两种方法:法包括:单向、双向、环状、向首等。图1.17(c) 学生/选课/课程网状数据库存储4. 优缺点优点能够更为直接地描述现实世界;具有良好的性能,存取效率较高。缺点数据定义语言(DDL)极其复杂;数据独立性较差。由于实体间的联系本质上通过存取路径指示的,因此应用程序在访问数据时要指定存取路径。三、关系模型定义:其逻辑结构就是二维表格,由行列组成。代表产品:Oracle公司的Oracle、Microsoft公司的SQL Server。1. 数据结构概念关系(Relation):一个关系就是一表。如图。图 1.1
6、8 关系模型的数据结构元组(Tuple):表中的一行。属性(Attribute):表中的一列。主码(Key):能够唯一确定一个元组的属性。如:学号。域(Domain):属性的取值围。如:年龄域是1-150之间、性别域是男、女、系名域是一个学校所有系名的集合。分量:元组中的一个属性值,如:95004、黄大鹏、法律学。关系模式:对关系的描述,一般表示为:关系名(属性1,属性2,属性n)图的学生关系可描述为:学生(学号,年龄,性别,系名,年级)特点在关系模型中,实体与实体间的联系都是用关系来表示。如:学生、课程、学生与课程多对多的联系即学生选课均可用关系来表示,如下:学生学号,年龄,性别,系名,年级
7、课程课程号,课程名,学分学生选课学号,课程号,成绩关系模型要求关系必须是规的,最根本的条件是,关系的每一个分量必须是一个不可分的数据项,即不允许表中还有表。如图中的表就不是一个关系。图 1.19 不符合关系模型规的表格2. 数据操作与完整性约束数据操作:查询、插入、删除和修改。完整性约束:包括三大类,即:实体完整性、参照完整性和用户定义的完整性。在节中讲解3. 存储结构存储容:由于数据本身和数据之间的联系均是表,物理存储时,表以文件的形式存储。两种方法:一个文件一个表如:Foxpro;多个文件一个表如:SQL Server。4. 优缺点优点:关系模型是建立在严格的数学概念的根底上的;无论实体还是实体之间的联系都用关系来表示。对数据的检索结果也是关系即表,因此概念单一,其数据结构简单、清晰;关系模型的存取路径对用户透明,从而具有更高的数据独立性,更好的安全性,也简化了程序员的工作和数据库开发建立的工作。缺点:由于存取路径对用户透明,查询效率往往不如非关系数据模型。因此为了提高性能,必须对用户的查询请求进展优化,增加了开发数据库管理系统的负担。8 / 8