土地数据库管理.ppt

上传人:牧羊曲112 文档编号:5950031 上传时间:2023-09-07 格式:PPT 页数:136 大小:5.25MB
返回 下载 相关 举报
土地数据库管理.ppt_第1页
第1页 / 共136页
土地数据库管理.ppt_第2页
第2页 / 共136页
土地数据库管理.ppt_第3页
第3页 / 共136页
土地数据库管理.ppt_第4页
第4页 / 共136页
土地数据库管理.ppt_第5页
第5页 / 共136页
点击查看更多>>
资源描述

《土地数据库管理.ppt》由会员分享,可在线阅读,更多相关《土地数据库管理.ppt(136页珍藏版)》请在三一办公上搜索。

1、第四章 土地数据管理,土地数据管理,土地数据库,土地数据模型,土地数据结构,土地数据组织管理,空间数据仓库的理论与实践,数据库的发展数据库概述空间数据库土地数据库,数据模型概述层次模型网络模型关系模型面向对象的模型时空数据模型,数据结构栅格数据结构矢量数据结构矢栅一体化三维数据结构,分层组织管理分块组织关无缝组织管理,空间数据仓库的出现主要功能特征体系结构应用实例,一、数据库的几个阶段,人工管理阶段 文件系统阶段 数据库阶段,4.1 土地数据库,1.人工管理阶段(五十年代中期以前),(1)没有专用的软件对数据进行管理;(2)没有文件的概念;(3)数据是面向应用的,不共享。,2.文件管理阶段,(

2、1)数据可以长期保存在文件中;(2)由文件系统管理数据;(3)数据共享性差,冗余度大;(4)数据独立性差。,3.数据库阶段,特点:(1)数据结构化是数据库与文件系统的根本区别;(2)数据的共享性高,冗余度低,易扩展;(3)数据独立性高;(4)数据库系统为用户提供了方便的用户接口;(5)数据由DBMS统一管理和控制。,3.数据库阶段,4.1 土地数据库,二、数据库在土地信息系统中的地位与作用,土地信息数据获取花费的时间要占整个管理系统建设所花时间的85%以上。,贮存于数据库中的空间数据和属性数据是土地信息系统的基础。,土地信息数据库是数据库在土地管理方面的应用。,(一)数据库定义 是数据组织和存

3、储的高级形式,是具有特定联系的多种类型的记录集合。其数据组织常分为字段、记录、文件和数据库四级。,三、数据库概述(Database,简称DB),1、字段 是可以定义数据的最小单位,也叫基本项或数据项等。,2、记录 是应用程序输入输出的逻辑单位,是关于一个实体的数据总和,构成该记录的字段表示实体的若干属性。,建立数据库不仅仅是为了保存数据,扩展人的记忆,而主要是为了帮助人们去管理和控制与这些数据相关联的事物。土地信息系统中的数据库就是一种专门化的数据库,由于这类数据库具有明显的空间特征,所以有人把它称为空间数据库。,3、文件 是一给定类型的记录的全部具体值的集合。,4、数据库 是集中、统一地保存

4、和管理某一信息系统或某一领域内有用信息数据的计算机系统。数据库的内部构造是文件的集合,这些文件之间存在某种联系,不能孤立存在。,三、数据库概述,5、数据库管理系统,三、数据库概述,DBMS(DataBase Management System)是位于用户与操作系统之间的一层数据管理软件,它提供了数据库的访问接口。,DBMS的主要功能:,数据定义功能 数据操作功能 数据库运行管理(恢复、控制、安全性、完整性)数据库的建立和维护功能,DBMS的目的:提供方便地、有效地存取数据库信息的环境。,6、空间数据库管理系统 是指能够对存储的地理空间数据进行语义和逻辑的定义,提供必需的空间数据查询检索和存取功

5、能,以及能够对空间数据进行有效的维护和更新的一套软件系统。,7、数据库应用系统 是由土地信息系统的空间分析模型和应用模型所组成的软件。,三、数据库概述,(二)数据库特征,空间数据库与一般数据库相比,具有以下特点:1、数据集中控制特征:不是文件“拼凑”而是数据“集成”2、数据冗余度小的特征:在文件方式中,数据冗余度大。冗余数据的存在有两个缺点:一是增加了存储空间;二是易出现数据的不一致。3、数据独立性特征:数据独立是指数据库中的数据与应用程序相互独立 4、复杂的数据模型:采用数据模型是数据库方法与文件方式的一个本质差别 5、数据保护特征:至关重要,3.内模式(internal schema)存储

6、模式:它是当数据库在外存储器(例如磁盘)上存储时,对它的物理结构的描述。,1.概念模式(conceptual schema)数据库的总框架,是对数据库中关于目标存储的逻辑结构和特性、基本操作、目标以及目标与操作的关系和依赖的描述,以及对数据的安全性、完整性等方面的定义。,(三)数据库系统结构,2.外模式(external schema)每一外模式都是概念模式的一个子集,包涵了允许某一特定用户使用的那部分数据。外模式就是用来定义满足不同用户(例如土地规划、地价评估等)需要的数据库。一个数据库只能有一个概念模式,但却允许有多个外模式。,目的:是利用数据库技术实现空间数据的有效存储、管理和检索,为各

7、种空间数据库的用户所用,(一)空间数据库是以描述空间位置和点、线、面、体特征的拓扑结构的位置数据及描述这些特征的性能的属性数据为对象的数据库。,四、空间数据库,位置数据为空间数据,属性数据为非空间数据。,四、空间数据库,(二)空间数据库管理系统,是指能够对物理介质上存储的地理空间数据进行语义和逻辑上的定义;提供必须的空间数据查询、检索和存取功能;能够空间数据进行有效的维护和更新的一套软件系统。,(三)空间数据库应用系统,提供给用户访问和操作空间数据库的用户界面,是应用户数据处理需求而建立的具有数据库访问功能的应用软件。一般需要进行二次开发。,一般由专业GIS软件提供,(四)空间数据库的特点,属

8、性数据和空间数据联合管理:不仅有地理要素的属性数据(与一般数据库中的数据性质相似),还有大量的空间数据。,数据量特别大:要素的空间位置,其数据量往往很大,数据应用范围广泛:可用于地理研究、环境保护、土地利用与规划、资源开发、生态环境、市政管理、道路建设等领域,五、土地数据库,土地数据库:是一个空间数据库,是土地信息系统在计算机物理存储介质上存储与应用相关的土地空间数据的集合。,随着土地信息系统空间数据库技术的发展,空间数据库所能表达的空间对象日益复杂,数据库和用户功能日益集成化,从而对空间数据库的设计过程提出了更高要求。,城市规划、地籍管理、基础设施管理、城市税收、环境保护、土地利用,城市规划

9、部门需要掌握各个地块特定的使用类型,是居民用地,还是商业用地或其他 用地,环境保护部门则需要掌握各地块是否是污染地区或被污染地区,交通管理部门则关心各地块的交通状况和道路状况,土地使用部门则需要掌握各地块是否按规定进行使用,税务部门则更关心从各地块上何时能收回多少税,4.2 土地数据库模型,一、数据模型,(一)定义是数据库系统中关于数据和联系的逻辑组织形式的表示(二)特点每一种数据模型都以不同的数据抽象与表示能力来反映客观事物,有其不同的处理数据联系的方式,(三)数据模型的三要素,数据结构:数据结构用于描述系统的静态特性,研究与数据类型、内容、性质有关的对象,例如关系模型中的域、属性、关系等。

10、数据操作:数据库主要有检索和更新(包括插入、删除、修改)两大类操作。数据模型必须定义这些操作的确切含义、操作符号、操作规则(如优先级)以及实现操作的语言。数据的约束条件:数据的约束条件是一组完整性规则的集合。完整性规则是给定的数据模型中数据及其联系所具有的制约和储存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效和相容。此外,数据模型还应该提供定义完整性约束条件的机制。,(四)数据模型分类:,独立于计算机系统的数据模型,它完全不涉及信息在计算机系统中的表示,只是用来描述某个特定组织所关心的信息结构,这类模型称为“概念数据模型”。概念模型用于建立信息世界的数据模型,强

11、调其语义表达能力,概念应该简单,清晰,易于用户理解,它是现实世界的第一层抽象,是用户和数据库人员之间进行交流的工具。最著名的是“实体联系模型”。,2.直接面向数据库的逻辑结构的数据模型,它是现实世界的第二层抽象。这类模型涉及到计算机系统和数据库管理系统,又称为“基本数据模型”或“结构数据模型”。例如,层次、网状、关系、面向对象数据模型”。这类模型有严格的形式化定义,以便在计算机系统中实现。,实体:实体是可以相互区别而又可以被人识别的事、物、概念的统称。有具体的,也有抽象的;有物理上存在的,也有概念性的。属性:实体的属性是指描述实体的若干特征。例如,宗地有地号、坐落、四至、面积等属性。,(五)数

12、据模型相关概念,联系:实体与实体之间的各种关系例如建设用地管理处与用地申请者有审批的关系等。这种实体与实体之间的关系抽象为联系。两个实体之间的联系称为二元联系,三个以上的实体发生联系,称为多元联系。联系也可以有自己的属性,如建设用地管理处与用地申请者之间的审批联系有审批号、审批意见、审批日期、审批人等属性,(五)数据模型相关概念,码:唯一标识实体的属性集。域:属性的取值范围。,数据模型是数据特征的抽象,它不是描述个别数据,而是描述数据的共性。严格地说,一个数据库的数据模型应能描述数据的以下特征:,1、静态特性。包括实体和实体具有的特性、实体间的联系等,通过构造基本数据结构类型来实现。,2、动态

13、特性。即现实世界中的实体及实体间的不断发展变化,通过对数据库的检索、插入、删除和修改等操作来实现。,3、数据间的相互制约与依存关系。通过一组完整性规则来实现。由此可见,一个数据模型实际上给出了在计算机系统中描述现实世界的信息结构及其变化的一种抽象方法。数据模型不同,描述和实现的方法也不相同,相应的支持软件数据库管理系统也就不同。,(六)实体之间的关系,实体之间的关系数据模型反映了现实世界中实体之间的各种联系。主要有两种 实体内部属性间的联系实体与实体之间的联系,(1)一对一的联系:这是最简单的一种实体之间的联系,它表示两个实体集中的个体间存在的一对一的联系。记为1:1地理名称与对应的空间位置之

14、间的关系就是一种一对一的联系(2)一对多的联系:这是实体间存在的较普遍的一种联系,表示一种实体集A中的每个实体与另一实体集B中的多个实体间存在的联系;反之,B中的每个实体都至多与A中的一个实体发生联系。记为1:N行政区划就具有一对多的联系,一个省对应有多个市,一个市有多个县,一个县又有多个乡。(3)多对多的联系:这是实体间存在的更为普遍的一种联系,表示多个实体集之间的多对多的联系。其中,一个实体集中的任何一个实体与另一个实体集中的实体间存在一对多的联系;反之亦然。记为M:N土壤类型与种植的作物之间有多对多的联系。同一种土壤类型可以种植不同的作物,同一种作物又可种植在不同的土壤类型上。,A,B,

15、A,B,A,B,一对一,一对多,多对多,实体与实体之间的联系是错综复杂的,可以分为以下三种:,用树型(层次)结构表示实体之间联系的数据模型称为层次数据模型(hierarchical data model)。它揭示的是实体(记录)之间的一对多(1:n)的联系。通常把表示1的实体放在上方,称为“父结点”;将表示n的实体放在下方,称为“子结点”;最上层只能有一个结点,称为根结点。为符合1:n的联系,除根结点外,其他的结点都有且仅有一个“父结点”,但是每个父结点可以对多个子结点。最下层的末端结点称为叶结点。,二、层次模型,层次模型的两个限制条件有且仅有一个结点无父结点,这个结点称为根结点;其它结点有且

16、仅有一个父结点。层次模型的优点是容易理解,单码查找速度快,易于更新和扩充;缺点是多码查找比较困难,一般需要较大的索引文件,所以产生数据冗余。,二、层次模型,M,A,B,原始地图,层次数据模型,层次型数据模型,优点存取方便且速度快结构清晰,容易理解数据修改和数据库扩展容易实现检索关键属性十分方便,二、层次模型,缺陷结构呆板,缺乏灵活性同一属性数据要存储多次,数据冗余大(如公共边)不适合于拓扑空间数据的组织,三、网络模型,基本原理用网络结构来表示实体之间联系的模型,网状模型的有向图与层次模型的有向树比较,其区别在于:(1)可以有零个或多个结点元父结点;(2)至少有一个结点有多于一个父结点;(3)允

17、许两个结点之间有两种或多种联系。,这种数据模型的基本特征是,结点数据之间没有明确的从属关系,一个结点可与其它多个结点建立联系,即结点之间的联系是任意的,任何两个结点之间都能发生联系,可表示多对多的关系。,M,A,B,a,c,1,b,d,2,3,4,f,e,g,5,6,原始地图,网络数据模型,三、网状模型表示自然要素、社会经济要素和地理位置之间联系的示例:,*,网状模型较层次模型扩充了实体之间联系的限制,可以较灵活地表示实体之间的多种关系,对确定的数据表示效率较高,数据冗余也较小,适合于表示关系较复杂的地理数据和具有网络状特征的地理实体,但网状模型的数据指针比较复杂,数据更新也较为繁琐。,优点能

18、明确而方便地表示数据间的复杂关系数据冗余小缺陷网状结构的复杂,增加了用户查询和定位的困难。需要存储数据间联系的指针,使得数据量增大数据的修改不方便(指针必须修改),三、网络模型,关系模型源于数字,它把数据看成是二维表格中的元素,而这个二维表格就是所谓关系。表中的每一行代表一个记录,每一列称为关系的一个属性集,列可以命名,称为属性名,或数据项类型。一个实体可由若干关系组成,而关系表的集合就构成关系模型。对这种数字化的模型,每个关系应满足下列条件:(1)表中的每一列属性都是不能再分的基本字段;(2)各列被指定一个相异的名字;(3)各行(记录)相异,不允许重复;(4)行,列次序无关。综合以上四点可知

19、,一个关系是一个概念文件,该文件中的每个记录是惟一的,所有记录具有相同的个数和类型的宇段,也就是说,,所有的记录有同样的固定长度和格式。,四、关系模型,关系模型中的有关概念 关系:关系是一个二维表,表的每行对应一个元组,表的每一列对应一个域。关键字:关系中的某一属性组,若它的值唯一地标识了一个元组,则称该属性组为候选关键字。若一个关系中有多个候选关键字,则选定一个为主关键字。该关键字的属性称为主属性,其余的属性为非主属性。(标识码)关系模型:关系的描述称为关系模式。它包括关系名、属性名、属性域的映射及属性间的依赖关系等。关系数据库:一系列关系的集合构成一个关系数据库。关系完整性:即指关系的正确

20、性、相容性和有效性。它是给定的关系模型中数据及其联系的所有制约和依存规则,用以限定数据库状态及状态变化,从而保证数据的正确、相容和有效。,基本示意图,四、关系模型,空间数据表示实例,(a)坐标点数据表,(b)弧段坐标点索引表,表存放对实体(坐标点)的描述,如点编码、X、Y坐标等信息;表存放对实体(弧段)的描述,如弧段编码、起点编码、终点编码、左区域、右区域、包络矩形等信息。,两个表可简单地表示弧段与点之间的关系:,关系模型的特点:优点:结构单一化;关系模型是在严格的关系代数的基础上进行的。具有结构简单灵活、数据修改和更新方便是当前数据库中最常用的数据模型。缺点 数据库大时,查找满足特定关系的数

21、据费时,对象是客观事物实体的部分或整体的数字表达。每个对象都有自己的特征和行为,对象的特征用数据来表示,称作对象的属性;对象的行为用对象中的代码来实现,称作对象的方法。,面向对象的基本概念是在本世纪70年代萌发出来的,它的基本做法是把系统工程中的某个模块和构件视为问题空间的一个或一类对象。到了80年代,面向对象的方法得到很快发展,在系统工程、计算机、人工智能等领域获得了广泛应用。但是,在更高级的层次上和更广泛的领域内对面向对象的方法进行研究还是90年代的事。,五、面向对象模型,(一)面向对象的基本概念,1.类2.对象3.属性与方法4.封装与消息传递5.类层次和继承,1.类,共享同一属性和方法集

22、的所有对象的集合构成类。类是对象集合的抽象。如河流均具有共性,如名称、长度、流域面积等,以及相同的操作方法,如查询、计算长度、求流域面积等,因而可抽象为河流类。,实例 类的一个具体对象,称为实例,如长江、黄河等。真正抽象的河流不存在,只存在河流的例子。类是抽象的对象,是实例的组合,类、实例是相对的,类和实例的关系为上下层关系。类-申请实例-成为具体对象。,类实例,2.对象,对象是含有数据和操作方法的独立模块,可以认为是数据和行为的统一体。如一个城市、一棵树均可作为地理对象。具有一个唯一的标识,以表明其存在的独立性;具有一组描述特征的属性,以表明其在某一时刻的状态静态属性数据;具有一组表示行为的

23、操作方法,用以改变对象的状态。作用、功能函数、方法。,现实世界抽象实例,现实世界,对象1,对象2,对象3,抽象,类,实例,方法、消息,封装,协议,复杂对象,指具有复杂结构和操作的对象。复杂对象可以由多种关系聚合抽象而成,或由不同类型的对象构成,或具有复杂的嵌套关系等。复杂对象的特点可归结为:一个复杂对象由多个成员对象构成,每个成员对象又可参与其它对象的构成;具有多种数据结构,如矢量、栅格、关系表等;一个复杂对象的不同部分可由不同的数据模型所支持,也就是说,可以分布于不同的数据库中。,复杂对象实例,在GIS中的一个复杂地理实体(如大学)可能含有矢量数据、栅格数据、属性数据,甚至多媒体数据,而且可

24、以认为是由其它较简单的实体(如道路、教学楼、操场等)组成,因此,可以作为一个复杂对象。GIS的地理实体所具有的矢量数据也可以认为是一个复杂对象,因为它包含了几何数据和属性数据,而几何数据又是由点、线、面等简单对象组成。,复杂地物实例,空间地物,一个对象包含一组属性,用以描述对象的状态、组成或特性。属性的值也是对象。,3.属性与方法,一个简单对象如整数、字符串等,它的值本身就是其状态的完全描述,不再需要其他属性,这样的对象称为原子对象。,一个复杂的对象包含若干个属性,而这些属性作为一种对象,有可能包含多个属性。,方法:除了一组属性外,对象包含一组方法,用以描述对象的行为特性。一个方法实际上是一段

25、可对对象进行某种操作的程序,方法可以改变对象的状态。一个对象的内部状态只能由自身的方法来操作,也就是说,一组方法表达了该对象的动态特性。,3.属性与方法,4.封装与消息传递,封装一般讲,包起来,将方法与数据放于一对象中,以使对数据的操作只可通过该对象本身的方法来进行。在这,指把对象的状态及其操作集成化,使之不受外界影响。消息传递:对象之间的请求和协作。(并不独立存在)对象之间的关系,如鼠标点,就是消息,点某按纽,就是对按纽提出请求并进行传递。复杂对象的某些属性值不单独存于数据库中,而由子对象派生或提取,将子(成员)对象的属性信息强制地传播给综合复杂对象。成员对象的属性只存储一次,保证数据一致性

26、和减少冗余。如河南省总人口,由存储在各成员对象中的各市人口总和得出。,在面向对象的系统中,一个类的上层可以有超类(Superclass),一个类的下层可以有子类(subclass),形成了一种层次结构。这种层次结构的一个重要特点是继承性(inheritance)。一个类继承其超类的所有性质。这种继承具有传递性,如果C1继承C2,C2继承C3,那么C1间接继承C3。所以一个类实际上继承了层次结构中在其上面的所有类的全部性质。类的这种层次结构可以方便地模拟现实世界。,5.类层次和继承性,面向对象的空间数据模型的特点,具有可扩充性。由于对象是相对独立的,因此可以很自然和容易地增加新的对象,并且对不同

27、类型的对象具有统一的管理机制。可以模拟和操纵复杂对象。传统的数据模型是面向简单对象的,无法直接模拟和操纵复杂实体,而面向对象的数据模型具备对复杂对象进行模拟和操纵的能力。,在LIS中建立面向对象的数据模型时,对象的建立应符合人们对客观世界的理解,并且要完整地表达各种地理对象,及它们之间的相互关系。,六、时空数据模型,传统的地理信息系统应用只涉及地理信息的两个方面:空间维度和属性维度 TGIS数据模型特点是语义更丰富、对现实世界的描述更准确,其物理实现的最大困难在于海量数据的组织和存取。TGIS技术的本质特点是“时空效率”。,根据应用领域的特点(如宏观变化观测与微观变化观测)和客观现实变化规律(

28、同步变化与异步变化、频繁变化与缓慢变化),折中考虑时空数据的空间/属性内聚性和时态内聚性的强度,选择时间(空间/属性)标记的对象。,同时提供静态(变化不活跃)、动态(变化活跃)数据建模手段(静态、动态数据类型和操作)(当前和历史数据)。,通过这幅地图的符号和文字等信息,我们很容易获知地图要素及其空间关系,但是如何才能使计算机“懂得”这些要素和空间关系?又如何正确地存储和表达这些要素和空间关系?这便是本节所要讨论的基本问题土地间数据结构。,问题的提出:如何在计算机中实现对地理空间中各种要素及其空间关系的数字化描述呢?,4.3土地数据结构,数据结构即指数据组织的形式,是适合于计算机存储、管理和处理

29、的数据逻辑结构。空间数据结构是土地信息系统沟通信息的桥梁,只有充分理解土地信息系统所采用的特定数据结构,才能正确有效地使用系统。,一、数据结构,4.3土地数据结构,LIS的空间数据结构主要有栅格结构、矢量结构和矢栅一体化结构三种。不同数据源常需采用不同的数据结构来处理,计算机处理数据的效率很大程度取决于数据结构。,显式描述,显式表示:就是栅格中的一系列像元(点),为使计算机认识这些像元描述的是某一物体而不是其它物体。注:“c”不一定用c的形式,而可以用颜色、符号、数字、灰度值来显示。则得到椅子的简单数据结构为:椅子的属性符号颜色像元x,隐式表示,隐式表示:由一系列定义了始点和终点的线及某种连接

30、关系来描述,线的始点和终点坐标定义为一条表示椅子形式的矢量,线之间的指示字,告诉计算机怎样把这些矢量连接在一起形成椅子,隐式表示的数据为:椅子的属性一系列矢量连接关系,二、栅格数据结构,是指将地球表面划分为大小均匀、紧密相邻的网格阵列,每个网格作为一个像元,由行、列定义其位置,每一个像元包含一个代码,表示该像元的属性。,地理空间的实体在地图中被划分为三种基本类型点、线、面,分别在栅格结构中如何表示呢?,(一)定义,1.空间实体的表示,点,线,面,点用一个栅格单元表示;,这三种类型在栅格数据结构中的实现。,线状地物用沿线走向的一组相邻栅格单元表示,每个栅格单元最多只有两个相邻单元在线上;,面或区

31、域用记有区域属性的相邻栅格单元的集合表示,每个栅格单元可有多于两个的相邻单元同属一个区域。,栅格数据单元格经常是矩形(主要是正方形)的,但并不是必须如此。其单元格形状可以随应用的需要进行具体设定,比如设置为三角形。,2.栅格数据的形状、尺寸及相关问题,栅格数据的比例尺就是栅格大小与地表相应单元大小之比。栅格尺寸越小,其分辨率越高,数据量也越大。,由于栅格结构对地表的离散,在计算面积、长度、距离、形状等空间指标时,若栅格尺寸较大,则造成较大的误差。由于栅格单元中存在多种地物,而数据中常常只记录一个属性值,这会导致属性误差。比如,遥感数据中的“混合像元(mixed pixel)”问题。Landsa

32、t的MSS卫星影像每个单元对应地表79m*79m的矩形区域,2.栅格数据的形状、尺寸及相关问题,(二)栅格数据结构的特点,属性明显数据中直接记录了数据属性,因而我们可以直接得到地物的属性代码定位隐含所在位置则根据行列号转换为相应的坐标,也就是说定位是根据数据在数据集中的位置得到的。栅格结构是按一定的规则排列的,所表示的实体的位置很容易隐含在格网文件的存储结构中,(a)点(b)线(c)面,(三)决定栅格单元代码的方式,基本原则:在决定栅格代码时尽量保持地表的真实性,保证最大的信息容量。注意:每一个单元可能对应多个地物种类或多个属性值。,每个栅格元素只能取一个值,实际上一个栅格可能对应于实体中几种

33、不同属性值,存在栅格数据取值问题。,1.中心点法 处理方法:用处于栅格中心处的地物类型或现象特性决定栅格代码 常用于具有连续分布特性的地理要素,如降雨量分布、人口密度图等。,例如:中心点O落在代码为C的地物范围内,按中心点法的规则,该矩形区域相应的栅格单元代码为C,(三)决定栅格单元代码的方式,2.面积占优法处理方法:以占栅格区域面积比例最大的地物类型或现象特性决定栅格单元的代码 面积占优法常用于分类较细,地物类别斑块较小的情况,例如:所示的例子中,显见B类地物所占面积最大,故相应栅格代码定为B,(三)决定栅格单元代码的方式,3.重要性法 处理方法:根据栅格内不同地物的重要性,选取最重要的地物

34、类型决定相应的栅格单元代码 重要性法常用于具有特殊意义而面积较小的地理要素,特别是点、线状地理要素,如城镇、交通枢纽、交通线、河流水系等,在栅格中代码应尽量表示这些重要地物。,例如:假设A类最重要的地物类型,即A比B和C类更为重要,则栅格单元的代码应为A,(三)决定栅格单元代码的方式,4.百分比法 处理方法:根据栅格区域内各地理要素所占面积的百分比数确定栅格单元的代码 适用于地物面积具有重要意义的分类体系,例如:可记面积最大的两类BA,也可以根据B类和A类所占面积百分比数在代码中加入数字,(三)决定栅格单元代码的方式,(三)决定栅格单元代码的方式,5.其他方法 根据具体的应用内容,栅格单元的代

35、码确定方式还可以采用其他方法,如插值方法(平均值就是其中之一),或使用特定的计算函数等。,除了采用这几种取值方法外,为了提高取值的精度,还可以采用缩小单个栅格单元的面积,增加栅格单元总数的方法。,73,1.直接栅格编码法:,优点:编码简单,信息无压缩、无丢失。缺点:数据量大。,直接编码就是将栅格数据看作一个数据矩阵,逐行(或逐列)逐个记录代码,可以每行从左到右逐像元记录,也可奇数行从左到右而偶数行由右向左记录,为了特定的目的还可采用其他特殊的顺序。,(四)栅格数据的组织方法,栅格数据压缩存储编码方法,链式编码,游程长度编码,块状编码,四叉树编码,R,2.链式编码(ChainCodes),又链式

36、编码也称为弗里曼链码(Freeman)或边界链码。首先定义基本方向,可定义为:东0,东南1,南2,西南3,西4,西北5,北6,东北7等八个基本方向。,R:(10,1,),7,0,1,0,7,1,7,0,0,2,3,2,2,1,0,7,0,0,0,0,2,4,3,4,4,3,4,4,5,4,5,4,5,4,5,4,6,6。,如果确定起点为像元(10,1),则该如何对右图多边形边界按顺时针方向进行链式编码?,起点行列号,然后对图形边界编码,数据结构是(起点,方向,方向)。,优点:链式编码对多边形的表示具有很强的数据压缩能力,且具有一定的运算功能,如面积和周长计算等,探测边界急弯和凹进部分等都比较容

37、易,比较适于存储图形数据。缺点对叠置运算如组合、相交等则很难实施,对局部修改将改变整体结构,效率较低,而且由于链码以每个区域为单位存储边界,相邻区域的边界则被重复存储而产生冗余。,77,3.游程长度编码法:,沿行方向进行编码:(A,3),(B,5);(A,4),(B,4);(A,4),(B,4);(A,1),(B,2),(C,3),(B,2);(B,2),(C,5),(A,1);(B,2),(C,3),(A,3);(B,2),(C,2),(A,4);(B,2),(A,6).,方案1:只在各行(或列)数据的代码发生变化时依次记录该代码以及相同代码重复的个数;,78,方案2:逐个记录各行(或列)代

38、码发生变化的位置和相应代码。,沿行方向进行编码:(1,A),(4,B);(1,A),(5,B);(1,A),(5,B);(1,A),(2,B),(4,C),(7,B);(1,B),(3,C),(8,A);(1,B),(3,C),(6,A);(1,B),(3,C),(5,A);(1,B),(3,A).,3.游程长度编码法(续):,79,特点:,属性的变化愈少,行程愈长,压缩比例越大,即压缩比的大小与图的复杂程度成反比,优点:,压缩效率高(保证原始信息不丢失);易于检索、叠加、合并操作,缺点:,只顾及单行单列,没有考虑周围的其他方向的代码值是否相同,压缩受到一定限制,3.游程长度编码法(续):,(

39、1,1,1,0),(1,2,2,2),(1,4,1,5),(1,5,1,5),(1,6,2,5),(1,8,1,5);(2,1,1,2),(2,4,1,2),(2,5,1,2),(2,8,1,5);(3,3,1,2),(3,4,1,2),(3,5,2,3),(3,7,2,5);(4,1,2,0),(4,3,1,2),(4,4,1,3);(5,3,1,3),(5,4,2,3),(5,6,1,3),(5,7,1,5),(5,8,1,3);(6,1,3,0),(6,6,3,3);(7,4,1,0),(7,5,1,3);(8,4,1,0),(8,5,1,0)。,块式编码是将游程长度编码扩大到二维的情况

40、,把多边形范围划分成由像元组成的正方形,然后对各个正方形进行编码。块式编码的数据结构:(行号,列号,半径,属性)。,4.块式编码,特点:1、面状地物所能包含的正方形越大,多边形边界越简单,块码编码效率超高;2、图形比较碎,多边形边界复杂的图形,数据压缩率低;3、利于计算面积、合并插入等操作。,5.四叉树编码(Quadtree Encoding),基本思想:先把地图看成是一个正方形的单元,如果该单元内有不同性质的多边形,则将单元分成四个大小相同的二级单元,然后再分别判断这四个二级单元中是否还有不同性质的多边形;若其中某个二级单元中有不同性质的多边形,则再划分成四个大小相同的三级单元;这种逐级一分

41、为四的方法,一直分到单元内无不同性质的多边形为止。,四叉树的生成算法:1)从上而下的分割算法:需要大量的运算,因为大量数据需要重复检查才能确定划分。当矩阵比较大,且区域内容要素又比较复杂时,建立这种四叉树的速度比较慢。2)从下而上的合并算法:如果每相邻四个网格值相同则进行合并,逐次往上递归合并,直到符合四叉树的原则为止。这种方法重复计算较少,运算速度较快。,2323,0,1,2,3,10 11 12 13,122,A,B,C,D,1)常规四叉树,对一幅2N 2N的栅格阵列,最大深度为N,可能有的层次为0,1,2,N,那么,每层的栅格宽度为:2(最大深度-当前层次)反映了所在叶结点表示的正方形集

42、合的大小。,2(3-0)=8,2(3-1)=4,2(3-2)=2,2(3-3)=1,85,练习:常规四叉树编码,如果不是2n2n像元阵列,怎么进行进行四叉树编码呢?,缺点:所占空间比较大,不仅要记录每个结点,还要记录一个前趋结点和四个后继点,以及反映结点之间联系,对栅格数据进行运算时,还要作遍历树结点的运算,增加操作复杂性。,直接栅格编码:简单直观,是压缩编码方法的逻辑原型(栅格文件);链码:压缩效率较高,以接近矢量结构,对边界的运算比较方便,但不具有区域性质,区域运算较难;游程长度编码:在很大程度上压缩数据,又最大限度的保留了原始栅格结构,编码解码十分容易,十分适合于微机地理信息系统采用;块

43、码和四叉树编码:具有区域性质,又具有可变的分辨率,有较高的压缩效率,四叉树编码可以直接进行大量图形图象运算,效率较高,是很有前途的编码方法。,各种编码方法的比较,5.栅格数据结构特点,以离散的规则阵列来表示地理空间实体的分布的数据组织;位置隐含,属性明显;数据结构简单,易于实现,易于遥感数据结合;数据量大;几何和属性偏差;面向位置的数据结构,难以建立空间对象之间的空间关系。,三、矢量数据结构,(一)定义矢量数据结构是通过记录坐标的方式,尽可能地将点、线、面地理实体表现得精确无误。其坐标空间假定为连续空间,不必象栅格数据结构那样进行量化处理。因此矢量数据能更精确地定义位置、长度和大小。除数学上的

44、精确坐标假设外,矢量数据存储是以最小的存储空间存储复杂的数据。,(二)矢量数据结构编码的基本内容,矢量数据结构通过记录空间对象的坐标及空间关系来表达空间对象的位置。点:空间的一个坐标点;线:多个点组成的弧段;面:多个弧段组成的封闭多边形;,92,点(point):空间的一个坐标点,用一对(x,y)表示;线(line,polyline):多个点组成的弧段用一串(x1,y1),(x2,y2),(xn,yn)表示;面(polygon):多个弧段组成的封闭多边形;由一串或几串有序的且首尾坐标相同的x、y坐标对表示。,矢量数据的表示:通过记录坐标的方式来精确表示点、线、面等地理实体。,矢量结构中点、线、

45、面的表示,点实体,线实体,面实体,多边形矢量编码,不但要表示位置和属性,更重要的是能表达区域的拓扑特征,如形状、邻域和层次结构等,以便使这些基本的空间单元可以作为专题图的资料进行显示和操作。,1.简单的矢量数据结构实体式(坐标序列法)只记录空间对象的位置坐标和属性信息,不记录拓扑关系。存储:独立存储:空间对象位置直接跟随空间对象;点位字典:点坐标独立存储,线、面由点号组成特征无拓扑关系,主要用于显示、输出及一般查询公共边重复存储,存在数据冗余,难以保证数据独立性和一致性多边形分解和合并不易进行,邻域处理较复杂;处理嵌套多边形比较麻烦适用范围:制图及一般查询,不适合复杂的空间分析,(三)矢量数据

46、结构编码方法,编码方法有三种:,99,面条结构:每个点、线、面目标都直接跟随它的空间坐标,即点目标:唯一标识码,地物编码,(X,Y)线目标:唯一标识码,地物编码,(X1,Y1Xn,Yn)面目标:唯一标识码,地物编码,(X1,Y1Xn,Yn,X1,Y1),100,点位字典结构:点坐标作为一个文件,点、线和多边形由点号组成,即 点位字典:点号、(X,Y)点目标:唯一标识码,地物编码,点号线目标:唯一标识码,地物编码,(点号1点号n)面目标:唯一标识码,地物编码,(点号1点号n,点号1),101,链/点位字典结构:,简单数据结构的特点:,数据按点、线和多边形为单元进行组织,结构简单、直观,编码容易。

47、每个多边形都以闭合线段存储,多边形之间的公共边界被数字化两次和存储两次,造成数据冗余。点、线和多边形有各自的坐标数据和属性数据,但没有拓扑数据,互相之间不关联,空间分析非常困难。岛只作为一个单个图形,没有与外界多边形的联系。,2.拓扑数据结构:不仅表达几何位置和属性信息,还表示空间关系(拓扑关系)。,拓扑型数据结构由弧段(坐标)文件、结点文件和多边形文件(拓扑元素)等一系列含拓扑关系的数据文件组成.结点文件由结点记录组成,存贮每个结点的结点号、结点坐标及与该结点连接的弧段等;弧段坐标文件存贮组成弧段的点的坐标;弧段文件由弧记录组成,存贮弧段的起止结点号和左右多边形号;多边形文件由多边形记录组成

48、,存贮多边形号、组成多边形的弧段号以及多边形的周长、面积、中心点坐标。,ToNode,LeftPolygon,RightPolygon,FromNode,拓扑关联(Connectivity)拓扑邻接(Adjacency),Arc,关联是不同拓扑元素之间的关系,点与线、线与面之间的关系。,邻接是相同拓扑元素之间的关系,即点与点、线与线、面与面之间的关系。,拓扑关系,拓扑包含(Containment):包含指不同级别或不同层次的多边形图形实体之间的拓扑关系。,拓扑关系,面包含点 面包含线 线包含点,面的简单包含 面的多层包含 面的等价包含,P1,P2,P1,P2,P3,P1,P2,P3,106,在

49、拓扑数据结构中,较著名的是:美国人口调查局的DIME模型(Dual Independent Map Encoding双重独立地图编码模型)美国计算机图形及空间分析实验室研制的POLYVRT模型(Polygon Converter多边形转换器)。,107,DIME是美国人口调查局在人口调查的基础上发展起来的,以线段为基本单元来描述多边形、边界、节点之间的拓扑关系,DIME编码是其它拓扑编码结构的基础。,DIME模型:,108,POLYVRT模型:数据结构的基本元素称“弧段”或“链段”,是当今各种空间数据结构的基本框架。,109,DIME与POLYVRT的比较:,区别:数据结构的基本单元不同,DI

50、ME模型是以两个数据点之间的边界(拓扑模型中一般称为“段”Segment)为关系描述和记录的基本单元;而POLYVRT模型则以两个结点之间的一段边(拓扑模型中一般称为“链”Chain)为基本单元,从而压缩数据量,提高系统的运行速度和效率。共同点:二者都是以线性要素(段或链)作为存储记录结点之间、链间以及多边形间相互关系的基本单元。,DIME与POLYVRT的比较:,区别:数据结构的基本单元不同,DIME模型是以两个数据点之间的边界(拓扑模型中一般称为“段”Segment)为关系描述和记录的基本单元;而POLYVRT模型则以两个结点之间的一段边(拓扑模型中一般称为“链”Chain)为基本单元,从

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号