《空间数据的获取与处理.pptx》由会员分享,可在线阅读,更多相关《空间数据的获取与处理.pptx(110页珍藏版)》请在三一办公上搜索。
1、第五章 空间数据的处理,曾喆中国石油大学测绘系,本章主要内容,5.1空间数据内容5.2空间数据采集5.3空间数据的编辑与处理 图形编辑 属性数据编辑 数学基础变换 图像纠正 坐标变换 栅格数据重采样 图形拼接 拓扑生成 数据重构 数据格式转换 数据压缩 5.4空间数据质量评价与控制,空间数据采集与处理的基本流程,5.1空间数据内容,Google Earth Nokia Here Microsoft Bing 天地图 GIS系统空间数据如何建立?,数据采集在GIS中的地位,以数据为处理线索硬件软件数据=12 7,6,GIS数据的内容,数字线化数据 地形测图思想:点、线、面影像数据数据源丰富生产效
2、率高直观详细记录地表自然现象数字高程模型属性数据是什么,判读和考察详细描述信息,7,GIS数据源种类多,来源广泛,处理方法差异大;GIS数据源获取方法手段多,既有传统手工获取方法,又有用现代化技术获取方法;GIS系统数据源采集必需根据所建立系统的需要和实际条件确定。,数据源特征,数据采集任务,将现有的地图、外业观测成果、航空像片、遥感图片数据、文本资料等转换成GIS可以接受的数字形式。数据库入库之前进行验证、修改、编辑等处理,保证数据在内容和逻辑上的一致性。不同的数据来源要用到不同的设备和方法。数据的转换装载数据处理:几何纠正、图幅拼接、拓扑生成等,9,数据源种类,图形图像数据:地图 工程图规
3、划图照片航空与遥感影像等文字数据:调查报告文件统计数据实验数据野外调查的原始记录等,10,1.地图数据内容直观与丰富完备的专题地图集在应用地图数据时应注意以下几点:地图存储介质的缺陷。由于地图多为纸质,在不同的存放条件下存在不同程度的变形,具体应用时,须对其进行纠正。地图现势性较差。传统地图更新周期较长,造成现存地图的现势性不能完全满足实际需要。地图投影的转换。使用不同投影的地图数据进行交流前,须先进行地图投影的转换。,2.影像数据能取得大面积、综合的信息;速度快;能提供各类专题所需要的信息。不同传感器(光学激光干涉)3.实测数据传统手段野外调绘新技术手段,4.统计数据 来源不同:部门机构 人
4、口、自然资源等的大量统计资料 国民经济的各种统计数据 和一定范围内的统计单元或观测点相联系 包括研究对象的特征值、观测点的几何数据和统计资料的基本统计单元。5.多媒体数据图片、声音、视频如:GIS-T中交通监视,6.文本资料数据 各种文字报告(各种文字说明资料对确定专题内容的属性特征起着重要的作用)文字报告是区域合研究不可缺少的参考资料文字说明资料也是地理信息综系统建立的主要依据,须认真加以研究,准确送入计算机系统,使搜集资料更加系统化。,5.2空间数据采集,空间数据采集图形数据的采集,空间数据采集方法:外业实地数字化采集手扶跟踪数字化仪采集摄影测量数字化采集扫描跟踪数字化采集遥感数据的采集选
5、择采集方法的依据是如何应用图形数据,图形数据类型,现有设备状况,现有人力,物力,财力状况等。,16,空间数据采集图形数据的采集,空间数据采集图形数据的采集,18,):,等投影仪,扫描仪等,通过胶片、扫描仪等进行A/D转换,一次处理(变换到CCT等通用载体上,再生、校正处理,变换处理,分类处理,电磁波,数字图像,数字图像,GIS等数字处理系统,彩色CRT及胶片等模拟系统,遥感数据处理基本流程,空间数据采集图形数据的采集,空间数据采集图形数据的采集,遥感影像的采集-(MMS系统,Mobile Mapping Systems),空间数据采集图形数据的采集,激光扫描(LiDAR)数据的采集,空间数据采
6、集数据交换,22,空间数据采集方案,23,空间数据采集流程,24,计划调查,编辑处理,评价,准备收集,数字化,空间数据采集属性数据的采集,包括各类调查报告、文件、统计数据、实验数据与野外调查的原始记录等,如人口数据、经济数据、土壤成份、环境数据。对于要输入属性库的属性数据,通过键盘直接键入或文件、表格、数据库导入。对于要直接记录到栅格或矢量数据文件中的属性数据,则必须进行编码输入。,25,空间数据采集属性数据的采集,国家资源与环境信息系统规范在“专业数据分类和数据项目建议总表”中,将数据分为社会环境、自然环境和资源与能源三大类共14小项,并规定了每项数据的内容及基本数据来源。,26,属性数据分
7、类,属性数据的编码编码原则,系统性和科学性:满足所涉及学科的科学分类方法,能反映出同一类型中不同的级别特点。一致性:对代码所定义的同一专业名词、术语必须是唯一的。标准化和通用性:有国家或行业标准的要按标准进行,没有标准的必须考虑在有可能的条件下实现标准化。简捷性:在满足国家标准的前提下、每一种编码应该是以最小的数据量载负最大的信息量。可扩展性:编码的设置应留有扩展的余地,避免新对象的出现而使原编码系统失效、造成编码错乱现象。,28,属性数据的编码编码内容,登记部分:用来标识属性数据的序号,可以是简单的连续编号,也可划分不同层次进行顺序编码;分类部分:用来标识属性的地理特征,可采用多位代码反映多
8、种特征;控制部分:用来通过一定的查错算法,检查在编码、录入和传输中的错误,在属性数据量较大情况下具有重要意义。,29,属性数据的编码编码方法,层次分类编码法:是按照分类对象的从属和层次关系为排列顺序的一种代码,它的优点是能明确表示出分类对象的类别,代码结构有严格的隶属关系。,30,属性数据的编码编码方法,多源分类编码法:对于一个特定的分类目标,根据诸多不同的分类依据分别进行编码,各位数字代码之间并没有隶属关系。,31,思考题,GIS的数据源有哪些?简述其特征并叙述通过何途径来获取这些数据源通过文献和网络资料,分析目前GIS的数据采集新技术方法以上述内容为基础形成一篇3000-5000字的小报告
9、,5.3空间数据的编辑与处理,空间数据的编辑与处理,空间数据编辑的必要性修正数据输入错误维护数据的完整性和一致性更新地理信息空间数据一般性错误数据不完整、重复空间数据位置不正确空间数据比例尺不准确空间数据变形几何和属性连接有误属性数据不完整错误检查主要方法叠合比较法目视检查法逻辑检查法,34,空间数据的编辑与处理,图形编辑图形数字化完成后,一些在数字化输入过程中的错误需要被改正。ESRI定义了以下判断录入图形是否正确的六个准则,可以帮助发现拓扑错误。1)所有录入的实体都能够表现出来;2)没有输入额外的实体;3)所有的实体都在正确的位置上,并且其形状和大小正确;4)所有具有连接关系的实体都已经连
10、上;5)所有的多边形都有且只有一个标志点以识别它们;6)所有的实体都在边界之内;上述的准则,特别是第五和第六条,只是针对ESRI的ARC/INFO软件而言,其它的GIS软件由于具体实现的不同,可能会有差异。,空间数据的编辑与处理,误差修正一般过程:设定容许值连接接点重建拓扑关系,36,在数字化后的地图上,错误的具体表现形式:1)伪结点(Pseudo Node),伪结点使一条完整的线变成两段,造成伪结点的原因常常是没有一次录入完毕一条线。,空间数据的编辑与处理,2)悬挂结点(Dangling Node),如果一个结点只与一条线相连接,那么该结点称为悬挂节点,悬挂结点有多边形不封闭、不及和过头、结
11、点不重合等几种情形。,(a)多边形不封闭(b)节点不重合,(C)不及,(d),过头,空间数据的编辑与处理,3)“碎屑”多边形或“条带”多边形(Sliver Polygon)条带多边形一般由于重复录入引起,由于前后两次录入同一条线的位置不可能完全一致,造成了“碎屑”多边形。另外,由于用不同比例尺的地图进行数据更新,也可能产生“碎屑”多边形。,空间数据的编辑与处理,4)不正规的多边形(Weird Polygon)不正规的多边形是由于输入线时,点的次序倒置或者位置不准确引起的。在进行拓扑生成时,同样会产生“碎屑”多边形。,空间数据的编辑与处理,属性数据编辑属性数据校核包括两部分:属性数据与空间数据是
12、否正确关联,标识码是否唯一,不含空值。属性数据是否准确,属性数据的值是否超过其取值范围等。属性数据错误检查可通过以下方法完成:首先可以利用逻辑检查,检查属性数据的值是否超过其取值范围,属性数据之间或属性数据与地理实体之间是否有荒谬的组合。把属性数据打印出来进行人工校对,这和用校核图来检查空间数据准确性相似。,空间数据的编辑与处理,数学基础变换,几何纠正 由于如下原因,使扫描得到的地形图数据和遥感数据存在变形,必须加以纠正。(1)地形图的实际尺寸发生变形;(2)在扫描过程中,工作人员的操作会产生一定的误差,如扫描时地形图或遥感影像没被压紧、产生斜置或扫描参数的设置不恰当等,都会使被扫入的地形图或
13、遥感影像产生变形,直接影响扫描质量和精度;(3)遥感影像本身就存在着几何变形;(4)地图图幅的投影与其它资料的投影不同,或需将遥感影像的中心投影或多中心投影转换为正射投影等。(5)扫描时受扫描仪幅面大小的影响,有时需将一幅地形图或遥感影像分成几块扫描,这样会使地形图或遥感影像在拼接时难以保证精度。,空间数据的编辑与处理,1.地形图的纠正对地形图的纠正,一般采用四点纠正法或逐网格纠正法。四点纠正法,一般是根据选定的数学变换函数,输入需纠正地形图的图幅行、列号、地形图的比例尺、图幅名称等,生成标准图廓,分别采集四个图廓控制点坐标来完成。逐网格纠正法,是在四点纠正法不能满足精度要求的情况下采用的。这
14、种方法和四点纠正法的不同点就在于采样点数目的不同,它是逐方里网进行的,也就是说,对每一个方里网,都要采点。具体采点时,一般要先采源点(需纠正的地形图),后采目标点(标准图廓),先采图廓点和控制点,后采方里网点。,空间数据的编辑与处理,2.遥感影像的纠正 遥感影像的纠正,一般选用和遥感影像比例尺相近的地形图或正射影像图作为变换标准,选用合适的变换函数,分别在要纠正的遥感影像和标准地形图或正射影像图上采集同名地物点。具体采点时,要先采源点(影像),后采目标点(地形图)。选点时,要注意选点的均匀分布,点不能太多。,空间数据的编辑与处理,空间数据的编辑与处理,图象纠正纠正原因地图变形(均匀变形、非均匀
15、变形)数字化中的位置移动遥感影像本身存在几何变形投影方式不同分幅扫描实质建立纠正图象与标准地图的一一对应关系变换方法精确方法:仿射变换、双线性变换、平方变换、立方变换等近似方法:橡皮板变换纠正步骤纠正点数据采集函数建立逐点或网格纠正,45,空间数据的编辑与处理,图象纠正橡皮板变换函数变换,46,空间数据的编辑与处理,坐标变换,1.仿射变换 仿射变换是在不同的方向上进行不同的压缩和扩张,可以将球变为椭球,将正方形变为平行四边形,其公式为:,空间数据的编辑与处理,2.相似变换 相似变换是由一个图形变换为另一个图形,在改变的过程中保持形状不变(大小可以改变)。包括平移、旋转和缩放三种基本的相似变换操
16、作。(1)平移平移是将图形的一部分或者整体移动到笛卡尔坐标系中另外的位置,其变换公式为:,空间数据的编辑与处理,空间数据的编辑与处理,(2)旋转在地图投影变换中,经常要应用旋转操作。实现旋转操作要用到三角函数,假定顺时针旋转角度为,其公式为:,空间数据的编辑与处理,(3)缩放缩放操作可用于输出大小不同的图形,其公式为:,空间数据的编辑与处理,52,空间数据的编辑与处理,3.橡皮拉伸橡皮拉伸缩通过坐标几何纠正来修正缺陷。主要针对几何变形,通常发生在原图上。它们可能由于在地图编绘中的配准缺陷、缺乏大地控制或其它各种原因产生。,空间数据的编辑与处理,栅格数据重采样重采样是栅格数据空间分析中处理栅格分
17、辨率匹配问题的常用数据处理方法。进行空间分析时,用来分析的数据资料由于来源不同,经常要对栅格数据进行何纠正、旋转、投影变换等处理,在这些处理过程中都会产生重采样问题。,空间数据的编辑与处理,1.最邻近像元法直接取与P(x,y)点位置最近像元N的值作为该点的采样值,即:I(P)=I(N)N为最近点,其坐标值为:xN=INT(x+0.5)yN=INT(y+0.5),空间数据的编辑与处理,2.双线性插值法,3.三次卷积法考虑一个浮点坐标(i+u,j+v)周围的16个邻点,目的像素值f(i+u,j+v)可由如下插值公式得到:f(i+u,j+v)=A*B*CA=S(u+1)S(u+0)S(u-1)S(u
18、-2)f(i-1,j-1)f(i-1,j+0)f(i-1,j+1)f(i-1,j+2)B=f(i+0,j-1)f(i+0,j+0)f(i+0,j+1)f(i+0,j+2)f(i+1,j-1)f(i+1,j+0)f(i+1,j+1)f(i+1,j+2)f(i+2,j-1)f(i+2,j+0)f(i+2,j+1)f(i+2,j+2)S(v+1)C=S(v+0)S(v-1)S(v-2)1-2*Abs(x)2+Abs(x)3,0=2S(x)是对 Sin(x*Pi)/x 的逼近(Pi是圆周率),空间数据的编辑与处理,空间数据的编辑与处理,图形拼接在相邻图幅的边缘部分,由于原图本身的数字化误差,使得同一实
19、体的线段或弧段的坐标数据不能相互衔接,或是由于坐标系统、编码方式等不统一,需进行图幅数据边缘匹配处理。,图幅拼接,。,空间数据的编辑与处理,空间数据的编辑与处理,1.逻辑一致性的处理 由于人工操作的失误,两个相邻图幅的空间数据库在接合处可能出现逻辑裂隙,如一个多边形在一幅图层中具有属性A,而在另一幅图层中属性为B。此时,必须使用交互编辑的方法,使两相邻图斑的属性相同,取得逻辑一致性。2.识别和检索相邻图幅 将待拼接的图幅数据按图幅进行编号,编号有2位,其中十位数指示图幅的横向顺序,个位数指示纵向顺序,并记录图幅的长宽标准尺寸。其次,图幅数据的边缘匹配处理主要是针对跨越相邻图幅的线段或弧而言的。
20、为了减少数据容量,提高处理速度,一般只提取图幅边界2cm范围内的数据作为匹配和处理的目标,同时要求图幅内空间实体的坐标数据已经进行过投影转换。,图幅编号及图幅边缘数据提取范围,空间数据的编辑与处理,空间数据的编辑与处理,3.相邻图幅边界点坐标数据的匹配相邻图幅边界点坐标数据的匹配采用追踪拼接法。只要符合下列条件,两条线段或弧段即可匹配衔接:相邻图幅边界两条线段或弧段的左右码各自相同或相反;相邻图幅同名边界点坐标在某一允许值范围内(如0.5mm)。匹配衔接时是以一条弧或线段作为处理的单元,因此,当边界点位于两个结点之间时,须分别取出相关的两个结点,然后按照结点之间线段方向一致性的原则进行数据的记
21、录和存储。,空间数据的编辑与处理,4 相同属性多边形公共边界的删除当图幅内图形数据完成拼接后,相邻图斑会有相同属性。此时,应将相同属性的两个或多个相邻图斑组合成一个图斑,即消除公共边界,并对共同属性进行合并。多边形公共界线的删除,可以通过构成每一面域的线段坐标链,删去其中共同的线段,然后重新建立合并多边形的线段链表。对于多边形的属性表,除多边形的面积和周长需重新计算外,其余属性保留其中之一图斑的属性即可。,空间数据的编辑与处理,拓扑生成,1点线拓扑关系的建立点线拓扑关系的建立方法有两种方案。一种是在图形采集和编辑中实时建立,此时有两个文件表,一个记录结点所关联的弧段,一个记录弧段两端点的结点。
22、第二种方案是在图形采集与编辑之后,系统自动建立拓扑关系。其基本思想与第一种类似,在执行过程中逐渐建立弧段与起终结点和结点关联的弧段表。,空间数据的编辑与处理,2 多边形拓扑关系的建立多边形有三种情况:独立多边形,它与其他多边形没有共同边界,如独立房屋,这种多边形可以在数字化过程中直接生成,因为它仅涉及一条封闭的弧段;具有公共边界的简单多边形,在数据采集时,仅输入了边界弧段数据,然后用一种算法自动将多边形的边界聚合起来,建立多边形文件;嵌套多边形,除了要按第二种方法自动建立多边形外,还要考虑多边形内的多边形(也称作内岛)。,空间数据的编辑与处理,多边形自动生成的步骤和方法:a.首先进行结点匹配;
23、b.建立结点弧段拓扑关系;,空间数据的编辑与处理,c.多边形的自动生成。多边形的自动生成实际上就是建立多边形与弧段的关系,并将弧段关联的左右多边形填入弧段文件中。建立多边形拓扑关系时,必须考虑弧段的方向性,即弧段沿起结点出发,到终结点结束,沿该弧段前进方向,将其关联的两个多边形定义为左多边形和右多边形。,空间数据的编辑与处理,3 网络拓扑关系的建立网络拓扑关系的建立主要是确定结点与弧段之间的拓扑关系,其方法与建立多边形拓扑关系时相似,只是不需要建立多边形。但在一些特殊情况下,两条相互交叉的弧段在交点处不一定需要结点,如道路交通中的立交桥,在平面上相交,但实际上不连通,这时需要手工修改,将在交叉
24、处连通的节点删除。,空间数据的编辑与处理,数据重构,1 数据结构转换矢量向栅格的转换实质上是将矢量图上点、线、面实体的坐标数据转为规则的格网数据再给予填充。矢量数据向栅格数据转换要将矢量表示的多边形转成栅格数据,使多边形内部所有栅格赋于多边形号。,空间数据的编辑与处理,(行列)=?,坐标,空间数据的编辑与处理,1)选择单元的大小和形状,确定栅格的行和列;2)将点和线实体角点的笛卡尔坐标转换到预定分辨率和已知位置的矩阵中;3)利用单根扫描线(沿行或列)或一组相连接的扫描线去测试线性要素与单元边界的交叉点,并记录穿过交叉点的栅格单元个数;4)测试多边形时,先测试角点,再对剩下线段进行二次扫描,到达
25、边界位置时,记录其位置与属性值。,矢量到栅格数据的转换步骤,空间数据的编辑与处理,矢量数据转换成栅格数据后,图形的几何精度必然要降低,所以选择栅格尺寸的大小要尽量满足精度要求,使之不过多地损失地理信息。为了提高精度,栅格需要细化,但栅格细化,数据量将以平方指数递增,因此,精度和数据量是确定栅格大小的最重要的影响因素。栅格尺寸确定 计算若干个小图斑的面积S(i1,2,n);求最小图斑的面积 S min;求栅格尺寸L=1/2*(S min)1/2。,栅格尺寸确定,空间数据的编辑与处理,H/2,H=1/2*(minAi)1/2,网格边界的确定,空间数据的编辑与处理,栅格行列数确定矢量数据向栅格 数据
26、转换前,还要根据研究区域的分辨率要求,确定栅格行列数。,其中 i,j,分别为y,x,方向的栅格数;Xmin,xmax ymin,ymax 为矢量数据的数值范围;x,y 分别按需要确定的为每个栅格单元的边长。,j,i,栅格元素大小和数量的确定,空间数据的编辑与处理,矢量图,栅格图,如一研究区域X方向长15公里,Y方向长30公里,现有该区域的1:1万比例尺的矢量图,要将其转成栅格结构图,要求栅格的最低分辨率是30m*30m。栅格数的确定:行数 I=30km/30m=1000格 列数 J=15km/30m=500格,空间数据的编辑与处理,边界确定法实现矢栅转换,1、点的转换,空间数据的编辑与处理,2
27、、线的转换,线的转换实质是找出组成曲线的直线段对应的栅格串(1)首先将A,B点转成栅格;(2)确定行列值的范围;(3)求直线中间栅格,实质是由行求列。以一个栅格为例,已知i行,求j 列 i行同直线相交的y值 由y值从直线方程求x值 由x值求对应的j,空间数据的编辑与处理,射线法,3、区域的填充,8方向扩散法,内部扩充法,空间数据的编辑与处理,从栅格单元转换到几何图形的过程称为矢量化,矢量化过程要保证以下两点:转换物体正确的外形点:某个单元的值与周围不同,代表点;线:具有相同属性值的连续的单元格,将其搜索出来并细化处理,成为一条线;面:将具有同一属性的单元归为一类,再检测两类不同属性的边界作为多
28、边形的一条边。保持栅格表示出的连通性与邻接性;,栅格数据向矢量数据转换,空间数据的编辑与处理,多边形边界提取;边界线追踪;去除多余点及曲线光滑;拓扑关系生成,1、栅格数据向矢量数据转换的典型过程,空间数据的编辑与处理,多边形边界提取 二值化 细化,5,9,10,141,138,9,5,3,1,0,2,245,156,73,144,178,132,23,7,3,212,5,6,8,29,11,214,167,5,124,110,7,6,5,4,7,133,5,192,350,110,135,6,4,7,244,12,2,5,12,135,201,166,127,155,9,1,1,9,4,8,2
29、1,12,211,43,5,0,2,256,22,空间数据的编辑与处理,多边形边界提取 二值化 细化,2 3 4 5 10 11 12 16 21 24 28 33 34 35 38 42 43 46 50,边界线追踪:边界线跟踪的目的就是将写入数据文件的细化处理后的栅格数据,整理为从结点出发的线段或闭合的线条,并以矢量形式存储于特征栅格点中心的坐标拓扑关系生成:对于矢量表示的边界弧段,判断其与原图上各多边形空间关系,形成完整的拓扑结构,并建立与属性数据的联系。去除多余点及曲线圆滑:由于搜索是逐个栅格进行的,必须去除由此造成的多余点记录,以减少冗余。,空间数据的编辑与处理,数据格式转换,1、外
30、部数据交换方式外部数据交换方式是目前空间转换的主要方式。大部分商用GIS软件定义了外部数据交换文件格式,一般为ASCII码文件,如ArcInfo的EOO,MapInfo的MID,AutoCAD的DXF等。,空间数据的编辑与处理,2、标准空间数据交换标准方式 许多国家和国际组织制定了空间数据交换标准,例如美国国家空间数据协会(NSDI,National Spatial Data Institute)制定了统一的空间数据格式规范SDTS。根据SDTS,目前有许多GIS软件提供了标准的空间数据交换格式,如ArcInfo的SDTSIMPORT和SDTSEXPORT模块等,可供其他系统调用。有了空间数据
31、交换的标准格式后,每个系统都提供读写这一标准格式空间数据的程序,避免了大量的编程工作,而且数据转换只需两次。,空间数据的编辑与处理,3、空间数据的互操作方式空间数据的互操作方式是基于公共接口的数据融合方式。例如,OGC(Open GIS Consortium)为数据互操作制定了统一的规范,从而使一个系统同时支持不同的空间数据格式成为可能。Open GIS的思想是将空间数据的转换变成一次转换或者不进行转换,实现不同GIS软件系统之间空间数据的互操作。,空间数据的编辑与处理,4、基于语义的转换 在数据转换的过程中,数据格式的不一致实质上是空间数据模型的定义不一致。因此,基于语义的数据格式转换也是一
32、种非常有前景的转换方法。基于语义层次上的空间数据转换,除了数据结构的转换外,更重要的是对语义数据模型的转换和操作,更注重数据所蕴含的知识背景。,空间数据的编辑与处理,数据模型A和数据模型B可以自由映射到数据转换模型中,而这种映射不是基于最低数据转换标准的映射机,也就是说不是基于公共要素的映射。在这种映射中,针对输入、输出数据,数据转换模型提供了一系列的方法来实现数据模型之间的定义和转换。这种功能使得数据的转入方和数据的转出方之间可以自由地变换,并且可以继续使用各自独立的系统和数据格式。,基于语义数据转换模型示意图,空间数据的编辑与处理,空间数据的压缩,空间数据的编辑与处理,数据压缩途径,压缩软
33、件:原数据信息基本不丢失而且可以大大节省存贮空间,缺点是压缩后的文件必须在解压缩后才能使用。数据消冗处理:原数据信息不会丢失,得到的文件可以直接使用,缺点是技术要求高,工作量大,对冗余度不大的数据集合效用小。用数据子集代替数据全集:在规定的精度范围内,从原数据集合中抽取一个子集,缺点以信息损失为代价,换取空间数据容量的缩小。,空间数据的编辑与处理,常见空间数据的压缩方法,曲线数据的压缩,面域栅格数据的压缩,面域邻接线段的删除,特征点筛选法:筛选抽取曲线特征点,并删除全部多余点以达到节省存贮空间的目的。,空间数据的编辑与处理,曲线数据的压缩,面域栅格数据的压缩,面域邻接线段的删除,通过压缩编码技
34、术来消除冗余数据:链码游程长度编码块码四叉树编码,常见空间数据的压缩方法,空间数据的编辑与处理,曲线数据的压缩,面域栅格数据的压缩,面域邻接线段的删除,数据属性的重新分类和空间图形的化简需要对数据进行压缩相邻界线的删除共同属性的合并,常见空间数据的压缩方法,空间数据的编辑与处理,每隔k个点取一点,或每隔一规定的距离取一点,但首末点一定要保留。这种方法可大量压缩数字化使用连续方法获取的点和栅格数据矢量化而得到的点,但不一定能恰当地保留方向上曲率显著变化的点。,1.间隔取点法,这种方法是按垂距的限差选取符合或超过限差的点,其方法如图所示。P2点的垂距大于限差,应保留;P3点的垂距小于限差,予以舍弃
35、。,2.垂距法,曲线数据的压缩,空间数据的编辑与处理,这个方法是沿着边界线,逐点计算通过当前点Pj的两条直线Lj1和Lj2之间的夹角aj,其中Lj1是经过Pj和Pj-k0两点的直线,而Lj2是经过Pj和Pj+k0这两点的直线。若|aj|小于某一阈值a0,那么就认为Pj是一应保留点。,3.合并法(偏角法),空间数据的编辑与处理,这个方法可用以下几步来描述:(1)在给定的曲线的两端之间连一直线。(2)对曲线上每一点计算它与直线的垂直距离。若所有这些距离均小于某一阈值o,那么就用它来表示原曲线。(3)若(2)中条件不满足,含有最大垂直距离的点Pj为保留点将原曲线分成两段曲线,对它们递归地重复使用分裂
36、法。,4.分裂法(道格拉斯普克法),空间数据的编辑与处理,图中,实线为原曲线,虚线为压缩后的曲线。,道格拉斯普克法,5.4空间数据质量评价与控制,空间数据质量评价与控制,1 空间数据质量的相关概念 误差(Error)误差表示数据与其真值之间的差异。准确度(Accuracy)准确度是量测值与真值之间的接近程度。它可以用误差来衡量。偏差(Bias)与误差不同,偏差基于一个面向全体量测值的统计模型,通常以平均误差来描述。精密度(Precision)精密度指在对某个量的多次量测中,各量测值之间的离散程度。,2 空间数据质量评价,1、评价指标(1)完备性:要素、要素属性和要素关系的存在和缺失。完备性包括
37、两个方面的具体指标:多余:数据集中多余的数据;遗漏:数据集中缺少的数据。(2)逻辑一致性:对数据结构、属性及关系的逻辑规则的依附度(数据结果可以是概念上的、逻辑上的或物理上的)。包括四个具体指标:概念一致性:对概念模式规则的符合情况;值域一致性:值对值域的符合情况;格式一致性:数据存储同数据集的物理结构匹配程度;拓扑一致性:数据集拓扑特征编码的准确度。,(3)位置准确度:要素位置的准确度。包括三个具体指标:绝对或客观精度:坐标值与可以接受或真实值的接近程度;相对或内在精度:数据集中要素的相对位置和其可以接受或真实的相对位置的接近程度;格网数据位置精度:格网数据位置值同可以接受或真实值的接近程度
38、。(4)时间准确度:要素时间属性和时间关系的准确度。包括三个具体指标:时间量测准确度:时间参照的正确性(时间量测误差报告);时间一致性:事件时间排序或时间次序的正确性;时间有效性:时间上数据的有效性。(5)专题准确度:定量属性的准确度;定性属性的正确性;要素的分类分级以及其他关系。包括四个具体指标:分类分级正确性:要素被划分的类别或等级,或者他们的属性与论域(例如,地表真值或参考数据集)的比较;非定量属性准确度:非定量属性的正确性;定量属性准确度:定量属性的准确度;对于任意数据质量指标可以根据需要建立其它的具体指标。,2.评价方法(1)直接评价法 直接评价法又分为内部和外部两种。内部直接评价方
39、法要求对所有数据仅在其内部对数据集进行评价。例如在属于拓扑结构的数据集中,为边界闭合的拓扑一致性做的逻辑一致性测试所需要的所有信息。外部直接评价法要求参考外部数据对数据集测试。例如对数据集中道路名称做完整性测试需要另外的道路名称原始性资料。(2)间接评价法 间接评价法是一种基于外部知识的数据集质量评价方法。外部知识可包括但不限定数据质量综述元素和其他用来生产数据集的数据集或数据的质量报告。在下列几种情况下,间接评价法是有效的:使用信息中记录了数据集的用法;数据日志信息记录了有关数据集生产和历史的信息;用途信息描述了数据集生产的用途。,3 空间数据的误差源及误差传播,数据源地图遥感数据数字地图G
40、PS全站仪摄影测量,原始GIS数据,处理后的GIS数据,数据输入,空间数据处理,数据源及产生过程 GIS中的误差源,GIS中数据的误差源,4 误差类型分析,1、几何误差 几何误差即空间数据在描述空间实体时,在几何属性上的误差。,2.属性误差 属性数据可以分为命名、次序、间隔和比值四种类型。间隔和比值的属性数据误差可以用点误差的分析方法进行分析评价。多数专题图都用命名或次序表现,如人口分布图、土地利用图、地质图等的内容主要为命名数据,而反映坡度、土壤侵蚀度等一般是次序数据。如将土壤侵蚀度分为若干级,级数即为次序数据。考察空间任意点处定性属性数据与其真实的状态是否一致,只有对或错两种可能。因此可以
41、用遥感分类中常用的准确度评价方法来评价定性数据的属性误差。定性属性数据的准确度评价方法比较复杂,它受属性变量的离散值(如类型的个数),每个属性值在空间上分布和每个同属性地块的形态和大小,检测阳电的分布和选取,以及不同属性值在特征上的相似程度等多种因素的影响。,5 空间数据质量的控制,空间数据质量控制的方法1)传统的手工方法 质量控制的手工方法主要是将数字化数据与数据源进行比较,图形部分的检查包括目视方法、绘制到透明图上与原图叠加比较,属性部分的检查采用与原属性逐个对比或其它比较方法。(2)元数据方法 数据集的元数据中包涵了大量的有关数据质量的信息,通过它可以检查数据质量,同时元数据也记录了数据处理过程中质量的变化,通过跟踪元数据可以了解数据质量的状况和变化。(3)地理相关法 用空间数据的地理特征要素自身的相关性来分析数据的质量。,