《第3章:数据来源及处理ppt课件.ppt》由会员分享,可在线阅读,更多相关《第3章:数据来源及处理ppt课件.ppt(73页珍藏版)》请在三一办公上搜索。
1、2023年1月16日12时43分,1,第三章 数据来源与处理,2,2023年1月16日12时43分,1.数据源种类2.空间数据采集的任务2.1数据采集任务2.2数据采集方法2.3矢量数据采集2.3.1 地图跟踪数字化2.3.2 地图扫描矢量化2.4属性数据采集3.空间数据处理,主 要 内 容,3,2023年1月16日12时43分,数据源指建立GIS的地理数据库以及进行应用分析所需的各种数据的来源。空间信息的获取是一个空间信息系统建设的首要任务。一个空间信息系统建设,70以上的工作(费用)将花费在空间信息(特别是矢量数据)的获取上面。,第一节数据源种类,4,2023年1月16日12时43分,GI
2、S工程是以空间数据处理为线索的软件工程硬件软件数据=12 7,5,2023年1月16日12时43分,对于一个GIS应用系统的建设来说,空间数据(图形数据)的来源主要有四种渠道:数据转换:各种交换格式数据(DXF/E00/MIF等 遥感/GPS数据:图象、GPS坐标点文件等 数字测量:形成纸质地图或坐标点文件 已有纸质地图:地图数字化统计数据:GIS重要的属性数据源文本资料:行业部门的有关法律文档、行业规范等。,6,2023年1月16日12时43分,数据转换是目前空间数据共享的一个重要途径,因此,一般的空间信息系统平台都提供了各种交换格式的数据转入/转出功能。纸质地图是GIS主要的数据源。主要通
3、过对地图的跟踪数字化和扫描数字化获取。在使用地图时,应考虑到地图投影所引起的变形,必要时需要进行坐标转换或投影变换。遥感影像含有丰富的资源环境信息,是大面积、动态的、实时的数据源,是GIS数据更新的重要方式。将坐标点文件转为地图数据也是空间信息系统平台必须提供的基本功能。,7,2023年1月16日12时43分,一、采集任务:将地理实体的几何数据和属性数据输入到地理数据库中,就是GIS的数据采集。即将现有的地图、外业观测成果、航空像片、遥感图像、文本资料等转换成GIS可以处理和接收的数字形式,通常经过验证、修改、编辑等处理。采集方式与数据源有关,第二节 空间数据采集的任务,8,2023年1月16
4、日12时43分,矢量化处理流程,9,2023年1月16日12时43分,二、主要采集方法已存在于其它系统的几何数据,经过转换装载测量仪器获得的几何数据,传输进入数据库遥感影像提取专题信息,需要进行几何纠正、光谱纠正、影像增强、图像变换、结构信息提取等,属于遥感图像处理内容栅格数据的获取,通过扫描仪输入,大多可直接进入GIS矢量数据采集,10,2023年1月16日12时43分,不同数据源与其对应的数字化设备,地图,地面测量数据,统计资料,航空、遥感,文字数据,多媒体,坐标几何,数字化仪,扫描仪,摄影测量系统,键盘,空间数据库,编辑、加工、处理,数据交换,11,2023年1月16日12时43分,三、
5、矢量数据的采集,矢量(图形)输入要解决的问题:即几何数据与属性数据。拓扑数据一般在已有的几何数据基础上生成。一般需要进行三方面的工作,即几何数据的采集、属性数据的采集、几何数据与属性数据的连接。,12,2023年1月16日12时43分,两种方式地图跟踪数字化(数字化仪输入、屏幕矢量化)传统的数据采集方法。地图扫描矢量化(自动或半自动矢量化):较为先进的地图数字化方式,13,2023年1月16日12时43分,数字化仪原理 目前较为常用的数字化仪是电磁感应式数字化仪,它是利用电磁感应原理检测出图形坐标数据的。由游标线圈(定位器)、工作桌面(包括铺设其下的栅格阵列导线)以及电子部件、微处理器和输出装
6、置组成。其中游标线圈是电磁发射源,工作桌面接收信号,电子部件、微处理器把游标线圈在工作桌面上的位移量转换成x,y坐标,最后经输出装置输入计算机,1、地图跟踪数字化,14,2023年1月16日12时43分,基本过程 将需要数字化的图件(地图、航片等)固定在数字化板上,设定数字化范围,输入有关参数,选择数字化方式,按地图要素的类别实施数字化 在进行地图手扶跟踪数字化时,需要在数字化仪面板坐标和地图真实坐标之间建立映射关系,通常的做法是先录入三个不在同一条直线上的控制点。,15,2023年1月16日12时43分,控制点(tic)概念,地图上具有控制地图图幅精确度的一些点,也称地理控制点(同名点),通
7、常这些点都具有准确的实地坐标或可以精确定位的,如图幅图廓点、公路网格点、测量点、道路交叉口等,16,2023年1月16日12时43分,图形数字化桌,17,2023年1月16日12时43分,1、扫描仪数字化思想通过扫描将地图转换为栅格数据,然后采用栅格数据矢量化的技术追踪出线和面,采用模式识别技术识别出点和注记,并根据地图内容和地图符号的关系自动给矢量数据赋以属性值。2、主要方法自动矢量化交互式矢量化:采用人机交互方式,2、地图扫描数字化,18,2023年1月16日12时43分,1、灰度二值化 灰度二值化是将一幅有各种灰度(亮度)分布的黑白图像变为非黑即白(非“1”即“0”)的二值图像,是将图像
8、变为图形的一种过渡。二值化阈值确定方法:经验法、直方图、人机交互法和数理统计法。,19,2023年1月16日12时43分,空间数据输入:扫描仪输入,扫描仪:滚筒式、平板式。大幅面A0一般是滚筒式,小幅面一般是平板式A4。扫描得到的是栅格图像。扫描后,必须进行后续处理。这一工作称为“矢量化”,20,2023年1月16日12时43分,Contex大幅面工程图纸扫描仪,扫描方式:二值灰度真彩色扫描精度:DPI(dots per inch),21,2023年1月16日12时43分,地图扫描数字化(自动矢量化),2、线条细化剥离法:其实质是从数字图像上,由上而下,自左到右一次选3 3个像元,进行分析,以
9、不影响其连通性为原则决定中心像元是否可以剥离,逐次排下去,可以将线条带剥离成单个像元的细线。(如图只有2、3、4、5、10、11、12、16、22、23、28、33、34、35、38、42、43、46、50可以将中心点剥去),22,2023年1月16日12时43分,23,2023年1月16日12时43分,3、跟踪,生成矢量格式坐标链自动搜索方法 搜索结点 3 3网格法结点间8个方向跟踪组成网格链,逐个网格取其中心点坐标,转换成矢量坐标链弧段,点 端点 中间点 结点,地图扫描数字化(自动矢量化),24,2023年1月16日12时43分,R2V扫描数字化软件界面,25,2023年1月16日12时4
10、3分,四、属性数据的采集,1、属性数据(统计数据或专题数据)的采集数据量较小,可以在输入几何数据的同时,用键盘输入;数据量大,与几何数据分别输入,根据预先建立属性表输入属性;从其它统计数据库导入属性,通过关键字段联接图形。2、几何数据与属性数据之间的联系:公共标识码(用户ID),即 几何数据(图形数据)与属性数据之间的公共标识符,26,2023年1月16日12时43分,1、遥感数据 2、手工方式:可在专题地图上均匀地划分网格,每一单位格子覆盖部分的属性数据成为各点的值,形成栅格地图文件;,五、栅格数据常用的获取方法,3、矢量数据转换:数字化仪跟踪,得到矢量数据,再转为栅格数据;,4、图片扫描数
11、据:扫描数字化方法,逐步扫描专题地图,将扫描数据重新采样和再编码得到栅格数据文件。,27,2023年1月16日12时43分,第三节空间数据处理,采集之后的数据处理工作包括:几何纠正、图形和文本数据的编辑、图幅的拼接、拓扑关系的生成等,即完成GIS的空间数据在装入GIS的地理数据库前的各种工作。3.1矢量数据拓扑关系的自动建立3.2图形编辑3.3空间数据的坐标变换3.4图幅拼接3.5数据格式转换,包括矢量栅格数据转换,不同软件数据格式的转换,不同介质之间的数据转换,28,2023年1月16日12时43分,一、矢量数据拓扑关系的自动建立,1链(弧段)的组织2结点编辑3建立多边形4确定左右多边形5图
12、形编辑,找出坐标链的相交点自动切成新的坐标链(弧段)把弧段按照一定的顺序存储,如按照最大或最小的x或y坐标的顺序,以便检索把弧段按照顺序编号,实现的基本步骤包括:,29,2023年1月16日12时43分,二、图形编辑,空间数据编辑的必要性 修正数据输入错误 维护数据的完整性和一致性 更新地理信息 空间数据编辑内容 数据不完整、重复 空间数据位置不正确 空间数据比例尺不准确 空间数据变形 几何和属性连接有误属性数据不完整,30,2023年1月16日12时43分,纠正数据采集错误的重要手段,以及图形更新的必要步骤,如对点、线、面的增加、删除、修改等。首先是点、线、面的捕捉再进行拓扑编辑(局部或全部
13、拓扑)多边形连接编辑 弧段和结点连接编辑 思考:删除一个弧段影响两个还是多个多边形的拓扑结构属性?,31,2023年1月16日12时43分,1 图斑合并:指两相邻的图斑合并,即系统将相邻的两图斑共用弧段删除,用户给出合并后的图斑编码,在软件支持下实现两图斑的合并2 图斑分裂:图斑合并的逆操作,32,2023年1月16日12时43分,GIS的数据处理拓扑编辑小结,拓扑编辑(1)建立或生成拓扑关系:找交点生成结点和弧段装配多边形 建立多边形标签(label)建立多边形(弧段)属性表(2)数据纠错(净化处理):清除假结点和多余的中间点(3)拓扑编辑:按拓扑数据的要求(比如修改后的数据重新建拓扑)进一
14、步编辑,33,2023年1月16日12时43分,1 概念:空间数据从一种数学状态到另一种数学状态的变换,实质是建立两个平面点之间(或球面坐标和平面坐标)的一一对应关系,是空间数据处理的基本内容之一。主要包括数字化仪坐标和扫描影像坐标与地理坐标的变换,以及两个不同投影的坐标变换2 空间数据需要进行坐标转换的原因(地理意义)3 坐标变换的主要内容 几何纠正 投影变换,三、空间数据的坐标变换,34,2023年1月16日12时43分,坐标变换原因,35,2023年1月16日12时43分,(1)实现地图的数学法则(2)实现由设备坐标(数字化仪坐标或栅格图像坐标)到现实世界坐标(实际地理坐标)的转换,坐标
15、变换的地理意义,指将地球球面上的地理对象表示在平面上的数学基础(如投影方式、比例尺、方向等)。对地图进行数字化时必须将这种数学法则反映到数字地图中,由数字化设备读取的坐标值直接依赖于该设备的坐标系统及其设置,并不代表实际地理坐标,因此有必要建立坐标转换公式,在数字化过程中将设备坐标转换为实际地理坐标。,36,2023年1月16日12时43分,(3)控制数据采集的精度,坐标变换的地理意义,由控制点建立的坐标转换公式实际上是一组回归方程,通过在图面上均匀选取适当数目的控制点,并精确输入控制点的实际地理坐标,可以提高回归方程的拟和精度,进一步控制数字化的精度。,37,2023年1月16日12时43分
16、,控制点建立的坐标转换,38,2023年1月16日12时43分,坐标变换的地理意义,当需要对多幅地图进行数字化时,如果在多幅地图之间或在不同比例尺之间建立了一个统一的坐标系,并在每一幅地图都输入一定数量的控制点及相应的地理坐标,则经由控制点拟合的坐标变换公式,将所有图幅的数字化仪平面坐标转换为所建立的坐标系中的坐标,使得图幅拼接或不同比例尺间地图的匹配成为可能。,(4)实现多图幅拼接或不同比例尺间地图的匹配,39,2023年1月16日12时43分,坐标变换的主要内容,将地图上各点的原坐标,转换成新的坐标。可分为两类:一是将非地理坐标转换为地理坐标(地理坐标化georeferencing);二是
17、校正或配准(registration,几何纠正),可在任意两个坐标系中进行,不一定非要转为地理坐标。1几何纠正(1)主要应用:扫描地形图、遥感影像,进行图纸变形误差的纠正,建立实际地理坐标系。(2)采用方法:仿射变换:使用最多的一种几何纠正方式相似变换二次变换,40,2023年1月16日12时43分,(2.1)仿射变换,公式:,特性:只考虑x和y方向上的变形直线变换后仍为直线平行线变换后仍为平行线不同方向上的长度比发生变化,(2)主要方法,41,2023年1月16日12时43分,基本坐标变换示意,(a)平移,(b)缩放,(c)图形旋转,42,2023年1月16日12时43分,(2.2)坐标变换
18、中待定系数的确定地面控制点(或同名点)是求解转换的基础,要实现仿射变换,需要知道不在同一直线上的3对控制点的数字化坐标及其理论值,才能求得上述6个待定参数。实际中通常利用4个点(控制点)。,(2)主要方法,43,2023年1月16日12时43分,(2.2)坐标变换中待定系数的确定,计算方法:数值变换法,这种方法主要用于地图的数字化。最小二乘法是最为常用的数值变换法。利用最小二乘法的基本思想是,先用一组线性多项式拟合坐标变换公式,实际上是建立回归曲线(转换曲线),用该曲线进行原坐标系的所有点的坐标变换。控制点是转换基础。在地图上选取若干控制点,获取控制点的数字化仪坐标和实际地理坐标,然后利用这组
19、坐标值,根据最小二乘法原理算出多项式的系数。这样在地图数字化过程中,就可以利用这组多项式计算出任意一点的地理坐标。一般的GIS软件都提供了坐标变换功能。,44,2023年1月16日12时43分,(2.3)相似变换与二次变换,相似变换与仿射变换(affine)的区别The SIMILARITY transformation scales,rotates,and translates the data.It will not independently scale the axes,nor will it introduce any skew.A similarity transformation
20、 requires a minimum of two control points.二次变换适用于原图有非线性变换的情况,45,2023年1月16日12时43分,控制点数目的选取需注意的问题,一般来讲,线性关系采用四个或更多的TIC点提高纠正精度;非线性转换中,转换多项式的次数与控制点数目可以用公式:k=(n+1)(n+2)/2 其中n为多项式的次数,k为最少控制点数目多项式转换关系并非次数越高越好,实践中一般先取一次多项式,用足够多的控制点拟和、观察、分析,有必要再“升级”;常用的分析方法,是计算每一个控制点相对于回归线的偏离,用均方根表示:均方根=如果某点的均方根特别大,说明该点有问题,去
21、掉不用;若较多的点有问题,可以考虑升级。,46,2023年1月16日12时43分,2 投影变换,(1)目的:当系统所使用的数据来自不同地图投影时,需要将一种投影的几何数据(x,y)转成所需投影的数据(X,Y)。实质是建立两个平面点之间的一一对应关系。公式:X=f1(x,y),Y=f2(x,y),47,2023年1月16日12时43分,解析法,已知坐标变换公式(如各种投影类型),直接利用变换公式进行计算。分为正解变换与反解变换:地理经纬度与X、Y坐标变换。GIS中图形的缩放、平移、旋转及三唯变换等操作中都使用这种变换。,正解变换:x=fx(L,B)y=fy(L,B)反解变换:L=FL(x,y)B
22、=FB(x,y),(2)解算这种法则有几种方法,数值变换法:如果不易求出两投影之间坐标的直接关系,可以采用多项式逼近的方法,一般选择10个以上的同名点。,48,2023年1月16日12时43分,四、图幅拼接,1为什么需要图幅拼接?数字化过程经常把一幅图分成几部分数字化标准的地形图是分幅的,2图幅拼接步骤逻辑一致性的操作(属性的一致)识别与检索相邻图幅相邻图幅边界点坐标数据的匹配(两条线段的衔接)。相同属性多边形公共边界的删除,49,2023年1月16日12时43分,图幅拼接,(a)拼接前;(b)拼接中的边缘不匹配;(c)调整后的拼接结果,图形拼接,50,2023年1月16日12时43分,Arc
23、GIS 数据拼接,1、矢量数据的拼接(1)展开Data Management Tools工具箱,打开General工具集,双击Append,打开Append对话框,Append的图解表达,51,2023年1月16日12时43分,52,2023年1月16日12时43分,栅格数据的拼接,53,2023年1月16日12时43分,涉及复杂的数值运算;转换后的误差存在 1 矢量到栅格的转换 栅格化,五、矢量数据与栅格数据的相互转换,点的栅格化,1,2,3,线的栅格化,面的栅格化,54,2023年1月16日12时43分,坐标系统,55,2023年1月16日12时43分,一、点的栅格化设:矢量坐标点(x,y
24、)转换后的单元行列值为I,J 栅格单元大小:dx,dy 图形最小坐标值:xmin,ymin则有:,56,2023年1月16日12时43分,二、线的栅格化设:线段两端点坐标分别为:(x1,y1)和(x2,y2),转换后的单元行列值分别为:(I1,J1),(I2,J2)行数差:I=|I2 I1|,列数差:J=|J2 J1|分两种情况:列数差大于行数差J I行数差大于列数差I J,57,2023年1月16日12时43分,三、面的栅格化又称为边界填充,就是在矢量表示的多边形界内部的所有栅格上赋予相应的多边形编号。,基于弧段数据的栅格化,基于多边形数据的栅格化,方法:,58,2023年1月16日12时4
25、3分,基于弧段数据的栅格化(带扫描算法)对每条弧段求与各扫描线交点记录每个交点的左右区码逐段生成栅格,弧段1,弧段2,弧段3,(xi,yi),(xi+1,yi+1),(x2,y2),(x3,y3),(x1,y1),59,2023年1月16日12时43分,Arcinfo中的转换命令,60,2023年1月16日12时43分,ArcGIS矢量-栅格转换工具,往往,在Field窗口选择数据转换时所依据的属性值。,61,2023年1月16日12时43分,1 目的将栅格数据分析结果,通过矢量绘图装置输出为了压缩数据,将大量面状栅格数据转换为少量数据表示的多边形的边界将扫描仪获取的栅格数据加入矢量形式的数据
26、库,2栅格格式到矢量格式的转换,62,2023年1月16日12时43分,栅格矢量转换,分类栅格数据,扫描栅格数据,边界搜索、边界提取、,二值化,编辑,细化,二值化,自动跟踪矢量化,矢量栅格转换技术流程,63,2023年1月16日12时43分,边界提取(对分类栅格数据)采用2*2栅格窗口顺序扫描栅格数据,并对各栅格进行边界标记:属性值相同,无边界;有两种属性值,边界点;有三个及以上不同的值,视为结点。,64,2023年1月16日12时43分,边界搜索,65,2023年1月16日12时43分,二值化 阈值的确定,当属性值 t 时,取1;当属性值 t 时,取0,66,2023年1月16日12时43分
27、,细化(对扫描图象)将占有多个栅格宽的图形要素缩减为只有单栅格宽的图形要素。剥皮法剥掉外层栅格,只保留彼此连通的由单个栅格组成的图形。用3*3窗口进行检测,67,2023年1月16日12时43分,剥皮法抽取骨架线,68,2023年1月16日12时43分,矢量化 标记结点;跟踪栅格各线段,找出其经过的栅格,以链码表示;将栅格坐标(I,J)变为直角坐标(X,Y);删除位于同一线段上的多余点(曲线简化);,1:(1,5),5,4,5,6,E;2:(4,2),5,E;3:(4,2),7,7,E;4:(6,4),6,6,E;5:(3,8),5,5,4,5,E;,69,2023年1月16日12时43分,7
28、0,2023年1月16日12时43分,71,2023年1月16日12时43分,ArcGIS 栅格-矢量转换工具,往往,72,2023年1月16日12时43分,GIS中主要数据处理内容小结,1、拓扑编辑2、属性与图形的交互编辑 这种编辑基于空间对象的唯一标识符,保持空间位置数据和属性数据二者编辑修改的同步性和一致性。3、图幅接边4、制图概括(制图综合)5、地理坐标变换与地图投影变换6、空间数据内插7、矢量与栅格数据转换,73,2023年1月16日12时43分,思考题,屏幕矢量化的主要步骤包括哪些?简要说明通过扫描仪自动矢量化得到矢量地图数据的原理与过程空间数据源都有哪些?各种来源的数据源是如何准确匹配在一起的?在坐标转换中,选择控制点数量及分布的判断标准;在数字化过程中提高数据采集精度的方法有哪些?如果有两个小组自数字化得到两张相邻图幅的地图数据不能准确拼接,可能会有哪些原因?如何解决?空间数据采集与处理过程的会产生哪些类型的误差?如何解决,