数据的输入与输出技术.ppt

上传人:小飞机 文档编号:5270459 上传时间:2023-06-21 格式:PPT 页数:77 大小:2.04MB
返回 下载 相关 举报
数据的输入与输出技术.ppt_第1页
第1页 / 共77页
数据的输入与输出技术.ppt_第2页
第2页 / 共77页
数据的输入与输出技术.ppt_第3页
第3页 / 共77页
数据的输入与输出技术.ppt_第4页
第4页 / 共77页
数据的输入与输出技术.ppt_第5页
第5页 / 共77页
点击查看更多>>
资源描述

《数据的输入与输出技术.ppt》由会员分享,可在线阅读,更多相关《数据的输入与输出技术.ppt(77页珍藏版)》请在三一办公上搜索。

1、1,3 数据输入与输出技术,内容提要:1、数 据 2、数据源 3、数据输入 4、数据输出与表达 5、空间数据质量 6、空间数据的元数据,2,3.1 数 据,土地数据的特征,在LIS中,土地数据可分为三种类型:空间特征数据(定位数据)、时间属性数据(尺度数据)和专题属性数据(非定位数据)。对于大部分土地信息系统的应用来说,时间和专题属性数据结合在一起共同作为属性特征数据,而空间数据和属性特征数据统称为空间数据(或土地数据)。,数据与数据处理,数据的形式:可以是数字、文字、图形或声音等数据处理:对数据的采集、存储、检索、加工、变换和传输,以便获得数据中的信息,3,图3-1 土地数据的基本特性,专题

2、特征:是土地实体所具有的各种性质,如地面的坡度、坡向、某地的年降雨量等。通常以数字、符号、文本和图像等形式来表示。,空间特征:表示地块的空间位置、形状和大小及其与相邻地块的拓扑关系。位置和拓扑特征是空间信息系统所独有的。,时间特征:指土地实体的时间变化或数据采集的时间等。即空间数据总是在某一特定时间或时段内得到或计算的。,土地数据一般具有三个基本特征:,4,命名或类型次序间隔比率,测量是根据一定的标准对特定现象赋值或打分;测量的尺度大致可以分成四个层次,由粗略至详细依次为:,空间数据的测量尺度,5,也称类型量,是对数据定性而非定量的描述。例如,可以用不同数值表示不同的土地利用类型、植被类型或岩

3、石类型,但是这些数值之间无数量关系,对命名数据的逻辑运算只有“等于”或“不等于”两种形式,不能进行任何算术运算。,命名(Nominal)量,次序(Ordinal)量,通过排序来区分和标识地理现象的量称为次序量。它是按照等级序列,由低到高(或由高到低)进一步细分的,不同次序之间的间隔大小可以不同。可进行“等于”、“不等于”“大于”或“小于”等逻辑运算,但不能进行任何算术运算。,6,间隔(Interval)量,间隔量是不参照某个固定点,而是按间隔表示相对位置的数,无真实零值,是一种较精确区分和标识地理现象的测量方法。它利用某种标准单位作为间隔量来表示不同的量,但应用时要正确理解标准单位的特性和含义

4、。譬如,不能说40比20暖一倍。,比率(Ratio)量,比率量是间隔量的精确化,是指那些有真零值而且测量单位的间隔是相等的数据。如年降雨量、海拔高度、人口密度、发病率等。比例数据和间隔数据可用于加、减、乘、除等运算,而且可以求算术平均。,7,比较:(1)高层次的测量尺度含有更多的信息,而且可以向低层次的测量尺度转换。(2)高层次尺度都具有低层次尺度的一切特征,反之则不然;高层次尺度可能获得更多、更精确的信息,但调查和分析的工作量更大,而低层次尺度则相反。因此,选择尺度要结合系统的要求与研究条件。(3)命名数据或次序数据便于使用,易于理解,但有时不够精确,不能用于较高级的算术运算;而比率数据或间

5、隔数据比较精确,便于计算机处理。因此,在较复杂的LIS中,往往上述几种测量尺度的数据均需用到。,8,图3-2 空间数据的各种测量尺度及其制图表现,概述,数据源的选择;采集方法的确定;数据的进一步编辑与处理 数据入库,3.2 数据源,10,数据源,3.2 数据源,11,数据源的特征1、地图数据 具有共同参考坐标系统的点、线、面的二维平面形式的表示,主要普通地图和专题地图在应用地图数据时应注意以下几点:(1)地图存储介质的缺陷。由于地图多为纸质,在不同的存放条件下存在不同程度的变形,具体应用时,须对其进行纠正。(2)地图现势性较差。传统地图更新周期较长,造成现存地图的现势性不能完全满足实际需要。(

6、3)地图投影的转换。使用不同投影的地图数据进行交流前,须先进行地图投影的转换。,12,数据源的特征,2、遥感数据,每种遥感影像都有其自身的成像规律、变形规律,所以在应用时要注意影像的纠正、影像的分辨率、影像的解译特征等方面的问题。,13,数据源的特征,3、实测数据 实测数据主要指各种野外实验、实地测量所得数据,它们通过转换可直接进入GIS的空间数据库以用于实时分析和进一步应用。其中,GPS点位数据、地籍测量数据等通常具有较高的精度和较好的现势性,是GIS的重要数据来源。4、统计数据 许多部门和机构都拥有不同领域如人口、自然资源等方面的大量统计资料、国民经济的各种统计数据,这些常常也是GIS的数

7、据源,尤其是属性数据的重要来源。统计数据一般都是和一定范围内的统计单元或观测点联系在一起。5、多媒体数据 由多媒体设备获取的数据(包括声音、录像等)也是GIS的数据源之一,目前其主要功能是辅助GIS的分析和查询,可通过通讯口传入GIS的空间数据库中。6、文本资料数据 各种文字报告和立法文件在一些管理类的GIS系统中,有很大的应用,如在城市规划管理信息系统中,各种城市管理法规及规划报告在规划管理工作中起着很大的作用。在土地资源管理、灾害监测、水质和森林资源管理等专题信息系统中,各种文字说明资料对确定专题内容的属性特征起着重要的作用。,14,土地数据一般包括空间数据与属性数据,其获取途径主要有五种

8、:野外实地测量;摄影测量与遥感;现场专题考察与调查;社会调查与统计;利用已有资料。,3.2 数据源,15,野外测量,野外测量是传统的测量方法,这种方法获得的资料具体、准确,但花费人工多,工作周期长。一般是测得资料后制成地图,再输入土地信息系统的数据库中。,16,全球定位系统(GPS),GPS技术是依靠导航卫星来决定地球上某一位置坐标的技术。GPS 所采集的数据X,Y,Z坐标点,这些点的信息可以以文本的形式存储,然后根据数据库和LIS软件的要求,使用一些很简单的程序便能够将其转换成有拓扑关系的图形。,17,摄影测量,航空摄影测量指的是在航空器上用航摄仪器对地面连续摄取像片,结合地面控制点测量、调

9、绘和立体测绘等步骤,绘制出地形图的作业。数字摄影测量是以立体数字影像为基础,由计算机进行影像处理和影像匹配,自动识别相应像点及坐标,运用解析摄影测量的方法确定所摄物体的三维坐标,并输出数字高程模型、正射数字影像和线划地图。,18,遥 感,利用遥感仪器不直接接触被研究的目标,感测目标特征(一般是指反射或发射电磁波)的信息。将遥测得到的光学图象或数字图像经过几何纠正、信息增强、信息提取及信息复合和分类等影像处理便能得到所需要的信息。用遥感技术获取信息有范围大、速度快、信息广的特点,长期在地球轨道上运行的遥感卫星可时时刻刻地向地面传送探测到的信息。,19,地图与经济数据,任何一个信息系统,都应尽量利

10、用已有的资料,以减少工人成本,缩短工作周期。比如,现有各种专题地图、政府统计部门的各种调查、统计报表等,都是最常用的信息来源。一些发达国家已公开提供计算机的数据资料,以及将社会调查和地图结合在一起的地理数据等等,这简化了各种 LIS 的数据收集工作,也为不同信息系统之间的数据共享带来方便。,20,土地数据输入是从不同数据源、用不同的设备、方法和技术来获取数据并录入数据库的过程,即通常所说的建库工作。土地数据输入主要考虑以下三方面的问题:统一的地理基础空间数据输入问题属性数据输入问题,3.3 数据输入,21,地理基础地理基础是土地数据表示格式与规范的重要组成部分,包括统一的地图投影系统、统一的地

11、理坐标系统以及统一的编码系统;投影坐标系统配置的一般特征:各个国家的LIS采取的投影系统应与该国基本地图系列所用的投影系统一致;各地区的LIS种的投影系统与其所在区域适用的投影系统一致;一般LIS中投影系统的配置与设计:应与相应比例尺的国家基本图投影系统一致。一般至多采用两种投影系统,一种用于大比例尺的数据处理,另一种服务于中小比例尺数据处理(如我国大于等于1:50万时采用高斯-克吕格投影,1:100万采用正轴等角割圆锥投影)。,22,空间数据的输入空间数据的输入方式可以采用数字化仪、扫描仪以及摄影测量仪、测量全站型速测仪、GPS接收机等能以数字形式自动记录测量数据的测量仪器。选哪种方法需根据

12、应用图形数据的方式与类型、现有设备状况、人力资源状况和经济状况等因素综合考虑,可选一种或几种方法结合起来输入。空间数据输入的重要途径是地图数字化。,23,地图数字化:将纸质地图经过计算机图形图像系统光电转换量化为点阵数字图像,经图像处理和曲线矢量化,或者直接进行手扶跟踪数字化后,生成可以为土地信息系统显示、修改、标注、漫游、计算、管理和打印的矢量地图数据文件的过程。地图数字化有两种方式:手扶跟踪数字化和扫描数字化。,24,手扶跟踪数字化,涵义:把地图放置于数字化桌上,用手持设备(定位装置游标)跟踪地图上的各种地理特征,数字化设备精确量测游标的位置,产生数据形式的坐标数据。,25,(1)手扶跟踪

13、数字化仪的连接和参数设置 通过RS-232(串口)接口与计算机进行连接的,进行通讯参数(包括波特率、数据位、校验位、停止位等)以及坐标原点、分辨率、采点方式、数据格式等参数的设置。为了保证数据录入的正确,必须设置数字化软件的参数与数字化仪相一致。(2)地图的预处理 首先要确定需要数字化哪些信息,输入哪些图层,以及每个图层包含的具体内容。,手扶跟踪数字化的步骤:,R2V软件,26,27,(3)确定定位点 定位点用于确定数字化文件相对于数字化板的位置。由于数字化过程不可能一次完成,在两次输人之间地图的位置可能相对于数字化板发生错动,这样前后两次录入的坐标就会偏移。解决该问题的办法就是在每次录人之前

14、,先输人至少3个定位点(TickMarks),这些点相对于地图的位置是固定的,这样两次输入的内容就可以根据定位点坐标之间的关系进行匹配。,28,(4)确定控制点 控制点的作用是进行地图配准,用来将数字化后的数据校准(配准)到一个指定的地图坐标系,以便这些数据与其它的数据集成。控制点的选择对于空间实体地理位置的确定具有至关重要的意义。,29,关于控制点的选取控制点可以是经纬线网格的交点、公里网格的交点或者一些典型地物的坐标;控制点的数目取决于你打算使用哪一种数学方法来实现坐标转换;但是,过多的控制点并不一定能够保证高精度的配准。要尽可能使控制点均匀分布于整个栅格图像,而不是只在图像的某个较小区域

15、选择控制点;通常,先在图像的四个角选择4个控制点,然后在中间的位置有规律地选择一些控制点能得到较好的效果。,30,图3-3 控制点的布设,31,(5)选择数字化方式 通常,数字化仪采用两种数字化方式,即点方式(Point Mode)和流方式(Stream Mode)。点方式:由数字化作业员自行选择采样点和确定采样密度,逐点地对目标进行数字化的方法。流方式:作业员只需仔细保持使游标的十字丝沿待数字化的线段连续移动,而由计算机自动地按等时间间隔或等距间隔来控制点位的数据录入。,32,图3-4 距离流方式和时间流方式(a)距离流方式是当前接收的点与上一点距离超过一定阈值,才记录该点;(b)时间流方式

16、是按照一定时间间隔对接收的点进行采样。,33,距离流方式与时间流方式的比较:距离流方式的特点是容易遗漏曲线拐点,从而使曲线失真。因此,在数字化过程中,需要根据不同的对象选择不同的数字化方式。时间流方式的特点是当数字化曲线比较平滑时,可以加快鼠标移动的速度,使采样点的数目相对减少;而当曲线比较弯曲时,鼠标移动较慢,采样点的数目就多。流方式与点方式的比较:流方式录入能够加快数字化的速度,但其采集的点的数量往往要多于点方式,造成数据量过大。,34,(6)曲线离散化(对点方式数字化而言)在数字化过程中,需要对曲线进行采样简化,即在曲线上取有限个点,将其变为折线,并且能够在一定程度上保持原有的形状。下面

17、介绍Douglas-Peucker(道格拉斯-派克尔)算法:在曲线首尾两点A、B之间连接一条直线段AB,该直线称为曲线的弦;找到曲线上离该直线段距离最大的点C,并计算其与AB的距离d;比较该距离与预先给定阈值的大小,如果小于,则将该直线段作为曲线的近似,该段曲线处理完毕;如果距离大于阈值,则用C将曲线分为两段AC和BC,并分别对两段曲线进行-步的处理;当所有曲线都处理完毕后,依次连接各个分割点形成的折线,即可以作为曲线的近似。,35,图3-5 曲线离散化算法,36,扫描数字化,分类:栅格扫描数字化与矢量扫描数字化。栅格扫描数字化:将纸质地图扫描后得到的栅格图像转换成矢量地图的过程。栅格图像转换

18、成矢量地图有两种方式:一是将显示在屏幕上的栅格图像作进一步手工矢量化。手工矢量化又可分为完全的手工跟踪和借助软件的半自动跟踪两种;,二是由软件自动转换成矢量地图。矢量扫描数字化:是直接跟踪被扫描图上的线划并产生矢量数据的扫描方式。,37,完全手工跟踪方法把扫描获得的图像作为底图显示出来,操作员用鼠标器在屏幕上进行操作,这和手扶跟踪数字化输入很相似。,半自动的矢量化方法是由操作人员用鼠标器点一下屏幕上需要矢量化的线条,软件沿着栅格线条找到线的一个端点或在与其他线条相交处停下来,提示操作员,由操作员控制需要进一步矢量化的方向或下一点,计算机则自动地记录下有关的关键点并连成线。,自动矢量化方法是由软

19、件自动完成指定区域内的栅格数据的矢量化。自动矢量化之前,若栅格数据中有注记等其他不需要矢量化的部分,要先将其清除。,38,Coredraw软件,39,R2V软件,40,ArcMap软件,41,地图数字化方式的比较,手扶跟踪数字化采集的数据数据量小,数据处理的软件也比较完备,但由于数字化的速度比较慢,工作量大,自动化程度低,数字化的精度与作业员的操作有很大关系,所以,目前很多单位在大批量数字化时,已不再采用它。栅格扫描数字化中完全手工跟踪矢量化和半自动跟踪矢量化(要为二值图)因其输入速度快、不受人为因素的影响、操作简单而越来越受到大家的欢迎,再加之计算机运算速度、存储容量的提高和矢量化软件的踊跃

20、出现,使其已成为图形数据输入的主要方法。自动矢量化由于要求的数据很理想(底图十分清晰,且要为二值图),并且还要清除栅格数据中不需要矢量化的部分(如注记),且矢量化后的数据量大,使得其应用受到一定限制。矢量扫描数字化速度极快,且不易产生错漏,但仪器价格昂贵,使用并不普遍。,42,属性数据的输入及其与空间数据的连接属性数据如何输入?属性数据一般采用键盘输入,输入的方式有两种:一种是对照图形直接输入;另一种方式是预先建立属性表输入属性,或从其他统计数据库中导入属性,然后根据关键字与图形数据自动连接。属性数据如何与空间数据连接?直接在图形实体上附加属性数据;用特定的程序把属性与已数字化的点、线、面空间

21、实体通过具有惟一性的识别符(标识符)联系起来。,43,44,3.4 数据输出与表达,数据输出与表达:是指借助一定的设备和介质,将土地信息分析或查询检索结果表示为某种用户需要的可以理解的形式的过程;或者是将上述结果传送到其它计算机系统的过程.数据的输出形式分为三种:硬拷贝输出是永久显示,信息被打印在纸上、摄影胶片或类似的材料上;软拷贝是一种能在计算机屏幕上观察的输出方式;电子输出是由计算机兼容文件组成的输出方法,通常用于计算机系统之间的数据传递、进一步分析或带往远地产生硬拷贝输出之用.输出设备主要有屏幕显示器、打印机及绘图仪.,45,空间数据质量的概念空间数据质量:是空间数据在表达空间位置、专题

22、特征和时间信息这三个基本要素时,所能够达到的准确性、一致性、完整性以及它们三者之间统一性的程度。与数据质量相关的几个概念:误差(Error):反映了数据与真实值或者大家公认的真值之间的差异,它是一种常用的数据准确性的表达方式;,3.5 空间数据质量,46,数据的精密度(Resolution):指数据表示的精密程度,即数据表示的有效位数;数据的准确度(Accuracy):被定义为结果、计算值或估计值与真实值或者大家公认的真值的接近程度。准确度和精密度常结合在一起称为精度;不确定性(Uncertainty):是关于空间过程和特征不能被准确确定的程度,是自然界各种空间现象自身固有的属性;空间分辨率(

23、Resolution):是空间目标可辨识的最小尺寸;比例尺(Scale):是地图上两个点间图面距离和它所表现的真实世界的距离之间的一个比值。,47,空间数据质量评价,数据情况说明(Source),属性精度(Attribute accuracy),时间精度(Temporal accuracy),数据完整性(Completeness),表达形式的合理性(Rationality),逻辑一致性(Logical consistency),位置精度(Metric accuracy),空间数据质量标准,48,空间数据质量的评价,49,空间数据的误差来源及分析,空间数据的误差来源空间现象自身存在复杂性、不稳定

24、性和模糊性;空间数据源误差及获取过程中产生的误差;空间数据处理过程中产生的误差;空间数据应用中产生的误差。,50,空间数据源误差及获取过程中产生的误差,地图数据的误差,测量数据的误差,遥感数据的误差,51,地图数据的误差,52,遥感数据的误差,53,测量数据的误差,54,空间数据处理过程中的误差,投影变换数据格式转换 数据抽象 建立拓扑关系 与主控数据层的匹配数据叠加操作和更新数据集成处理数据的可视化表达数据处理过程中误差的传递和扩散,55,数据格式转换,56,数据抽象在数据发生比例尺变换时,对数据进行的聚类、归并、合并等操作;,合并:在类型转换之后将拓扑相邻且属于同一类型的多个对象合并成一个

25、对象。,57,聚合:将两个或多个类型相同、不相邻接但彼此间距离小于最小距离域值的多边形联合生成一个多边形,或者将两条类型相同、首尾相对但不相接,且两点之间的距离小于最小距离域值的线对象,聚合生成一个新对象。,58,压缩:在缩小比例尺状态下,将不满足最小尺寸条件的多边形压缩成点或线,或将线压缩成点。,59,融合:指将不同类型的拓扑邻接对象合并成新对象,其实质是将不重要的地块(比如面积较小)归并到与其拓扑邻接的某个邻域多边形中。,60,图3-8 建立拓扑关系时结点匹配示意图,建立拓扑关系,61,空间数据应用中的误差,对数据的解释过程:不同用户对它的内容的解释和理解可能不同。例如,对于土壤数据,城市

26、开发部门、农业部门、环境部门对某一级别土壤类型内涵的理解和解释会有很大的差异。,缺少文档:缺少对某一地区不同来源的空间数据的说明,如缺少投影类型、数据定义等描述信息。,62,63,常见空间数据的误差分析,归纳起来,空间数据的误差主要有四大类,即几何误差、属性误差、时间误差和逻辑误差。,64,逻辑误差,由数据的逻辑关系错误所引起的误差。数据的不完整性是通过上述四类误差反映出来的。事实上检查逻辑误差,有助于发现不完整的数据和其他三类误差。对数据进行质量控制或质量评价,一般先从数据的逻辑性检查入手。,65,图3-9 各种逻辑误差,66,几何误差,某点的点误差即为测量位置(x,y)与其真实位置(x0,

27、y0)的差异。点误差可通过计算坐标误差和距离的方法得到。坐标误差定义为:x=x-x0 y=y-y0 为了衡量整个数据采集区域或制图区域内的点误差,一般抽样测算(x,y)。抽样点应随机分布于数据采集区内,并具有代表性。这样抽样点越多,所测的误差分布就越接近于点误差的真实分布。,点误差,67,线误差,线在LIS中既可表示线性现象,又可以通过连成的多边形表示面状现象。线误差分两类:第一类是线上的点在真实世界中是可以找到的,这类线性特征的误差主要产生于测量和对数据的后处理;第二类是现实世界中找不到的,如气候区划线、等高线和土壤类型界限等,这类线性特征的线误差是在确定线的界限时产生的。,68,空间数据质

28、量控制,空间数据质量控制的方法 传统的手工方法 主要是将数字化数据与数据源进行比较,图形部分的检查包括目视方法、绘制到透明图上与原图叠加比较,属性部分的检查采用与原属性逐个对比或其它比较方法;元数据方法 元数据中包涵了大量的有关数据质量的信息,通过跟踪元数据可以了解数据质量的状况和变化;地理相关法 用空间数据的地理特征要素自身的相关性来分析数据的质量。,69,几何数据错误,(a)为区域标识点遗漏(b)为线段过长,70,71,空间数据生产过程中的质量控制数据源的选择 数字化过程的数据质量控制1)数字预处理 包括对原始地图、表格等的整理、清绘。2)数字化设备的选用 根据手扶数字化仪、扫描仪等设备的

29、分辨率和精度等有关参数的进行挑选,这些参数不应低于设计的数据精度要求。一般要求数字化仪的分辨率达到0.025mm,精度达到0.2mm;对扫描仪的分辨率则不低于300DPI。,72,3)数字化对点精度(准确性)数字化时数据采集点与原始点的重合程度,一般要求对点误差小于0.1mm。4)数字化限差 包括:采点密度(0.2mm)、接边误差(0.02mm)、接合距离(0.02mm)、悬挂距离(0.007mm)等。5)数据的精度检查 输出图与原始图之间的点位误差,一般要求对直线地物和独立地物,误差小于0.2mm,对曲线地物和水系,误差小于0.3mm,对边界模糊的要素应小于0.5mm。,73,元数据:是关于

30、数据的描述性数据信息.,元数据的内容:1)对数据集的描述,对数据集中各数据项、数据来源、数据所有者等的说明;2)对数据质量的描述,如数据精度、数据的逻辑一致性、数据完整性、分辨率等;3)对数据处理信息的说明,如量纲的转换等;4)对数据转换方法的描述;5)对数据库的更新、集成等的说明。,3.6 空间数据的元数据,74,元数据的获取:,空间数据元数据的获取是个较复杂的过程,可以概括为三个阶段、五种方法。,三个阶段:数据收集前:根据要建设的数据库的内容而设计的元数据;数据收集中:随数据的形成同步产生;数据收集后:在上述数据收集到以后,根据需要产生的,包括:数据处理过程描述、数据的利用情况、数据质量评

31、估、浏览文件的形成、拓扑关系、影像数据的指示体及指标、数据集大小、数据存放路径等。,75,五种方法:,键盘输入,关联表,测量法,计算法,推理法,76,LIS中元数据的作用:,1)帮助数据生产单位有效地管理和维护空间数据、建立数据文档,并保证即使其主要工作人员离退时,也不会失去对数据情况的了解;2)提供有关数据生产单位数据存储、数据分类、数据内容、数据质量、数据交换网络及数据销售等方面的信息,便于用户查询检索空间数据;3)帮助用户了解数据,以便就数据是否能满足其需求作出正确的判断;4)提供有关信息,以便用户处理和转换有用的数据。,77,思考题:,1、土地数据的基本特征有哪些?2、土地数据的获取的途径有哪些?3、试述采用手扶跟踪数字化仪进行数据输入的工作过程。4、空间数据的误差来源及分析。5、空间数据质量控制常见的方法有哪些?6、什么叫元数据?LIS中元数据有何作用?,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号