《《空间数据 》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《空间数据 》PPT课件.ppt(41页珍藏版)》请在三一办公上搜索。
1、,第二章 空间数据,21 基本概念,22 数据的基本特性,23 数据的尺度,24 空间数据的基本特性,25 空间抽样,26 空间数据的表示,主要内容:,第二章 空间数据,21 基本概念,一、地理空间和分析空间,地理空间:人类赖于生存的地球表层具有一定厚度的连续空间域,是一个空心的椭球体。,分析空间:数据处理的空间(2D,2.5D,3D),可以用二维实数空间R2或三维实数空间R3来定量描述。,空间分析的目的是提取空间信息,而空间分析的对象是空间数据。空间数据是描述地球表层(有一定厚度)一定范围内的地理事物及其关系的数据。,地理空间,分析空间,二、空间物体与空间实体,空间物体(Spatial Ob
2、ject):具有特定的位置和形态特征并具有地理意义的地理空间的物体,是数字表示的物体。,空间实体(Spatial Entity):地理空间中客观存在的物体。,一般地说,空间物体是根据分析应用的需要对空间实体进行的抽象表示,第二章 空间数据,21 基本概念,三、空间物体的维数与延展度空间物体的维数:随应用环境而定,取决于分析空间的维数空间物体的延展度:反映了空间物体的空间延展特性。,空间物体的维数和延展度构成了对空间物体的几何特征的概括与描述,是对空间物体以数字表示的坐标串的补充,可以用来进行空间分析运算、语法正确性的检验、数据正确性的检验。,第二章 空间数据,21 基本概念,四、空间变量和空间
3、物体的属性,空间变量:随着空间物体的延展而变化的地理现象(变量)。是对作为其定义域的空间物体的局部描述。如:河流的深度,水流的速度,水面宽度等。,空间物体的属性:空间物体的几何特征,不随空间物体延展性而变化的量。对空间物体全局的描述。如:河流的名称、长度。区域面积等。,第二章 空间数据,21 基本概念,22 数据的基本特性,2、信息,信息是现实世界在人们头脑中的反映。它以文字、数据、符号、声音、图象等形式记录下来,进行传递和处理,为人们的生产,建设,管理等提供依据。,第二章 空间数据,1、数据,指输入到计算机并能被计算机进行处理的数字、文字、符号、声音、图象等符号。数据是对客观现象的表示,数据
4、本身并没有意义。数据的格式往往和具体的计算机系统有关,随载荷它的物理设备的形式而改变。数据不是事物本身有,因为:1)数据只能从有限的方面去描述事物。2)数据存在各种误差。,数据是信息的表达、载体,信息是数据的内涵,是形与质的关系。,4、数据的基本特性,1)选择性:侧面的取舍、存在方式的选择。2)可靠性(正确性):任何描述是相对精确的,3)时间性:体现了data的现势性4)完备性:空间、时间、主题的完备性。5)详细性:指数据的分辨率,也就是可描述最细微差异的程度及最微小物体的大小。详细性的对偶是综合性。,22 数据的基本特性,第二章 空间数据,f7,第二章 空间数据,23 数据的尺度,一、尺度:
5、比较事物的标准,1、名义尺度(Nominal):描述事物名义上的差异,往往是质的差异。如人可以按民族分为汉、回、臧、蒙古等。注:名义尺度不能排序,也不分等级,只区分事物的异同。2、有序尺度(Ordinal):表示事物的等级和次序概念,这种等级或次序比名义尺 度稍具“量”的色彩。如社会经济条件可分为好、中、差。注:可以反映事物的异同,但可以对数据进行排序,次序具有反对称性和传递性。3、间隔尺度(Interval):可以定量的描述事物间差异的大小。注:可以表示事物的异同,也可以排序、分等级。4、比率尺度(Ratio):可以明确描述事物间的比率关系。注:具有Interval描述事物的差异的一切能力,
6、是Interval的一种特殊情况。,AA,AB,BC,则AC,各种数据测量尺度以及其制图表现,第二章 空间数据,23 数据的尺度,二、四个尺度的关系,1)量的概念不断增强N O I R2)可以互相转化,但顺序相反。R I O N3)Nominal和Ordinal是定性描述,不能施以直接的数值运算,但可以施以间接的数值分析。Interval和Ratio是定量描述,可同等对待。4)尺度差别不是事物本质的差异,而是人们对事物考察角度的差异。,增强,转换方向,第二章 空间数据,23 数据的尺度,24 空间数据的基本特性,一、抽样性,二、概括性是地图数据处理的一种手段,是对地理物体的化简和综合。,三、多
7、态性1)同样地物在不同情况下的形态差异。河流的单、双线表示。2)不同地物占据同样的空间位置。如社会经济人文数据与自然环境数据在空间位置上的重叠,长江与省界、县界相重叠。,空间物体以连续的模拟方式存在于地理空间,为了能以数字的方式对其进行描述,必须将其离散化,即以有限的抽样数据表述无限的连续物体。,空间数据的自身特性构成了空间分析的条件和任务,用采样点 描述原始曲线,综合前,综合后,第二章 空间数据,四、空间性,指空间物体的位置、形态及由此产生的系列特性。,五、时态性空间事物随时间而变化的特性。,24 空间数据的基本特性,第二章 空间数据,25 空间数据预处理,我们得到的数据往往有缺失,需要进行
8、补充,使其完备。空间数据的完备化,包括空间插值和缺值处理技术。插值和缺值技术的区别在于前者主要依据抽样点之间的几何关系和关联信息进行补值,后者根据先验知识或最大似然原理进行补值,1、空间数据的缺值处理,插值方法补充缺值:(1)在同一时刻不同地点的数据中出现数据丢失,则可利用空间上的相关性,采用一定的插值方法补充完整;(2)在不同时刻同一地点数据中出现数据丢失,可以使用时间序列分析的方法来补充数据完整。,1、空间数据的缺值处理,缺值问题处理:(1)对模型的参数进行估计(2)对丢失的数据进行估计具体方法:排除那些数据不完整的单元;重新估计缺值单元权重;替代缺值单元,1、空间数据的缺值处理,缺值问题
9、处理分类:1.基于完整记录单元的方法 当某些单元没有记录时,权宜之计就是暂时将之抛开,而仅用完整单元的数据进行以后的计算;(记录删除法)2.基于替代的方法 以某种数据替代丢失单元的数据,而随后使用对待完整数据的标准方法对此进行分析。(均值取代)3.权重方法 对于每种数据的产生,各个数据都有其特定的权重,如果某个数据缺失,我们可以重新计算权重。(成对数据删除法)4.基于模型的方法 对缺失数据单元应用一定的模型(回归,EM算法等),通过计算模型参数,进而估计缺失值。,1、空间数据的缺值处理,缺值问题处理分类:4.基于模型的方法 对缺失数据单元应用一定的模型(回归,EM算法等),通过计算模型参数,进
10、而估计缺失值。(1)回归方法:从完全数据集中回归拟合出目标变量计算式(用其他变量回归关系),并由此式计算目标量缺失值。(2)期望最大化法:假定多变量符合一定的数学连续分布函数,通过均值取代及求出现概率最大化不断反复过程,达到收敛时为止,插值最优。,2、空间数据插值,空间插值是在未采样点估计一个变量值的过程。Tobler地理定律约定在空间上接近的测点比那些远远分开的测点更相似。,2、空间数据插值,常用插值方法:1.最近邻法 核心思想:插值点的变量值与距离它最近的测点的变量值相同,在具体的插值过程中,就是将距待估点最近的测点的变量值赋给待估点,作为待估点的变量值。特点:插值点的变量值与距离它最近的
11、测点的变量值相同;与空间位置有关,而不需要知道样本点发生的统计规律。适用情况:较普遍使用,特别在较小区域,变量空间变异性不明显;不需要先验条件,简单,效率高。但受样本点位置影响,会产生不光滑表面,2、空间数据插值,2.算术平均值 假设变量值在给定的区域内是个常数,因而可以据此区域内所有测值的平均值来估计插值点的变量值。特点:主观性的区域选择影响到插值结果,可采用专家系统方法纠正适用情况:算法比较简单,容易实现。但只考虑算术平均,没有顾及更细微的空间因素,在实际应用中效果不一定理想。,2、空间数据插值,3.距离反比法 属于距离权重系数方法系列,一个原则就是给予距离近的点的权重大于距离远的点的权重
12、。特点:受权重函数选择的影响适用情况:简便易行,可为变量值变化大的数据集提供合理的结果;此外,很少出现没法解释的结果,但受非均匀分布数据点的影响较大,有冗余,预测功能差。,2、空间数据插值,4.多项式插值 经典插值方法,使用代数多项式或三角多项式作为全局方程式来拟合研究区域;要求已知点数至少大于未知系数个数。适用情况:已知点的变量值和坐标数据,再给定多项式的表达式,可估计出所有插值点的变量值,光滑较好。但纯数学函数有时不能客观反应地学规律。,2、空间数据插值,5.高次曲面插值 插值过程中估计表面由几个圆锥组成,圆锥顶点在数据点上。每个样本点对插值点的影响都用样本点坐标函数构成的圆锥表示,插值点
13、的变量值是所有圆锥贡献值的总和适用情况:可为离散点构建一个连续的表面提供了较好的方法。但计算权重系数时要已知点的距离矩阵及其逆矩阵,矩阵求解比较费时,2、空间数据插值,6.最优插值 假设观测变量域是二维随机过程的实现,未知变量值的测点的变量值是它周围n个测点变量值的线性组合。适用情况:此法在计算前要求指定空间相关函数的模型及其参数,这可由用户给出,或给出必要的数据,由程序计算。,2、空间数据插值,7.克里格插值 是一种求最优、线性、无偏内插估计量。它首先应用于地质统计学领域,考虑测点的相互关系和空间分布位置的几何特征,对每测点赋予一定的权重系数,再用加权平均法来估计未知的变量值,所以克里格插值
14、是一种特定的滑动加权平均。适用情况:在不同领域都有广泛的应用,但要求区域化变量满足一定的假设,且变异函数的选择对插值的结果有重要的影响,2、空间数据插值,8.样条插值 常用的一种非统计的多项式插值方法,采用满足最优平滑原则的样条插值去克服测点之间存在不可控制的振荡;其目标是寻找一表面s(t),使之满足最优平滑原则,用此进行插值适用情况:数学函数插值,数据量较大时,计算复杂;应用在实际的地穴问题中可能产生不易从地穴机理解释的结果。,2、空间数据插值,插值类型:1.点/面插值 点插值是指没有变量值的点由有变量值的点来插值得到。面插值指目标区域的值由指定区域点的变量值来插值取得2.整体/局部插值 整
15、体插值使用全部数据,整个区域的数据都会影响单个插值点 局部插值在插值时只考虑周围的相邻点,单个数据点的改变仅仅影响其周围有限的数据点,2、空间数据插值,3.精确/拟合插值 精确插值产生通过所有观测点(变量值已知)的曲面,而近似插值不必如此。4.随机(统计)/确定插值 随机插值假设一个潜在的随机过程来解释由样本点数据所造成的取值的分布;而距离反比使用距离确定插值,不考虑估计及样本点的概率规律5.渐变(平滑)/突变插值 渐变插值产生一个有较小变化的光滑的连续曲面,然而在插值计算时可以通过减少临近观测点的点数把渐变插值转为突变插值,插值结果反映了观测点附近变量值的变化情况,2、空间数据插值,空间插值
16、评价标准:(1)精确性(2)可视化(3)对参数的敏感(4)耗时(5)存储要求(6)易实施性,3、空间坐标计算,空间物体的位置显然可以通过多种坐标系来描述,由于途径不一样,可能使用的坐标系也不相同,这就需要进行坐标间的转换。一、数字化坐标(X,Y)与投影坐标(X,Y)的换算 在GIS中,空间信息都是以数字形式存在于计算机内的,在将空间信息输入计算机时,首先得到的是空间物体的关于数字化平台的数字化坐标系坐标,因而在GIS建立、数据处理、应用及空间分析过程中就经常会涉及到数字化坐标与投影坐标间的相互换算问题。1、已知数字化坐标(X,Y)求投影坐标(X,Y),X0,Y0,X,Y,(X0,Y0)为该图幅
17、左下角点的数字化坐标,(X0,Y0)为该点相应的投影坐标(X,Y)为图幅中任意一点的数字化坐标,(X,Y)为该点相应的投影坐标因图幅底边与数字化坐标系间会存在一交角,则对任意点的投影坐标有下式成立:X=X0+dX Y=Y0+dY据坐标系旋转变换理论,并考虑到投影坐标轴的X、Y与数字化坐标轴X与Y相反,有:dX(X-X0)sin+(Y-Y0)cos100/MdY(X-X0)cos-(Y-Y0)sin100/M因而有数字化坐标与投影坐标的换算公式为:,将以厘米为单位的数字化坐标值换算成以米为单位的实际投影坐标值,XX0+(X-X0)sin+(Y-Y0)cos100/MYY0+(X-X0)cos-(
18、Y-Y0)sin100/M,3、空间坐标计算,2、已知投影坐标(X,Y)求数字化坐标(X,Y),当任意点的投影坐标(X,Y)已知时,有 dX=(X-X0)M/100 dY=(X-X0)M/100则数字化坐标的计算公式为:X X0+dXsin+dYcos Y Y0+dXYcos-dYsin,3、空间坐标计算,二、地理坐标(,)与投影坐标(X,Y)的换算(,)是全球共用的空间物体位置描述的统一的地理坐标系,任何物体在(,)地理坐标系中位置是唯一确定的,因为这是一个绝对坐标系统。(X,Y)是投影平面直角坐标系,由于地图投影函数及投影区域不同,使得对投影坐标系选择会产生一定的差异,因此它是一个相对坐标
19、系。1、解析方法包含两种情况,即正解和反解。所谓反解是指若设投影计算公式为:X=f1(,)=F1(X,Y)Y=f2(,)=F2(X,Y)即(X,Y)(,)反解方法一般用于投影方程已知且反解容易的情况,例如对于前面所介绍的各类正轴圆锥投影的地理坐标就可以用反解方法进行解算。,3、空间坐标计算,2、数值方法对于以数字形式存在于计算机内的地图,其上任意一点的直角坐标(投影坐标)都应是可求的。如果经纬线网格为相互垂直的两组平行线,我们就可以采用构造空间曲面的方法解求F1(X,Y),F2(X,Y)空间曲面的构造可以采用曲面插值方法或者曲面逼近方法,插值方法要求构造曲面在已知点处取已知点的值,即:i F1
20、(Xi,Yi)i F2(Xi,Yi)i=1,2,曲面逼近方法采用其他一些约束条件,如离差平方和最小(i F1(Xi,Yi)2min(i F2(Xi,Yi)2 min,3、空间坐标计算,三、基于曲面插值的坐标变换 由于资料类型、来源以及获取时间的差异使得不同资料间的坐标系各不相同,因此通过坐标变换以求得坐标系的统一是空间分析的前期准备工作之一,也是其重要的内容之一。利用曲面插值方法,就可以通过计算机来解决任意两幅图之间的拼贴和坐标的转换与统一。1、两个三角形之间的线性变换ABC和ABC为两个任意三角形,其形状和大小可以毫不相关。设两个三角形顶点坐标分别为:A(X1,Y1)A(X1,Y1)B(X2
21、,Y2)B(X2,Y2)C(X3,Y3)C(X3,Y3)则我们可以建立ABC和ABC之间的线性变换F,保证ABC中任意一点P(X,Y)都唯一地对应于ABC中的一点P(X,Y),该线性变换表示如下:F:X=f1(X,Y)=a0+a1X+a2Y Y=f2(X,Y)=b0+b1X+b2Y,3、空间坐标计算,这就意味着三角形边上的点经F变换后其象与相应顶点之间的位置比例关系不变。这说明了ABC变换到ABC,同时ACD变换到ACD尽管是两个不同的变换,但其公共边上保持了变换的连续性,这正好是空间数据坐标变换中所必须的。由于ABC与ABC之间任意变形,可以保证任意变形的地图资料都可以通过三角形剖分来进行坐
22、标归算。,点P(X,Y)位于三角形的边AC上,并有:PA(1)C(0 1)则P(X,Y)为:Xa0+a1X+a2Y=a0+a1(X1(1)X3)+a2(Y1(1)Y3)=X1(1)X3 类似地亦有:Y=Y1(1)Y3 即 PA(1)C,3、空间坐标计算,2、点在三角形内的判别为了利用三角形剖分来进行坐标变换,对给定点P(X,Y)必须首先判断其是否位于某个三角形内或其边界上。ABC的三条边l1,l2,l3为三个直线段,其直线方程分别为:l1:F1(X,Y)0 l2:F2(X,Y)=0 l3:F3(X,Y)=0,平面上的直线F1,F2,F3的共同特性是它们均将平面划分为两个半平面,在一侧恒有Fi(
23、X,Y)0,另一侧恒有Fi(X,Y)0(i=1,2,3)上式的含义是,如果P ABC,则有:,3、空间坐标计算,P和A处于l1的同一侧,P和B处于l2的同一侧,P和C处于l3的同一侧,P1不满足“和A处于l1的同一侧”这一条件P2不满足“和B处于l2的同一侧”这一条件P3不满足“和C处于l3的同一侧”这一条件故P1,P2,P3均不在ABC内,3、空间坐标计算,3、坐标变换的实施对两幅地图M1和M2,我们分别在其中找出若干同名点作为变换的控制点(已知点),在M1和M2中,以相同的联结关系构造三角网,保证如果在M1中有PiPjPk,则在M2中必有PiPjPk。若将M1归算到M2的坐标系中去,则对M
24、1中所有目标进行点在三角形中的判别以及相应的坐标变换。,3、空间坐标计算,4、任意变换设有已知点对Ai(Xi,Yi),Ai(Xi,Yi)(i1,2,n).Ai与Ai对应。以n对点作为已知点,我们可以拟合两个插值曲面f1和f2,使得:f1(Xi,Yi)Xif2(Xi,Yi)Yi(i1,2,n)根据插值理论,f1,f2的表达式有且只能有n个未知系数,这样我们可以通过待定系数法解算。取f1,f2为双K次多项式形式,则有:,3、空间坐标计算,四、基于曲面逼近的坐标变换在两幅扫描图像之间的匹配,为了获得匹配的总体上的准确性,可以牺牲已知点上的精度,此时采用曲面逼近的方法要更为合适。曲面逼近考虑的是总体效果,个别异常点产生的影响较曲面插值小得多。设已知点对A1,A1,A2,A2,An,An,其变换函数为:X=f1(X,Y)Y=f2(X,Y)根据最小二乘原理,我们有:Qx=(Xi-f1(Xi,Yi)2=minQY=(Yi-f2(Xi,Yi)2=min在上式中取这便成为两个双K次的趋势面分析问题。,3、空间坐标计算,