空间点模式方法B.ppt

上传人:牧羊曲112 文档编号:6596462 上传时间:2023-11-16 格式:PPT 页数:89 大小:2.83MB
返回 下载 相关 举报
空间点模式方法B.ppt_第1页
第1页 / 共89页
空间点模式方法B.ppt_第2页
第2页 / 共89页
空间点模式方法B.ppt_第3页
第3页 / 共89页
空间点模式方法B.ppt_第4页
第4页 / 共89页
空间点模式方法B.ppt_第5页
第5页 / 共89页
点击查看更多>>
资源描述

《空间点模式方法B.ppt》由会员分享,可在线阅读,更多相关《空间点模式方法B.ppt(89页珍藏版)》请在三一办公上搜索。

1、第四章 空间点模式方法,毕硕本,研究生课程,提纲,4.1 空间点模式的概念与空间分析技术4.2 基于密度的方法样方计数法与核函数法4.3 基于距离的方法4.4 G函数与F函数4.5 K函数与L函数4.6 K函数的扩展二元模式与空间-时间模式,4.1 空间点模式的概念与空间分析技术,空间点模式的概念,在地图上,居民点、商店、旅游景点、流行病、犯罪现场等都表现为点的特征,有些是具体的地理实体对象,有些则是曾经发生的事件的地点。离散地理对象或事件(点)的空间分布模式对于城市规划、服务设施布局、商业选址、流行病的控制等具有重要的作用。根据地理实体或事件的空间位置研究其分布模式的方法称为空间点模式,这是

2、一类重要的空间分析方法。,空间点模式的概念,点模式是研究区域R 内的一系列点S1=(X1,Y1),S2=(X2,Y2),Sn=(xn,yn)的组合,其中Si是第i个观测事件的空间位置。研究区域R 的形状可以是矩形,也可以是复杂的多边形区域。图4.1 是点在研究区域中的各种分布模式。,空间点模式的概念,在研究区域中,虽然点在空间上的分布千变万化,但是不会超出从均匀到集中的模式。因此一般将点模式区分为3 种基本类型:聚集分布随机分布均匀分布对于区域内分布的点集对象或事件,分布模式的基本问题是:这些对象或事件的分布是随机的、均匀的,还是聚集的?研究分布的模式对于探索导致这一分布模式形成的原因非常重要

3、。如果这些点对象存在类型之分,或者随时间产生变化,那么还需要深入研究的问题是一类点对象的分布模式是否依赖于另外一类点对象的分布模式,或者前期的点模式是否对后期的点模式产生影响。,空间点模式的概念,从统计学的角度,地理现象或事件出现在空间任意位置都是有可能的。如果没有某种力量或者机制来“安排”事件的出现,那么分布模式可能是随机分布的,否则将以规则或者聚集的模式出现。若点模式为规则或聚集模式,则说明地理世界中的事物可能存在某种联系。一种现象的分布模式是否对另一种现象的分布模式产生影响也是点模式需要解决的重要问题。,点模式空间分析方法,空间点模式的研究一般是基于所有观测点事件在地图上的分布,也可以是

4、样本点的模式。由于点模式关心的是空间点分布的聚集性和分散性问题,所以形成了两类点模式的分析方法:第一类是以聚集性为基础的基于密度的方法,它用点的密度或频率分布的各种特征研究点分布的空间模式;第二类是以分散性为基础的基于距离的技术,它通过测度最近邻点的距离分析占的空间分布模式。第一类分析方法主要有样方计数法和核函数方法两种;第二类方法主要有最近邻距离法,包括最近邻指数(NNI)、G-函数、F-函数、K-函数方法等。,点模式空间分析方法,对点模式的空间分析,应注意空间依赖性对分布模式真实特征的影响。空间依赖性所产生的空间效应可能是大尺度的趋势,也可能是局部效应。大尺度趋势称为一阶效应,它描述某个参

5、数均值的总体变化性;局部效应也称为二阶效应,它是由空间依赖性所产生的,表达的是近邻的值相互趋同的倾向,通过其对于均值的偏差计算获得。,点模式空间分析方法,一阶效应一般用点过程密度(S)描述,指在点S处单位面积内事件的平均数目(P.J.Diggle,1983)。用数学极限公式可定义为:ds是指在点S周围一个足够小的邻域;E表示数学期望;Y(ds)是ds内事件的数目。,点模式空间分析方法,点模式的一阶效应有两种分析方法:样方计数法核密度方法样方计数法首先将研究区域划分为面积相等的子区域,即样方,并根据每一个样方中的事件数量来计算和概括统计量,然后将计数值除样方的面积得到点分布的密度。样方计数方法给

6、出的是空间点的密度变化,缺点是将信息聚集到面积单元中,引起信息的损失。核密度估计是使用原始的点位置产生光滑的密度直方图的方法。,点模式空间分析方法,二阶效应通过研究区域中两个足够小的子区域内事件数目之间的相互关系来描述。用数学极限公式可表示为 dsi和dsj分别表示si和sj周围足够小的邻;E表示数学期望;Y(dsi)、Y(dsj)分别指dsi和dsj两个小区域内的事件个数。,点模式空间分析方法,点模式的二阶性质通过点之间的距离进行研究,如最近邻距离。最近邻距离的估计有两种技术,即随机选择的事件与其最近邻之间的距离,或随机选择的空间上的位置与最近邻的事件之间的距离。空间依赖性可通过可视的方式检

7、查近邻事件距离的概率分布。聚集事件通常在低值端表现出陡峭的部分,而规则分布则在高值区域具有陡峭的曲线形式。K-函数允许考虑的不仅是最近邻的事件,还依赖于过程是各向同性的基本假设。,点模式的可视化与探索性分析,表示空间点模式的最常用的方法是点状地图。空间点模式的探索性空间数据分析的目的在于导出概括的统计量或画出观测分布以研究特定的假设,所使用的检测方法是一阶或二阶效应。,完全随机模式与点模式建模,空间点模式分析技术的目的是解释观测的点模式,分析过程包括:基于一阶或二阶性质的计算分析建立完全随机模式(CSR)比较或显著性检验CSR是建模中的一个关键过程,用来检验过程是否是CSR的方法有很多,包括2

8、 检验、K-S检验,以及蒙特卡罗检验等方法。,4.2 基于密度的方法 样方计数法与核函数法,基于密度的方法样方计数法,1.样方分析的思想样方分析(Quadrat analysis,QA)是研究空间点模式的最常用的直观方法。基本思想是通过点分布密度的变化来探索空间分布模式:一般用随机分布模式作为理论上的标准分布;将QA计算的点密度和理论分布作比较,判断点模式属于聚集分布、均匀分布,还是随机分布。QA的计算过程:首先,将研究的区域划分为规则的正方形网格区域。其次,统计落入每一个网格中点的数量。由于点在空间上分布的疏密性,有的网格中点的数量多,有的网格中点的数量少,还有的网格中点的数量为零。再次,统

9、计出包含不同数量的点的网格数量的频率分布。最后,将观测得到的频率分布和已知的频率分布或理论上的随机分布(如泊松分布)作比较,判断点模式的类型。,基于密度的方法样方计数法,2.样方分析的方法QA中对分布模式的判别产生影响的因素有:样方的形状,采样的方式,样方的起点、方向、大小等,这些因素会影响到点的观测频次和分布。QA分析中样方的形状一般采用正方形的网格覆盖,但也可定义其它样方形状,如圆形、正六边形等。不管采用何种形状的样方,形状和大小必须一致,以避免在空间上的采样不均匀。由于QA估计的点密度随着空间而变化,保持采样间隔的一致性非常重要。除规则网格外,采用固定尺寸的随机网格也能够得到同样的效果。

10、,基于密度的方法样方计数法,基于密度的方法样方计数法,样方方法分析空间点模式时,样方的尺寸选择对计算结果会产生很大的影响。根据Greig-Smith于1962年的试验以及Tylor和Griffith、Amrhein的研究,最优的样方尺寸可根据区域的面积和分布于其中的点的数量确定:其中Q是样方的尺寸(面积);A为研究区域的面积;n是研究区域中点的数量。这就是说最优样方的边长取。,基于密度的方法样方计数法,当样方的尺寸确定后,利用这一尺寸建立样方网格覆盖研究区域,统计落入每一个样方中的点的数量,统计包含0,1,2,3,,个点的样方的数量,建立其频率分布。根据观测得到的频率分布和已知点模式的频率分布

11、的比较,判断点分布的空间模式。观测的频率分布与己知频率分布之间差异的显著性是推断空间模式的基础,通常采用Kolmogorov-Simirnov检验(简写为K-S检验)。,基于密度的方法样方计数法,如用80个样方计算美国俄亥俄州的164个城市的分布模式。城市作为点实体。,基于密度的方法样方计数法,QA计算的各种模式下不同数量城市的样方的频率分布,基于密度的方法样方计数法,3.样方分析中点模式的显著性检验常用的检验方法包括:根据频率分布比较的K-S检验,根据方差均值比的2 检验。1)K-S检验K-S检验的基本原理是通过比较观测频率分布和某一“标准”的频率分布,确定观测分布模式的显著性。首先假设两个

12、频率分布十分相似。如果两个频率分布的差异非常小,那么这种差异的出现存在偶然性;而如果差异大,偶然发生的可能性就小。,基于密度的方法样方计数法,(1)假设两个频率分布之间不存在显著性的差异。(2)给定一个显著性水平,例如100次试验中只有5次出现的机会,则=0.05。(3)计算两个频率分布的累积频率分布。(4)计算K-S 检验的D统计量,即(5)计算作为比较基础的门限值,即如果是两个样本模式比较,则(6)如果计算得出的D值大于D=0.05这一阈值,可得出两个分布的差异在统计意义上是显著的。,检验的基本过程如下:,基于密度的方法样方计数法,在排除了均匀分布模式的基础上,还需要进一步分析模式是否来自

13、于随机过程产生的点模式。随机分布的点模式通过泊松过程产生。泊松分布的数学公式是:泊松分布的含义为,当事件x取值k时的概率分布。在样方分析中含义为,当研究区域中有n个随机分布的点时,恰好有1,2,k,,n个点落入一个样方中的概率。=n/m,指平均每个样方中包含的点的数量。,基于密度的方法样方计数法,为简化泊松分布的概率计算,先给出x=0时的概率,然后给出概率计算的递推表达式:到x=k时的递推公式:,基于密度的方法样方计数法,2)方差均值比的X2检验在比较一个空间点模式是否与随机分布模式相似时,除了使用K-S检验外,还可以根据泊松方程的参数进行比较。泊松分布的一个重要特性是:均值=方差=。这就启示

14、我们可以使用均值和方差的比值作为点模式是否相似于随机分布的判断准则。定义方差均值比为,这里,如果空间点模式接近于:泊松分布,则R1。,基于密度的方法样方计数法,2)方差均值比的X2检验为了通过R推断点模式是否来自于泊松过程,首先假设m个样方中分别有(n1,n2,nm)个事件的计数,然后用均值和方差比定义一个检验统计量I(也称分散性指数):对于CSR,I服从X2m-1分布,根据样方计数可以方便地计算I,然后将I和显著性水平为的值进行比较,推断点模式是否来自于CSR。如果I显著地大于X2m-1,表示聚集分布;如果I显著地小于X2m-1,表示均匀分布。,基于密度的方法样方计数法,2)方差均值比的X2

15、检验还可以利用方差均值比定义一个聚集性指数ICS(index of cluster size)判断点模式的类型。ICS定义为:在CSR中,ICS的期望E(ICS)0;如果E(ICS)0,表示聚集分布模式;如果E(ICS)O,表示规则分布模式。,基于密度的方法样方计数法,4.样方计数方法的问题理论上可以将观测点模式和任何已知特征的点模式作比较。通常先采用视觉观察的方法,假设点的分布模式和哪一种特征分布相似,然后进行统计量的计算和检验。然而样方技术存在一定的限制,样方方法只能获得点在样方内的信息,不能获取关于样方内点之间的信息,其结果是样方分析不能充分区分点分布模式。,基于密度的方法样方计数法,上

16、图所示的两个分布模式,图中(a)、(b)分别是8 个点在4 个样方中的分布。在视觉上是两个不同的模式,(a)更加分散,(b)非常聚集。使用样方技术将产生相同的结果。原因是样方技术不能计算样方内点之间的空间关系信息;当样方格网划定后,人为地割裂了点之间的空间关系。用点分布的空间关系信息识别空间模式的方法是最近邻方法。,基于密度的方法核函数,1.核密度的概念与方法核密度估计法(kernel density estimation,KDE)认为地理事件可以发生在空间的任何位置上,但是在不同的位置上事件发生的概率不一样。点密集的区域事件发生的概率高,点稀疏的地方事件发生的概率低。KDE和样方计数法相比较

17、,KDE更加适合于用可视化方法表示分布模式。,基于密度的方法核函数,1.核密度的概念与方法空间模式在点S上的密度或强度是可测度的,是通过测量在研究区域中单位面积上的事件数量来估计的。有多种事件密度估计的方法。最简单的方法是在研究区域中用滑动的圆来统计落在圆域内的事件数量,再除以圆的面积,就得到估计点S处的事件密度。设S处的事件密度为L(s),其估计为L(s),则,式中,C(s,r)是以点s为圆心、r为半径的圆域;#表示事件S落在圆域C中的数量。,基于密度的方法核函数,1.核密度的概念与方法根据概率理论,核密度估计的定义为:设Xl,Xn是当作从分布密度函数为f的总体中抽取的样本,估计f在某点x处

18、的值f(x)。通常用Rosenblatt-Parzen 核估计:k()称为核函数;h0,为带宽;(x-Xi)表示估值点x到事件Xi处的距离。,基于密度的方法核函数,影响KDE的主要因素是k()函数的数学形式和带宽。Scott等1992年的统计试验研究表明,当带宽确定后,不同的核函数对密度估计的影响很小。在实际工作中,只需要选择满足一定条件的核函数即可。实践中常用的核函数主要为四次多项式函数和正态函数(图4.6),分别为四次多项式函数:正态函数:是核函数的带宽;dij是点i至点j之间的距离。,1.核密度的概念与方法,基于密度的方法核函数,图4.6 两种常用的核函数,基于密度的方法核函数,根据上述

19、讨论,不难发现:(1)核函数k()的值在di j=0时最大,随着距离dij的增加,k()值减小。(2)点s处的密度估计值是已知事件对于该点的综合影响。距离大的事件影响小;距离近的事件影响大。(3)核函数中的带宽 确定了事件的影响范围。,1.核密度的概念与方法,基于密度的方法核函数,2.关于KDE 中的带宽KDE估计中,带宽的确定或选择对于计算结果影响很大,对 敏感。一般而言,随着 的增加,空间上点密度的变化更为光滑;当减小时,估计点密度变化突兀不平。,基于密度的方法核函数,下图清楚地展示了不同的带宽选择对于点密度分布的影响:,基于密度的方法核函数,那么应当如何选择呢?在具体的应用实践中,的取值

20、是有弹性的,需要根据不同的值进行试验,探索估计的点密度曲面 的光滑程度,以检验的尺度变化对于 的 影响。值还可以自动确定。当给定事件位置的观测模式时,这一方法能够在估计的可靠性和保持空间详细程度两个方面达到最佳平衡(Diggle,1983)。,很关键,基于密度的方法核函数,KDE中的带宽的自适应确定前面所考虑的带宽在研究区域R中是不变的。为了改善估计的效果,还可以根据R中点的位置调整带宽的值,这种值的局部调节是自适应的。自适应方法,就是根据点的密集程度自动调节值的大小。在事件密集的子区域区,具有更加详细的密度变化信息,值应小一点;在事件稀疏的子区域,值应大一些。自适应的KDE可表达为下面的形式

21、:式中,(si)是si邻域中事件数量的函数。,基于密度的方法核函数,3.KDE 中的边缘效应在KDE中,需要密切注意的是靠近研究区域R边界的地地方会产生扭曲核估计的边缘效应,因为在靠近边界的地方,可能位于边界外的事件对于密度估计的贡献被割断了。避免这一问题的方法是在区域R的周界上建立一个警戒区。Kernel估计只计算区域R不落在警戒区内的点,但在警戒区内的事件要参与不在警戒区内的点的Kernel估计。,基于密度的方法核函数,另外,还可以用具有边缘校正的核估计方法。,基于密度的方法核函数,4.应用实例对于具有一阶密度或平稳性的分布模式,KDE是有效的且实用的检验方法,并且能够消除样方计数法中由于

22、样方的尺寸和形状等对局部密度的影响。KDE估计是测度局部密度变化、探索事件分布热点区域(hot spot)的有效技术。自Rosenblatt和Parsen分别于1956年和1962年提出核密度估计方法以来,这一方法得到了广泛应用。下面的实例是KDE方法在热带气旋源地分析中的应用。,基于密度的方法核函数,19492002年台风源地分布的核密度估计,样方计数法得到的台风源地年分布,4.3 基于距离的方法,基于距离的方法,1.最邻近距离法最邻近距离法(也称为最邻近指数法)使用最邻近的点对之间的距离描述分布模式,形式上相当于密度的倒数(每个点代表的面积),表示点间距,可以看作是与点密度相反的概念。最邻

23、近距离法首先计算最邻近的点对之间的平均距离,然后比较观测模式和已知模式之间的相似性。一般将随机模式作为比较的标准,如果观测模式的最邻近距离大于随机分布的最邻近距离,则观测模式趋向于均匀,如果观测模式的最邻近距离小于随机分布模式的最邻近距离,则趋向于聚集分布。,基于距离的方法,1.1 最邻近距离最邻近距离是指任意一个点到其最邻近的点之间的距离。利用欧氏距离公式,可容易地得到研究区域中每个事件的最邻近点及其距离,将事件点si的最邻近距离记为。图中分布有12个点,每一个点都有一个最邻近点,例如编号为1的点的最邻近点是2,最邻近距离为3.67。,基于距离的方法,点对之间的最邻近距离不是相互的,即j点是

24、第i个点的最邻近点,但i不一定是j的最邻近点。在点分布模式中必定存在很多的点,其最邻近点具有相互的最邻近性。根据Cox于1981年的研究,在CSR模式中超过60%的最邻近是相互的邻近。,基于距离的方法,2.最邻近指数测度方法为了使用最邻近距离测度空间点模式,1954年Clark和Evans提出了最邻近指数法(NNI)。NNI方法:首先对研究区内的任意一点都计算最邻近距离;然后取这些最邻近距离的均值作为评价模式分布的指标。对于同一组数据,在不同的分布模式下得到的NNI是不同的,根据观测模式的NNI计算结果与CSR模式的NNI比较,就可判断分布模式的类型。在聚集模式中,由于点在空间上多聚集于某些区

25、域,因此点之间的距离小,计算得到的NNI应当小于CSR的NNI;而均匀分布模式下,点之间的距离比较平均,因此平均的最邻近距离大,且大于CSR下的NNI。因此通过最邻近距离的计算和比较就可以评价和判断分布模式。,基于距离的方法,2.最邻近指数测度方法NNI 的一般计算过程如下:(1)计算任意一点到其最邻近点的距离(dmin)。(2)对所有的dmin按照模式中点的数量n,求平均距离,即dmin表示每一个事件到其最邻近的距离;si为研究区域中的事件;n是事件的数量。(3)在CSR模式中同样可以得到平均的最邻近距离,其期望为E(dmin),于是定义最邻近指数R为 或,基于距离的方法,根据观测模式和CS

26、R模式的最邻近距离或最邻近指数,可以对观测模式进行推断,依据如下:(1)如果robs=rexp,或者R=l,说明观测事件过程来自于完全随机模式CSR,属于随机分布。(2)如果robsrexp,或R1,同样说明事件的过程不是来自于CSR,由于点之间的最邻近距离大于CSR过程的最邻近距离,事件模式中的空间点是相互排斥地趋向于均匀分布。,基于距离的方法,3.显著性检验检验最邻近指数显著性的一种方法是首先计算观测的平均最邻近距离和CSR的期望平均距离的差异,并用这一差异和其标准差:作比较。标准差描述了差异完全是偶然发生的可能性。如果计算的差异与其标准差比较相对较小,那么这种差异在统计上不显著,即点模式

27、属于CSR;如果计算的差异与其标准差比较相对较大,那么差异在统计上是显著的,即点模式不属于CSR。理论上得到的标准差SEr 为,基于距离的方法,4.实例研究,基于距离的方法,4.实例研究上图为乌干达的火山弹坑分布。根据点的空间位置,得到平均最邻近距离为对应的CSR模式下的最邻近距离为计算最邻近指数为由于R大于1,因此火山弹坑的分布属于均匀分布类型。,4.4 G函数与F函数,G函数与F函数,NNI通过距离概念揭示了分布模式的特征,但是只用一个距离的平均值概括所有邻近距离是有问题的。在点的空间分布中,简单的平均最邻近距离概念忽略了最邻近距离的分布信息在揭示模式特征中的作用。G函数和F函数就是用最邻

28、近距离的分布特征揭示空间点模式的方法。这两个函数是一阶邻近分析方法,这两个函数是关于最邻近距离分布的函数。,G函数,G函数 G函数记为G(d),其使用所有的最邻近事件的距离构造出一个最邻近距离的累积频率函数:式中,si是研究区域中的一个事件;n是事件的数量;d是距离;#(dmin(si)d)表示距离小于d的最邻近点的计数。,G函数,G函数 计算G(d)的一般过程如下:(1)计算任意一点到其最邻近点的距离(dmin);(2)将所有的最邻近距离列表,并按照大小排序;(3)计算最近邻距离的变程R和组距D,其R=max(dmin)-min(dmin);(4)根据组距上限值,累积计数点的数量,并计算累积

29、频率数G(d);(5)画出G(d)关于d的曲线图。,用G函数分析空间点模式依据是G(d)曲线的形状。如果点事件的空间分布趋向聚集,具有较小的最邻近距离的点的数量就多,那么G函数会在较短的距离内快速上升;如果点模式中事件趋向均匀分布,具有较大的最邻近距离的点的数量多,那么G函数值的增加就比较缓慢。即如果G(d)在短距离内迅速增长,表明点空间分布属于聚集模式;如果G(d)先缓慢增长后迅速增长,表明点的空间分布属于均匀模式。,G函数,G函数,F函数,F函数.F函数是一种使用最邻近距离的累积频率分布描述空间点模式类型的一阶邻近测度方法,记为F(d)。.F函数首先在被研究的区域中产生一新的随机点集P(p

30、1,p2,pi),其中pi是第i个随机点的位置。然后计算随机点到事件点S之间的最邻近距离,再沿用G函数的思想,计算不同最邻近距离上的累积点数和累积频率。其计算公式可表示为:式中,dmin(pi,S)表示从随机选择的pi点到事件点S的最邻近距离,即计算任意一个随机点到其最邻近的事件点的距离。,F函数,G函数与F函数的差别G函数主要通过事件之间的接近性描述分布模式,而F函数则主要通过选择的随机点和事件之间的分散程度来描述分布模式。F函数曲线和G函数曲线呈相反的关系。在F函数中,若F函数曲线缓慢增加到最大表明是聚集模式,若F函数快速增加到最大则表明是均匀分布模式。,F函数,3.G函数和F函数的统计推

31、断3.1 CSR过程中的G和F研究表明,对于遵循完全随机过程的泊松点过程,在最邻 近距离变化范围内的某个距离d内,点的数量均值等于,在最邻近距离小于等于d时的累积概率分布为:根据观测模式的函数曲线与CSR过程的函数曲线比较,得到:(1)当G(d)CSR(G(d)或F(d)CSR(F(d)时,均匀分布。,F函数,(1)当G-F曲线位于对角线的上方时,点模式是聚集分布。(2)当G-F曲线位于对角线的下方时,点模式是均匀分布。(3)当G-F曲线位于接近于对角线时,点模式是随机分布。,F函数,F函数,3.2 显著性检验的随机模拟方法CSR下的G函数和F函数给出了点模式的判据,其显著性需要通过检验来推断

32、。G函数和F函数的显著性检验一般使用蒙特卡罗随机模拟方法。首先在研究区域R上利用蒙特卡罗随机模拟的方法产生m次的CSR点模式,并估计理论分布,即 式中,(i1,2,m)是在R区域上模拟的n个CSR事件的m次独立随机模拟,且没有经过边缘校正的经验分布函数的估计。,F函数,3.2 显著性检验的随机模拟方法为了评价观测模式和CSR模式差异的显著性,需要计算m次随机模拟中分布函数G的上界U(d)和下界L(d):计算得到的模拟m次CSR经验分布函数的上界和下界提供了与CSR差异显著性的方法,得到的概率公式为,若G(d)函数曲线位于U(d)的上方,则可推断观测模式显著聚集;若G(d)函数曲线位于L(d)曲

33、线的下方,则可推断观测模式为显著均匀;如果G(d)函数位于U(d)和L(d)曲线之间,可推断观测模式与CSR无显著差别。,F函数,4.5 K函数与L函数,K函数与L函数,一阶测度的最邻近方法仅使用了最邻近距离测度点模式,只考虑了空间点在最短尺度上的关系。实际的地理事件可能存在多种不同尺度的作用,为了在更加宽泛的尺度上研究地理事件空间依赖性与尺度的关系,Ripley提出了基于二阶性质的K函数方法,随后,Besage又将K函数变换为L函数。K函数和L函数是描述在各向同性或均质条件下点过程空间结构的良好指标。,K函数,1.定义与K函数估计点Si的近邻是距离小于等于给定距离d的所有的点,即表示以点Si

34、为中心,d为半径的圆域内点的数量。近邻点的数量的数学期望记为E(#SC(Si,d),有 E(#SC(si,d)表示以si为中心,距离为d的范围内事件数量的期望。于是,K函数定义为 或者 显然,K(d)就是以任意点为中心,半径为d的圆域内点的数量。因此K(d)定义为任意点为中心,半径d范围内点的数量的期望除以点密度。,K函数,K函数的估计K(d)的估计记为,则有:用 代替(a是研究区域的面积,n是研究区域内点的数量)则有 或,K函数,一般计算过程主要分为以下两步:1)对于每一个事件都计算:a.对每一个事件设置一个半径为d的圆;b.计数d距离内点的数量;c.将所有事件d距离的点的数量求和,然后用n

35、乘以密度除以面积。2)对任意的距离d重复执行上述过程,例如1,2,3个单位距离等,为了便于算法设计,上面的估计还可以写成下述形式:,式中,,K函数,K函数的边缘效应与校正在K函数的计算过程中同样存在边缘效应问题。当dij超出研究区域的范围时,需要对其进行校正以消除边缘效应,常采用下列形式:式中,wij是校正因子。,K函数,2.K函数的点模式判别准则在均质条件下,如果点过程是相互独立的CSR,则对于所有的,有,且有 于是比较 和 就能建立判别空间点模式的准则。,,表示在d距离上 和来自于CSR过程的事件的期望值相同。,表示在d距离上点的数量比期望的数量更多,于是d距离上的点是聚集的。,表示在d距

36、离上点的数量比期望的数量更少,于是d距离上的点是均匀的。,用K函数方法计算的观测K(d)曲线和理论曲线相当接近,其中在d较小的情况下,观测值小于理论值,在距离d较大的情况下,观测值大于理论值。K函数揭示了在不同的空间尺度上分布模式的差异。,K函数,L函数,K函数在使用上不是非常方便,对估计值和理论值的比较隐含着更多的计算量,而且K函数曲线图的表示能力有限。Besag提出了以零为比较标准的规格化函数(即L函数),其形式为:于是L(d)的估计 可写成L函数不仅简化了计算,而且更容易比较观测值和CSR模式的理论值之间的差异。在L函数图中,正的峰值表示点在这一尺度上的聚集或吸引,负的峰值表示点的均匀分

37、布或空间上的排斥。,观测模式随着尺度d的变化而变化。在小尺度上表现出一阶方法所揭示的均匀性,在较大尺度上表现出的是聚集性。,L函数,4.6 K函数方法的扩展二元模式与空间-时间模式,K函数方法的扩展,1.两元模式与交叉K函数首先考虑作为背景的总体的自然变异中的聚集性探测问题。设关注的第一种类型的事件为案例事件,第二种类型的事件是表示环境异质性的控制事件,案例事件和控制事件分别有n1和n2个。当将这两个事件合并在一起,希望n1个案例事件随机地附在两个事件的组合中,是事件的一个“随机标记”,于是事件是位置独立的。在这种随机标记条件下,Diggle(1991)证明了案例事件的K函数记为K11(d)和

38、控制事件的K函数记为K22(d)是完全相同的。,K函数方法的扩展,1.两元模式与交叉K函数交叉K函数定义为 或 式中,S1是模式2中以任意事件S2i为中心,距离d为半径的范围内第一个模式中事件的数量。,K函数方法的扩展,2.D函数D函数用于检验案例事件是否具有显著的聚集性。D函数定义为:当 远大于0时,表明由于环境的空间异质性的存在,案例事件在尺度d上聚集。当 远小于0时,表明由于环境的空间异质性的存在,案例事件尺度d上均匀。,K函数方法的扩展,2.D函数 显著性检验 使用蒙特卡罗模拟的方法进行模式间的独立性或模式的显著性检验。其一般过程如下:(1)S1(案例事件)和S2(控制事件)两个事件组

39、合为一个点集。(2)在组合的点集中随机抽取n1个事件样本模拟案例事件。(3)根据模拟案例事件和控制事件计算 和。(4)计算。(5)重复m(例如m=100)次。(6)获得随机模拟的最大和最小的,即包络线。,K函数方法的扩展,3.空间-时间模式与D函数对于空间-时间事件模式,首先对每一个事件附加一个时间标记,于是“空间-时间”K函数定义为 式中,是事件的空间密度;表示事件的时间密度;表示在时间间隔t内,以任意点si为中心,d为半径的距离内事件数量的期望。,K函数方法的扩展,3.空间-时间模式与D函数如果运行在空间和时间上的过程是独立的,即没有空间和时间的相互作用,那么K(d,t)是空间K函数和时间

40、K函数的乘积,Diggle等于1995年得到理论上结果:类比前述的k函数,具有边界校正的K(d,t)的估计按照下列公式计算:式中,a、dij、Id(dij)和wij与K函数中的意义相同;T是观测的时间范围;tij是观测第i到第j个事件的时间间隔;It(tij)是指标函数。当tijt时,It(tij)=l,否则It(tij)=0;vij等价于空间边缘校正,是以第i个时间为中心,其时间间隔tij是否完全位于(0,T)的观测范围内的时间校正因子。,K函数方法的扩展,3.空间-时间模式与D函数如果过程在空间和时间上是独立的,即事件过程没有空间相互作用,K(d,t)等于空间和时间各自的K函数的乘积,于是一个可行的空间-时间作用的解释工具是定义函数D(d):空间-时间作用的证据是在 关于d和t的曲面图上的观测模式的峰值。这些峰值指示的空间尺度和时间尺度上聚集的显著性检验仍然采用蒙特卡罗随机模拟的方法。,谢谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号