《测绘工程毕业论文遥感毕业设计.doc》由会员分享,可在线阅读,更多相关《测绘工程毕业论文遥感毕业设计.doc(43页珍藏版)》请在三一办公上搜索。
1、 本 科 毕 业 设 计(论文) 题目 遥感图像分类方法研究 院(系部)测绘与国土信息工程学院专业名称 测绘工程 年级班级 学生姓名 指导教师 20年 月 日摘 要 遥感图像分类一直是遥感研究领域的重要内容,如何解决多类别的图像的分类识别并满足一定的精度,是遥感图像研究中的一个关键问题,具有十分重要的意义。遥感图像的计算机分类是通过计算机对遥感图像像素进行数值处理,达到自动分类识别地物的目的。遥感图像分类主要有两类分类方法:一种是非监督分类方法,另一种是监督分类方法。非监督分类方法是一个聚类过程,而监督分类则是一个学习和训练的过程,需要一定的先验知识。非监督分类由于不能确定类别属性,因此直接利
2、用的价值很小,研究应用也越来越少。而监督分类随着新技术新方法的不断发展,分类方法也是层出不穷。从传统的基于贝叶斯的最大似然分类方法到现在普遍研究使用的决策树分类和人工神经网络分类方法,虽然这些方法很大程度改善了分类效果,提高了分类精度,增加了遥感的应用能力。但是不同的方法有其不同优缺点,分类效果也受很多因素的影响。 本文在对国内外遥感图像分类方法研究的进展进行充分分析的基础上,应用最大似然分类法、ISODATA分类法对鹤壁市Geoeye遥感图像进行了分类研究。在对分类实现中,首先对分类过程中两个必不可少的,并影响分类效果的步骤也进行了详细地研究,分别是分类样本和分类特征;然后详细介绍这两种方法
3、的分类实验;最后分别分析分类结果图和采用混淆矩阵和kappa 系数对两种方法的分类结果进行精度评价。两种分类方法的分类总体精度计算都达到80以上,满足分类要求。通过综合分析发现本次研究ISODATA方法分类精度较低,最大似然法分类精度较高。关键词: 图像分类,最大似然法,ISODATA分类法,分类精度ABSTRACT Remote sensing(RS)image classification is always a pivotal part of remote sensing study. How to improve the accuracy of RS interpretation is
4、 an urgent problem in RS application. Classification of remote sensing image using computer is data disposal of remote sensing image pixels by computer. There are mainly two methods: non-supervised classification, and supervised classification. Non-supervised classification is a clustering process,
5、while supervised classification is a study and training process, and it needs preliminary knowledge. Because non-supervised classification can not ascertain attribute of sorts, its value is very little by direct used and applied. While supervised classification methods emerged in endlessly with deve
6、lopment of new methods and technique. From traditional maximum likelihood classification(MLC) based on Byes to decision tree classification and artificial neural network(ANN) classification being studied and used now, they all enhance accuracy, improve effect and application to a great extent. Where
7、as different ways are different advantage and disadvantage, classification effect is affected by some factors. Based on world RS image classification methods analysis, this paper applied MLC, and ISODATA classification to study classification of the Hebi citys RS image. Within classification carried
8、 out, first classification samples and features have been researched in detail, which are two absolute necessary steps that affect classification in the process .Afterward this paper concretely introduced experiment of two classification process. Finally this paper evaluated accuracy of different wa
9、ys according to analysis of classification image, the confusion matrix and Kappa coefficient. Two ways overall accuracy are both more 80% and so satisfied. By comparison, we find ISODATA classification is not prior to the maximum likelihood classification . Keywords: Image Classification, Maximum li
10、kelihood, ISODATA classification, Classification Accuracy 目 录1 绪论11.1 研究背景与意义11.2 国内外研究现状21.3 研究内容与论文组织结构32 遥感图像分类技术42.1 遥感图像计算机分类的一般原理42.1.1 概述42.1.2 计算机分类的基本原理52.1.3 计算机分类处理的一般过程52.2 遥感图像分类方法72.2.1 监督分类72.2.2 非监督分类112.3 遥感图像分类新方法162.3.1 决策树分类162.3.2 神经网络分类182.3.4 综合阈值法192.3 图像分类的一般过程193 遥感图像分类方法的应
11、用213.1 几种高分辨率商业遥感卫星介绍213.2 研究所使用的软件介绍223.3 影像处理233.4 分类后处理274实验精度分析304.1 遥感图像分类的评价305总结与展望34致 谢36参考文献37 1 绪论1.1 研究背景与意义 遥感(Remote Sensing,简称 RS)是一种远离目标,通过非直接接触而判定、测量并分析目标性质的技术,它实现了空间(或地表)图像信息的采集与处理。遥感技术作为一种信息时代的产物和工具,具有周期动态性、信息量丰富、获取效率高等显著优势1。近年来,随着传感器技术、航空和航天平合技术、数据通讯技术的飞速发展,现代遥感技术已经进入了一个动态、快速、准确、及
12、时、多手段地提供多种对地观测数据的新阶段。新型传感器不断出现,能在不同的航天、航空遥感平台上获得不同空间分辨率、时间分辨率和光谱分辨率的遥感图像,并与全球定位系统(Global Position System,简称 GPS)、地理信息系统(Geographical Information System,简称 GIS)等相结合。由于遥感向人类提供了一种全新的认识地球的方式而在众多的学科和领域得到应用,并逐渐发展成占优势的技术手段,向外延伸、渗透和与其它技术的集成2。遥感图像分析是遥感图像处理的高级阶段,是对地球表面及其环境在遥感图像上的信息进行特征提取,利用获取的特征进行分类,从而达到识别图像信
13、息所对应的实际地物,提取所需地物信息的目的。遥感图像的应用主要是解决两个问题,一个是定性,即回答是什么;一个是定位,即回答在何处,数量有多少。 随着传感器技术、航空和航天平台技术以及通讯技术的飞速发展,现代遥感对地观测已经达到能够动态、快速、多手段提供对地观测数据的新阶段。新型的传感器能够以不同空间分辨率、时间分辨率和光谱分辨率观测地面。目前遥感应用由定性向定量、静态向动态发展。遥感对地观测技术目前已广泛应用于战场情报侦察、地面目标识别、气候变化监测、臭氧层损耗监测、土地利用和覆被监测、植物生长监测、灾害监测、数字地球等方面。由此可见,从科学发展、国家安全、国济民生等方面出发,都有对多光谱遥感
14、数据进行深层次分析、提取其中丰富的地物信息的迫切需求3 随着21世纪的到来,光谱遥感正朝着三高(搞空间分辨率、高光谱分辨率、高时间分辨率)和三多(多传感器、多平台、多角度)的方向迅猛发展。面对如此海量的信息源,如何充分有效利用它们是亟待解决的问题。1.2 国内外研究现状 遥感图像的计算机分类,与遥感图像的目视解译判读技术相比,两者的目的一致,但手段不同,前者是利用计算机模拟人类的识别能力,后者把地学工作人员的专业知识介入到图像分析中去,是遥感解译的基本方法。而在实际工作中,常常是二者有机结合起来,互相取长补短。计算机自动分类可以利用各波段、各像元的灰度值最小差异,探测目标的微小变化,精度较高,
15、适于定量分析,速度快,可重复性好,因而越来越得到广泛的应用,尤其是与地理信息系统相结合更是显出其强大优势。计算机分类的快速处理数据的能力也是与遥感大量信息相适应的,目前已成为遥感理论和应用研究领域主流之一。遥感图像分类的理论依据是:遥感图像中同类地物在相同条件下(纹理、地形、光照以及植被覆盖等)应具有相同或相似的光谱信息特征和空间信息特征,因此同类地物像元的特征向量将集群在统一特征空间区域,而不同的地物由于光谱信息特征或空间信息特征的不同,将集群在不同的特征空间区域。同类地物的各像元特征向量虽然不是完全集中在几个点上,但也不是杂乱无章分布的,而是相对密集的分布在一起形成集群,当像元数目较大时,
16、近似呈多维正态分布。一个集群相当于一个类别,而每类的像元值向量可以看作随机向量,因而遥感图像 分类方法一般是建立在随机变量统计分析的基础上的。依据是否使用类别的先验知识,可分为监督分类(supervised classification)和非监督分类(Unsupervised classification)。监督和非监督分类法相比,监督分类的精度高些,准确性要好一些,但是需要采样,工作量要大得多。监督分类要选好训练样本,要求样本有一定的代表性,而且有足够的数量。常用的分类方法有最大似然法,神经网络法和基于知识的决策树法等,下一章详细介绍。在国外,在遥感图像处理领域卓有成效的有美国ERDAS公司
17、推出的ERDASimagine、加拿大ERM公司研制的ER Maper、新加坡3一link公司的ENVI等。这些商用软件通常提供基础级(Essentials)、高级(Advantage)和专用级(Professional)三级模块软件5。在专业级遥感图像处理模块是在其他两级的基础上,增加用于遥感与地理分析专业的综合工具,如分类技术、雷达分析、可视化空间建模工具等。特别是ERDAS, Imagine不仅具有常用的监督和非监督分类技术,而且具有予像元分类器(Subpixel Classifier)及结合专家系统的专家分类器(Expert Classfier)。子像元分类模块是功能强大的多光谱图像研
18、究工具,具有较高水平的光谱区分能力和分类精度。专家分类器通过建立专家系统,既充分利用光谱信息,又将空间关系信息(纹理特征)引入,并且需要建立并运行复杂的推理机制,从而生成土地覆盖图和其他信息类别。因而除了该软件具有相当高的价格外,对软件使用者的地学知识和经验以及建模能力又相当高的要求6。 国内在GIS和遥感图像处理领域的发展较晚,加之产品功能单一,因而在市场上的份额较小。进入90年代以来,随着国际上微机平台的遥感图像处理系统的兴起和国内地理信息系统等相关领域的迅速发展,我国遥感图像处理系统的研制有了新的发展8。武汉大学开发的MAPGIS等国内先进的基于微机Windows平台上的GIS软件已包含
19、了遥感图像处理模块。但其相对功能较弱。另外像Teullx Imager是北京诺瓦信息技术有限公司推出的独立架构的遥感图像处理软件。但遥感分类技术单一仅能提供最大似然法分类,因而分类效果相对较差。 1.3 研究内容与论文组织结构本文分为六部分。第一章 为绪论,主要介绍本次研究背景、意义以及遥感图像识别与分类技术发展和研究现状,并提出本研究的主要内容和研究方法;第二章为遥感图像分类技术的基本理论,介绍遥感图像分类的整个过程的基本原理,传统的监督、非监督分类的基本算法,分类精度评价方法,为本研究提供理论基础;第三章介绍本次分类研究区典型地物类型样本的确定原则和方法,并提出了本次分类实验样本的选取方案
20、;第四章为本次分类实验的具体方法和结果,展示了遥感图像分类的全过程,并分析不同分类方法的分类效果;第五章为总结和展望,总结本次的研究工作和不足,对未来的研究展开思路打下铺垫。2 遥感图像分类技术在遥感技术的研究中,通过遥感影像判读识别各种目标是遥感技术发展的一种重要环节,无论是专业信息提取,动态变化预测,还是专题制图和遥感数据库的建立等都离不开分类。近年来随着计算机技术的飞速发展,计算机分类识别成了遥感应用的一个重要组成部分。21 遥感图像计算机分类的一般原理2.1.1 概述1.遥感图像解译遥感所得的图像数据的应用常常是将遥感数据进行解译,即是根据各专业的要求,借助各种技术手段和方法对遥感图像
21、进行综合分析、比较、推理和判断,识别出所需要的地物或测算某种数量指标的过程。这种解译有两种方法:一种是目视解译的方法,即是凭借光谱规律、地学规律和解译者的经验从图像的亮度、色调、位置、时间、纹理、结构等各种特征推出地面的景物类型;另一种是计算机的方法,就是对遥感图像上的信息进行属性的识别和分类,从而达到识别图像上信息所对应的实际地物,提取所需要的地物信息的目的。它实际上是计算机模式识别技术在遥感技术领域的具体应用。与遥感图像的目视判别技术相比较,目的一样但是手段不同,目视的方法是直接利用人类的自然识别智能,而计算机分类是利用计算机技术来模拟人类的识别智能。2光谱特征为了将各个波段图像中的像元的
22、亮度值与地面地物特征联系起来,必须发现其中的规律性。由地物反射率曲线可知,在不同的波段各种地物的反射率有差异。如任意选择TM遥感图像的两个波段或两个以上的波段,以每一个波段的亮度值为轴做多光谱空间,可以看到,对应于同一地物的像元点在多光谱空间位置很接近,有集聚的倾向。这种同类集聚的特性说明,如果按照地物类别集聚的规律把多光谱空间划分为若干个子空间,每个子空间包含有一个类别,这样就把图像中未知的像元进行分类,把他们分配到各自的子空间中去。这种完全按照光谱特征都在多光谱空间集聚的类别,称为光谱类别;而与地面实际地物对应的类别称为信息类别。由于自然界的情况是复杂的,反映在图像上像元亮度值的信息常常是
23、多种影响的综合,而同一种地物也有许多差别。在实际处理时,植被、地形、含水量等都会引起同种信息类别的亮度变化,这种现象常常称为“同物异谱” 。还有在同一种光谱类别中有不同的信息类别,这种现象称为“异物同谱” 。因此,当利用光谱特性分类得到的光谱类别后,还要找到光谱类别与信息类别的关系,把每一种光谱类别与信息类别对应,或将光谱类别进一步区分为信息类别,才能得到正确的分类结果。2.1.2 计算机分类的基本原理遥感图像分类就是把图像中的每一个像元或区域划归为若干类别中的一种,即是通过对各类别地物的光谱特征分析来选择特征参数,将特征空间划分为互不重叠的子空间,然后将图像内的各个像元划分到各个子空间中去,
24、从而实现分类。假设多光谱图像有n 个波段,则(i,j)位置上的像元在每个波段上额灰度值可以构成一个矢量X(),T ,X 称作该像元的特征值,包含X 的n 维空间称为特征空间。这样n 个波段的多光谱图像便可以用n 维特征空间中的一系列点来表示。在遥感图像分类问题中,常常把图像中的某一类目标称为模式,而把属于该类中的像素称为样本,多光谱矢量X 称为样本的观测值,下面以多光谱图像的两个波段为例说明遥感图像分类的基本原理。如果将多光谱图像上的每个像素用特征空间中的一个点来表示,这样多光谱图像和特征空间中的点就具有等价关系。通常情况下,同一类地面目标的光谱特征比较接近,因此在特征空间中的点就聚集在该类的
25、中心附近,多类目标在特征空间中形成多个聚集中心。假设图像上只包含两类目标,记为、,则在特征空间中形成A、B 两个相互分开的点集,这样将图像中的两类目标区分开来就等于在特征空间上找到一条曲线(多光谱图像就要找若干个曲面)将A、B 两个点集分割开。假如分割A、B 两个点集的曲线表达式为,则方程0 就称为A、B 两类的判别界面。如果 0,X 属于,如果 0,X 属于。遥感图像分类算法的核心就是确定判别函数和相应的判别准则,但是在多光谱遥感图像分类中,情况要复杂的多。2.1.3 计算机分类处理的一般过程遥感图像计算机分类处理的基本过程,如下图2-1 所示,包括原始图像的预处理、训练样本的选择、特征的选
26、择和特征提取、分类器设计、图像分类、结果输出以及结果检验等。分类处理特征选择特征提取图像选择与预处理 结果检验与后处理成果输出图2-1 遥感图像自动分类处理的一般过程1原始图像的预处理原始图像的预处理就是指对图像进行几何校正、辐射校正、量化、采样、滤波、增强、去噪等处理,以便获得比较清晰、对比度强、位置准确的图像以提高分类的准确性。2训练样本的选择从待处理的图像数据中抽取具有普遍性、代表性的数据作为样本。训练区域选择准确与否,训练样本数量是否足够,关系到分类的精度的高低。在监督分类中,训练样本选择最好的方法是选择几个典型区域,包含各类地物,进行实地考察,对照实地将被分类的遥感图像一一识别,并在
27、图上标好,在到计算机上将这些数据提出。如果受客观条件的限制,可以借助地图、航片或其他专题资料进行选择等。如果在上述资料都没有的情况下也可以先做非监督分类,在非监督分类结果中选择训练样本。3特征选择和特征提取特征选择是从众多特征中挑选出可以参加分类运算的若干个特征,如TM 图像波段的选择等。特征提取是在特征选择后,利用特征提取算法从原始特征中求出最能反映其类别特性的一组新特征,完成样本空间到特征空间的转换。通过特征提取既可以达到数据的压缩目的,又能提高不同类别特征之间的可区分性。4图像分类运算图像分类运算就是根据图像的特点和分类目的而设计或选择恰当的分类器及其判别准则,对特征向量集进行划分、完成
28、分类识别工作。分类阶段是计算机处理的核心阶段。5结果检验主要是对分类的精度进行评价。进入传感器的遥感信息由于受传感器空间分辨率和光谱分辨率的限制,常常得到混合的信息。有时地物本身就是混合在一起的,例如植被覆盖下的土壤。因此不存在理想的分类器,加上“同物异谱”、“异物同谱“现象的存在,错分的情况普遍存在,所以分类后必须进行检验,错分像素所占的比例越小,则分类效果越好。6结果输出包括分类结果图像的输出,以及分类结果的统计,例如各类地物占地面积等。 2.2 遥感图像分类方法遥感图像分类过程实际上是将图像中的每一个像元点或区域归属若干个类别中的一类,分类的结果是将图像空间划分为若干个子区域,每个子区域
29、代表一种地物类型。依据是否使用类别的先验知识,可分为监督分类(Supervised Classification)和非监督分类(Unsupervised Classification).2.2.1 监督分类 监督分类就是先用某些已知类别训练样本让分类识别系统进行学习,待其掌握了各个类别的特征之后,按照分类的决策规则进行分类下去的过程。目前比较成熟的分类方法,一般是概率统计分类方法。除此之外,尚有模拟自然语言的句法结构识别分类方法和模糊数学分类方法等。就统计分类方法而论,通过计算各个类别的均值、方差、协方差、标准偏差和离散度等统计量,作为进行比较不同类别的相似程度的依据和标准,也即在这些统计量的
30、基础上建立各个组类的类识别特征来进行分类。 监督分类方法主要有:最小距离分类法、平行多面体分类法、最大似然分类法等.2.2.1.2 最小距离分类法最小距离分类法是以特征空间中的距离作为像素分类的依据。最小距离分类包括最小距离判别法和最近邻域分类法。最小距离判别法要求对遥感图像中每一个类别选一个具有代表意义的统计特征量(均值),首先计算待分像元与已知类别之间的距离,然后将其归属于距离最小的一类。最近邻域分类法是上述方法在多波段遥感图像分类的推广。在多波段遥感图像分类中,每一类别具有多个统计特征量。最近邻域分类法首先计算待分像元到每一类中每一个统计特征量间的距离,这样,该像元到每一类都有几个距离值
31、,取其中最小的一个距离作为该像元到该类别的距离,最后比较该像元到所有类别间的距离,将其归属于距离最小的一类。最小距离分类法原理简单,分类精度不高,但计算速度快,它可以在快速浏览分类概况中使用。最小距离分类法中通常使用以下三种距离判决函数。 (1)欧几里德(Euclidean)距离欧几里德 (欧氏)距离判决函数为: (2-1)式中 n-波段数; -像元x在j波段的像元值。 分类的原则就是把x归入最小的哪一类。(2) 绝对值距离绝对值距离(或称等混合距离)是欧氏距离的进一步简化。其目的是为了避免平法计算,从而用X到类均值在多维空间中距离的绝对值之总和来表示,即: (i=1,2,.m) (2-2)直
32、接应用以上两种距离进行分类是有明显缺陷的。首先,不同类别的亮度值得变化范围,其方差的大小是不同的,不能简单地用到垒中心的距离来划分像元的归属。其次,自然地物类别的点群分布不一定是圆形或球形,即不同方向上半径是不等的,因而距离的量度在不同方向上也应有所差异。考虑到这些因素,在距离的算法上做一些改进,如 (2-3)式中 -第i类在第j波段的标准差。(3) 马氏(Mahalanobis)距离 马氏距离既考虑离散度,也考虑到训练组数据的均值向量和协方差矩阵,是一种加权的欧氏距离: (i=1,2,.m) (2-4)式中 -协方差矩阵;。当(单位矩阵)时,欧氏距离的平方即为马氏距离。 马氏距离对不同特征(
33、波段)是敏感的,需要进行行加权,通过协方差矩阵来考虑变量相关性,加权的办法就是考虑不同特征中像元值得离散程度,离散程度大的波段在距离中相应地消弱它的影响程度。2.2.1.3 平行多面体分类法平行多面体分类法是根据设定在各轴上的值域,在多维数据特征空间中划分出若干个互不重叠的平行多面体块段。应用这种方法进行分类需要由训练组数据学习产生基本统计量信息,包括每个类别的均值向量和标准差向量。若有n个波段,m个类别,用代表第i类第j波段的均值,为对应的标准差,为像元x在j波段的像元值。 对于某一个类别i(i=1,2,3,.m),当像元x满足: (2-5)即该像元在所有波段的灰度值都符合上述条件,就把像元
34、x归入第i类,即class(x)=i;否则不能归入已知类别,即class(x)=0。式中T为人为规定的一个阈值,相当于由概率分布出发,采用几个标准作为可信的分类边界,T越大则一个类的范围越大。这种方法比较简单,计算速度比较快。主要问题是按照各个波段的均值为标准差划分的平行多面体与实际地物类别数据点分布的点群形态不一致,也就造成两类互相重叠,混淆不清的情况。2.2.1.4 最大似然法 最大似然法因有严密的理论基础,对于呈正态分布的类别判别函数易于建立,综合应用了每个类别在各波段中的均值,方差以及各波段之间的协方差,有较好的统计特性,一直被认为是最先进的分类方法。1 基本原理 最大似然比判决分类方
35、法是建立在贝叶斯准则基础上的,其分类错误概率最小,是风险最小的判决分析。在进行图像统计分类中,如果有一个N波段的待分像元的随机模式:。应把它判归于那一个类别呢?事实上,随机模式x肯定是某地物在遥感图像上的反映,就是说它可以找到一个类别;,把待判模式x归属进去。假定遥感图像有4个波段,对一个像元点来说,每一个波段值都为0255,即有256种可能性,4个波段就为种组合可能性,也就是说对于一个类别就有种波谱分布的可能性。假如要分成m个类,就要有m种波谱分布。这样多的波谱分布的直方图都要贮存在计算机内,以便分类过程中进行匹配和识别时选用,这实际上是行不通的。但是,在自然界中大部分事物的规律都是服从正态
36、分布的,地物的波谱辐射和其对应的遥感图像灰度值也都近似地遵循正态函数的分布。 最大似然分类法是基于Bayes准则的应用最为广泛的监督分类方法。这种方法主要根据光谱性质的相似性和属于某类的概率最大的假设来指定每个像元的类别。有时也可以设定一个可能性阈值,那么最大的概率还小于这个阈值的像元将不会被分类。假定训练样本数据在特征空间的分布是服从高斯正态分布的,把特征点x归于某类集群G的条件概率P(Gx)作为判别函数,称为概率判别函数。由于概率是建立在统计意义上的,所以当使用概率判决函数来进行分类时,错分现象是不可避免的,我们希望以“错分损失最小”来建立需要的判别规则,这就是Bayes准则。最大似然分类
37、法的基本前提是认为每一类得概率密度分布是正态的,由每一类的均值向量和协方差矩阵可以得到它再多维空间的多维正态分布密度函数,该密度函数的自变量就是一个多维向量。将未知类别的像元灰度值向量代入各类别的概率密度函数中,通过计算像元属于各类别的归属概率,将像元归属于归属概率最大的那一类别中。设待分类遥感图像中每个像元取n个变量,则像元值可以用向量表示: (2-6)其中,是指X的转置。若研究地区可分为G类,则任意像元必来自其中的某一类。当各类总体为多元正态总体时,像元特征向量X在第g类得概率分布密度为: (2-7)式中 -第g类总体的均值向量和协方差阵; -矩阵的行列式值; -的逆阵。根据Bayes公式
38、,在X出现的条件下,其归属第g类得归属概率为: (2-8)式中 -第i类出现的先验概率。显然,越大,像元X来自g类得概率就越大,所以表示X归属于g类得概率,称为像元X的归属概率。 2 存在的问题 随着遥感数据时空维数的不断扩展,基于Bayes统计理论的最大似然分类方法开始暴露出一些弱点: 1)多源、多维的遥感数据,可能不具备正态分布特征:2)离散的类别数据(如地面实测数据),在很多情况下不具备统计意义; 3)对于高维空间数据,Bayes准则所要求的协方差矩阵将难以得到。 2.2.2 非监督分类非监督分类是按照灰度值向量或波段样式在特征空间聚类的情况划分点群或类别的,再根据相似性把图像中的像素归
39、成若干类别。它的目的是使得属于同一类别的像素之间的距离尽可能小而不同类别上的像素间的距离尽可能地大。2.2.2.1 聚类分析技术聚类(Clustering)分析又称群分析,它是研究样品或指标分类问题的一种多元统计方法。非监督分类主要采用聚类分析技术,用于在没有已知类别的训练数据的情况下,是一种边学习边分类的方法。分类时不必对图像地物获取先验知识,仅依靠图像上对不同类地物的光谱信息进行特征提取的统计特征的差别来达到分类的目的,最后对已分出的各个类别的实地属性进行确认。 非监督分类的前提就是假定遥感图像上不同类地物在同样条件下具有相同的光谱信息特征。遥感图像上的同类地物在相同的表面结构特征、植被覆
40、盖、光照条件下,应当具有相同或相近的光谱特征,从而表现出来某种内在的相似性,归属于同一个光谱空间区域;不同的地物,光谱信息特征不同,归属于不同的 光谱空间区域。从几何角度看,一个点群或类别是在N维特征空间里在某个众数的周围数据点(像元)相对密集的区域,亮度值向量之间具有很大的相似性。相似度是两类别之间的相似程度。在遥感图像分类过程中,常使用距离和相关系数衡量相似度。采用距离衡量相似度时,距离越小相似度越大;反之,距离越大,相似度越小。相关系数是指像素间的关联程度,采用相关系数衡量相似度时,相关程度越大,相似度越大;相关程度越小,相似度越小。两个像素之间的相关系数可以定义为: (2-9)其中,为
41、像元i和j的第k个分量;和表示均值。 聚类分析的过程是动态的,非监督分类算法的核心问题是初始类别参数的选定以及它的迭代调整问题。根据分类过程中的差异,常用的方法有K-均值聚类法和ISODATA分类法。 2.2.2.2 K-均值聚类法K-均值聚类法是一种较为典型的逐点修改迭代的动态聚类算法,也是一种普遍采用的方法。K-均值聚类的准则是使每一聚类中多模式点到该类别的中心的距离的平方和最小。一般先按某些原则选择一些代表点作为聚类的核心,然后把其余的待分点按某种方法分到各类中去,完成初始分类。初始分类完成后,重新计算各聚类中心m,完成第一次迭代。然后修改聚类中心,以便进行下一次迭代。这种修改有两种方案
42、,即逐点修改和逐批修改。逐点修改聚类中心就是一个像元样本按某一原则归属于某一组类后,重新计算这个组类的均值,并且以新的均值聚类中心点进行下一次像元聚类。逐批修改类中心就是在全部像元样本按某一组的类中心分类之后,再计算修改各类的均值,作为下一次分类的聚类中心点。K-mean分类方法简单易行,其基本思想是:通过迭代,逐次移动各类的中心,直到得到最好的聚类结果为止。具体算法步骤:(1) 任意选择K个初始聚类中心,一般选择给定样本集的前k个样本作为初始聚类中心。(2) 第k次迭代,是若,式中i=1,2,.k, ,则,为聚类中心是的样本集。于是分配各样本x到k个聚类域。(3) (3)由(2)的结果,计算
43、新的聚类中心 ,; (2-10)这样使中的所有点到新的聚类中心的距离平方和最小。(4)若,j=1,2,.k,算法收敛,程序结束。否则转入第二步。聚类中心数K、初始聚类中心的选择、样本输入的次序,以及样本的几何特性等均影响k平均算法的进行过程。对这种算法虽然无法证明其收敛性,当模式类之间彼此远离时这个算法所得的结果是令人满意的。2.2.2.3 ISODATA 分类法 ISODATA 是Iterative Self-Organizing Data analysis Techniques A的缩写,A是为发音的方便而加入的,ISODATA 算法是利用合并和分开的一种著名的聚类方法。它从样本平均迭代来
44、确定聚类的中心,在每一次迭代时,首先在不改变类别数目的前提下改变分类。然后将样本平均矢量之差小于某一指定阈值的每一类别对合并起来,或根据样本协方差矩阵来决定其分裂与否。主要环节是聚类、集群分裂和集群合并等处理。算法原理: 1 指定和输入;有关的迭代限制参数 K-要求的聚类中心数; -一个聚类中心域中至少具有样本个数的阈值; -标准差的阈值; -归并系数,聚类中心间距离的阈值; L-能归并的聚类中心对的最大数; I-允许迭代次数。 另再执行算法前,应先指定C个初始聚类中心,表示为;C不一定等于所要求的聚类中心数K;可为给定模式中的任意样本。2 具体步骤 (1)定算法的参数K、L、I; (2)配N个样本到C个聚类中心。若,则其中表示分到聚类中心的样本子集,为的样本数; (3)对任意的j,则去除,并使C=C-1,即将样本数比少的样本子集去除; (4)新聚类中心 (2-11) (5)计算聚类域中的样本与它们相应的聚类中心的平均距离 (2-12) (6)计算总的平均距离 (2-13)其中N为样本集中的样本数;(7) 判别a)若这是最后一次迭代,置且转到第十一步;b)若,则转入下一步;c)若, 或这是偶次迭代,则转第十一步;否则继续;(8) 标准差 (2-14)其中n是样本模式的维数,是第k个样本的第i分量,是的第i个分量。的每个分量表示中样本沿主