基于 SVM 的利用图像综合特征的图像分类方法1.doc

上传人:sccc 文档编号:5192417 上传时间:2023-06-12 格式:DOC 页数:7 大小:206.50KB
返回 下载 相关 举报
基于 SVM 的利用图像综合特征的图像分类方法1.doc_第1页
第1页 / 共7页
基于 SVM 的利用图像综合特征的图像分类方法1.doc_第2页
第2页 / 共7页
基于 SVM 的利用图像综合特征的图像分类方法1.doc_第3页
第3页 / 共7页
基于 SVM 的利用图像综合特征的图像分类方法1.doc_第4页
第4页 / 共7页
基于 SVM 的利用图像综合特征的图像分类方法1.doc_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《基于 SVM 的利用图像综合特征的图像分类方法1.doc》由会员分享,可在线阅读,更多相关《基于 SVM 的利用图像综合特征的图像分类方法1.doc(7页珍藏版)》请在三一办公上搜索。

1、精品论文基于 SVM 的利用图像综合特征的图像分类方法1伍卉 1,李仁发 21 湖南大学计算机与通信学院,长沙 (410012)2 湖南大学计算机与通信学院,长沙 (410012)E-mail: wuhui519摘要:语义图像检索已成为解决图像低层特征和用户检索丰富语义之间存在的“语义鸿沟”问题的关键。为了更好地理解图像的语义,我们设计了一种基于支持向量机的利用图像颜色 和纹理特征的图像分类方法,并在此基础上提出了一种新的综合两种特征进行分类的方法。对图像数据库的分类实验表明,这种新的特征综合方法比单一特征方法和其它特征综合方法 分类效果更好。关键词:图像分类;特征融合;支持向量机1引言近年来

2、,随着网络技术和多媒体技术的发展,全世界的图像数量以惊人的速度增长。由 于图像能表达丰富、直观的信息,各个领域对图像的使用越来越广泛(如遥感、航天、安全、 医疗等领域)。人们面临的问题不再是缺少图像信息,而是如何在浩瀚的图像世界中准确找 到自己所需要的图像信息。为了解决这个问题,基于内容的图像分类和检索成为一个非常活 跃的研究领域1,2。基于内容的图像检索指的是基于图像的颜色、纹理、形状等低层特征进行检索。在理想 状况下,人们希望通过图像所描述的对象、事件以及场景等来检索图像,这些图像的含义就 是图像的高层语义特征。从图像的低层特征到高层语义之间存在着巨大差别,称为“语义鸿 沟”(Semant

3、ic Gap)。尽管基于颜色、纹理、形状等单一特征的分类和检索算法在跨越“语义 鸿沟”的尝试中取得了一定的成果,但由于这些算法主要依赖于图像的部分特征,因此在实 际应用中具有局限性3。为了更好地理解图像的语义,经常需要综合利用图像的多个低层特征,通过不同级别和 层次的特征组合来达到精确识别的目的。综合特征主要有两个优点4:首先,通过综合多个 特征集合可以得到最显著的特征;第二,通过计算特征集合之间的相关性可以去除冗余特征。 颜色和纹理是图像最重要的两个视觉特征,因此,本文提出一种基于支持向量机的综合利用 图像颜色、纹理特征进行图像分类的新的方法。本文第 2 节介绍图像的颜色特征和纹理特征的表示

4、方法;第 3 节介绍我们采用的学习机 器,即支持向量机;第 4 节介绍我们提出的综合图像颜色和纹理特征的方法;第 5 节介绍了 对测试图像集进行的分类实验,取得了满意的结果,验证了综合特征分类方法的优越性;最 后介绍需要改进的地方及进一步的工作。2图像内容的描述颜色特征和纹理特征是图像的两个最基本的特征5。颜色是图像的一种重要视觉性质。 相对于其他的特征,颜色特征非常稳定,对于旋转、平移、尺寸变化,甚至各种形变都不敏 感,具有相当强的鲁棒性。并且,颜色特征计算简单,特征提取相对容易。因此在图像处理 中得到广泛的重视和研究,是应用最广泛的特征。纹理特征是除颜色特征之外,另一种应用广泛的图像视觉特

5、征。一般将图像在局部区域1本课题得到教育部重点项目互联网主面向学习的资源描述与发现技术研究(项目编号:106158)的资助。-7-内呈现不规则性,而在整体上表现出某种规律性的特性称为纹理。纹理是刻画局部区域中像素之间空间关系的一种度量,表达了一种分布规律。 总体来说,颜色特征侧重于描述图像的整体信息,而纹理特征更侧重于描述图像的局部信息。本文充分考虑到颜色与纹理特征的互补性,采用颜色累积直方图、颜色矩的方法表示 图像的颜色特征,采用灰度共生矩阵的方法表示图像的纹理特征,综合利用两种特征对图像 进行分类。2.1 颜色累积直方图颜色直方图是一种直观地表达图像内容的方式,是对图像中每个像素的颜色在色

6、彩空间 中出现频率的统计。它描述的是图像中色彩的组成,以及不同色彩在图像中所占的比例。颜 色直方图对于以观察轴为轴心的图像旋转、幅度不大的图像平移以及图像尺寸的变化不敏 感,这种特性使得颜色直方图比较适用于提取图像全局特征的场合。颜色直方图数学表示如下:H (k ) = nkNk = 0,1, 2,., L -1(1)其中 k 代表图像的特征取值,L 代表特征可取值的个数,nk 代表图像中具有特征值为 k的像素的个数, N 代表图像像素的总个数。 当图像的特征中有些值为空时,颜色直方图中会出现一些零值。这些零值的出现会对直方图相交的计算带来很大的影响,使得得出的值不能正确反映两幅图像之间的颜色

7、差别。采 用累积颜色直方图的方法可以减少一般直方图中零值的数量。假设颜色直方图中共有 L 种颜 色并且按照一定的顺序排列,记在第 i 种颜色上像素的数目为,则累积颜色直方图的数学表 示为:kC (k ) = H (i)i =1k = 0,1, 2., L 1(2)基于实验结果的对比,使用累积颜色直方图的效果要优于全局颜色直方图。因此,本文 采用累积颜色直方图作为图像的颜色特征之一。在颜色的表示方法上,我们选择的了符合人 的视觉感受的 HSV 颜色空间,它由三个分量组成,分别代表色调 H(hue)、饱和度 S(saturation) 和纯度 V(value)。我们分别对 H、S、V 三个分量进行

8、了 18、3、3 级量化,从而形成一个 162 维的特征向量。2.2 颜色矩无论是颜色直方图还是累积颜色直方图,在特征提取的过程中都丢失了颜色的空间分布 信息。而颜色的空间分布信息往往是决定图像内容的一个重要的因素,例如,图像中一片连 续的红色与一些分散的红色小点在视觉上的造成的差异是很明显的,但对于直方图来说,基 于频率的统计无法显示出这种区别。颜色矩很好地解决了这个问题,它是一种计算颜色的空间分布和像素的相关关系的特 征。颜色矩方法对图像中所有像素统计其在每种颜色分量上的一阶矩(均值)、二阶矩(方 差)和三阶矩(偏度),低阶矩表达了图像的颜色分布信息。颜色矩的三阶矩数学表示为:1 N一阶矩

9、:Ei = pijNj =1(3)N112iiji二阶矩: = ( p E )2 )(4)NN j =1113iiji三阶矩:S = ( p E )3 )(5)N j =1其中,pij 表示图像中第 j 个像素点的第 i 个颜色分量,N 代表图像像素的总个数。一般来说,只要 9 维就可以表示图像的颜色矩特征。因此,本文在计算图像颜色矩时, 在 HSV 空间中分别对三个通道计算一阶、二阶和三阶矩,从而形成一个 9 维的特征向量。2.3 灰度共生矩阵灰度共生矩阵是一种有效的图像纹理特征表示方法。这种方法研究了纹理的空间灰度级相关性,构造一个共生矩阵表示图像中相距 (x, y) 的两个灰度像素同时出

10、现的联合概率分 布。如果图像的灰度级为 N 级,则共生矩阵为 N N 矩阵,可以表示为 M ( x,y ) (h, k ) ,其 中位于 (h, k ) 的元素 mhk 表示一个灰度为 h 的像素,和另一个相距为 (x, y) 的灰度为 k 的像素对出现的次数。从灰度共生矩阵抽取出的纹理特征参数有以下几种。(1)反差2f1 = (h k )mhk(6)hk对于粗纹理区域,像素对趋于具有相同的灰度,mhk 的数值较集中于主对角线附近,此时 (h k ) 值较小,所以对应的 f1 值也比较小。而对于细纹理区域, mhk 的数值则散布在各处,所以对应的 f1 值比较大。(2)能量2f2 = mhkh

11、k(7)能量是图像灰度分布均匀性的度量,当 mhk 的数值分布较集中于主对角线时,说明灰度 分布较均匀, f2 值较大,含有较多能量。反之, f2 值较小,也即含有较少能量。(3)熵f3 = mhk log2 mhkhk(8)熵值是图像具有的纹理信息量的度量。如果图像中分布着较少的纹理, mhk 的数值较集 中时, f3 值较小。反之,若图像中充满着纹理, mhk 的数值较分散时, f3 值较大。(4)相关4 hkx y f = hkm x y(9) hk其中, x , y , x , y 分别为 mx , my 的均值和标准差, mx = mhk 是矩阵中每列元素k之和;my = mhk 是

12、矩阵中每行元素之和。相关量用来衡量矩阵中的元素在行的方向或列h的方向的相似程度,它是灰度线性关系的度量。本文采用灰度共生矩阵作为图像的纹理特征。首先将图片彩色值转化为灰度值,将其量化为 32 级,并构造 0,45,90,135四个方向的共生矩阵,然后分别计算四个共生矩阵的反 差、能量、熵、相关四个量,从而形成一个 16 维的特征向量。3支持向量机支持向量机(Support Vector Machine, SVM)6是一种基于统计学习理论的机器学习方 法,该技术建立在结构风险最小化原理的基础上,能够在样本数较少的情况下有效地处理分 类问题,并且具有良好的泛化能力。由于 SVM 在实际问题中出色的

13、学习能力,因此我们选 择 SVM 作为我们的图像分类学习机器。SVM 算法实质上是求解凸规则问题或其对偶问题二次规划问题,它的工作原理可以概 括为:寻找一个分类超平面使得训练样本中的两类样本点能够被分开,并且这些点距离该平 面尽可能地远。SVM 最基本分类问题,存在线性可分和线性不可分两种。3.1 线性可分情况在线性可分的情况下,会存在一个超平面使得训练样本完全分开,这个超平面的描述如 下:w x + b = 0其中,“ ”表示点积, w 表示 n 维向量, b 表示偏移量。(10)SVM 的基本思想如图 4.1 所示,图中圆形和方形代表两类分类样本,H 为分类超平面, H1 和 H2 分别为

14、过各类中离分类面最近的样本且平等于分类面的超平面,它们之间的距离称 为分类间隔(margin)。SVM 的目标是找到一个最优超平面,最优超平面要求分类面不仅能 将两类样本正确分开,并且还使得两类的分类间隔最大。图 1 最优超平面示意图2Fig1 Optimal Hyperplane最优超平面通过下面的二次优化问题来解决:满足约束条件:min (w) = 1 w2(11)yi (w xi + b) 1, i = 1, 2,., n利用 Lagrange 优化方法可以将此二次规则问题转化为其对偶问题。nn(12)max W ( ) = 1 y y ( x , x )(13)2 ii =1i , j

15、 =1i j i jij满足约束条件:最终的分类函数为:n yii = 0,i 0, i = 1, 2,., ni =1(14)nf ( x) = sgn w x + b = sgn i yi ( xi x) + b i =1(15)式中求和实际上只对i 0 的样本才起分类作用,这些样本称为支持向量。 b阀值,对任一个支持向量求导,或对中任意一对支持向量取中值可得。是分类3.2 线性不可分情况对于线性不可分的情况,可以通过非线性变换将样本映射到一个高维特征空间,并在此 特征空间中运用原空间的函数来实现内积运算。由于在高维空间中实际上只涉及到训练样本 之间的内积运算,根据泛函理论,只要一种核函数

16、满足 Mercer 条件就可以对应某一空间中 的内积,因此只要在最优超平面的上采用适当的核函数就可以解决线性不可分的分类问题。 此时目标函数变为:nnmax W ( ) = 1 y y K ( x , x )(16)相应的分类函数也变为:2i =1ii , j =1 ni j i jijf ( x) = sgn i yi K ( xi x) + b i =1 (17)SVM 中不同的核函数有不同的分类效果,目前研究得最多的核函数主要有以下三类:ii(1) 多项式核函数 K ( x, x ) = s( x, x ) + cq ,其中 q 是多项式的阶数(18)2(2) 径向基核函数 K ( x,

17、 x ) = exp (x, x)(19)ii(3) Sigmoid 函数 K ( x, xi ) = tanh ( s( x, xi ) + c )4综合特征提取(20)在模式分类中,多特征的融合策略可归纳为两类7:早期特征融合(Early Feature Fusion) 和晚期特征融合(Late Feature Fusion)。早期特征融合又称为“特征层融合(feature-level fusion)”,指的是将不同的特征组合为一个特征向量,然后利用分类器进行识别。晚期融合 又称为“语义层融合(semantic-level fusion)”,指的是分类器先分别识别独立的特征向量, 然后再融

18、合独立识别的结果。后期特征融合的方法极大地依赖于分类器对单个特征进行识别的结果,然而单个特征往 往不具备足够的信息,这就造成了分类器的识别不准确,融合后的结果也不可靠。 所以, 本文采用前期特征融合的方法,将颜色、纹理两个特征组合成为一个特征向量,这就保证了 在分类时能充分利用颜色和纹理特征的互补性。由于颜色特征和纹理特征物理意义不同,取值范围相差较大,因此不直接具有可比性。 为了使综合特征的各个特征向量在相似距离计算中的地位相同,首先需要对特征向量进行归 一化。本文在分别提取出颜色和纹理特征后,对综合特征进行了高斯归一化8处理。假设图像的特征向量表示为 v ,则 v 由三部分组成:颜色直方图

19、向量 vh 、颜色矩向量 vm和纹理特征向量 vt 。在特征融合时,我们提出了一种结合支持向量机的新的特征融合方法, 这种方法将颜色直方图、颜色矩和纹理三种低层特征融合在一起。支持向量机使用如式(18) 所示多项式核函数,但是我们改善了核函数的内积计算方法,在相似距离计算时,特征 v1 和v2 的内积计算如下如示:v v= 1 v1h v2 h+ v1m v2 m+ v1t v2t (21)123 v1hv2 hv1mv2 mv1tv2t 这种特征融合方法使得两种颜色特征以及纹理特征对分类的贡献相等,实验证明,这种 方法比其它的特征融合方法更简单有效,实验详见下节。5实验结果以及分析实验采用的

20、图像数据集是华盛顿大学的 Ground Truth Database。我们从中选取了 966 幅 图片,分成天空、海洋、森林、狮子、花朵和草地六个类别,每个类别以 2:1 的比例分别用 作训练和测试。我们采用颜色、纹理特征作为输入向量,改写了台湾大学林教授的 LIBSVM(http:/www.support- 我们通过计算分类正确率来验证不同分类方法的有效性,正确率的计算公式如下:正确分类的样本数分类正确率=全部样本数表 1 显示了采用不同方法分类的分类正确率。第一行和第二行显示的分别为仅采用颜色 特征和仅采用纹理特征的分类方法。第三行显示的为采用简单串联颜色和纹理特征成为一个 特征向量的分类

21、方法9 。第四行显示的是采用主成分分析法10 (Principal Component Analysis)方法对特征向量降维,将特征向量维数缩减至原来的 75的分类方法。第五行显 示的是本文提出的特征融合方法,它与第三种方法在特征表示上是相同的,不同的是支持向 量机核函数的内积计算方式。表 1 五种方法分类正确率的比较Tab.1 Accuracy comparison of five classification methods分类方法正确分类图像数量分类正确率仅颜色26782.8仅纹理25579.3颜色+纹理26582.3PCA25378.3本文的方法27184.3从上表可以看出我们提出的特

22、征融合方法比单个特征方法或其它的特征融合方法正确率更高。这说明,采用单个特征不能有效地表示图像的全局特征,因此在分类时具有局限性。 另外,简单串联特征向量的方法的分类效果也不同本文中的方法,这是因为图像的颜色特征 的维数较大地超过了纹理的维数,因此在分类时颜色特征更占优势。而本文提出的方法使得 纹理和颜色在相似距离计算中贡献相同,因此比简单串联的方法更有效。最后,采用主成分 分析的方法在降维时损失了一定的特征信息,因此分类正确率相对较低。6总结本文提出了一种利用综合特征分类图像的方法,其中颜色特征用颜色累积直方图和颜色 矩来表示,纹理特征则以灰度共生矩阵为基础。在综合颜色和纹理特征作为 SVM

23、 的输入时, 首先对这两个特征进行了高斯归一化,然后改写了 SVM 中内积的计算公式。实验表明,融 合后的特征比单一特征分类具有更高的正确率,并且,我们提出的方法比其它特征融合的方 法更加有效。下一步我们将把这种方法应用到更多类别的数据集中。另外,我们还要考虑利 用图像的局部信息,例如引入图像分割方法,提取图像中显著对象等方法。参考文献1 V.N. Gudivada, V.V. Raghavan. Content-based image retrieval systemsJ. IEEE Computer, 1995, 28(9)s:18- 31 2 A. Vailaya, M.A.T. Fig

24、ueiredo, A.K. Jain and H.J. Zhang. Image classification for content-based indexingJ. IEEE Transactions on Image Processing. 2000. 117130.3 董卫军,周明全,耿国华. 基于综合特征的图像检索技术研究J. 计算机应用与软件, 2005, 22(11): 34- 364 J. Yang, J.Y. Yang, et al. Feature fusion: parallel strategy vs. serial strategyJ. Pattern Recogni

25、tion. 2003.1369-13815 章毓晋. 基于内容的视觉信息检索M. 北京: 科学出版社. 2003, 56 Nello Cristianini 等. 支持向量机导论M. 北京: 电子工业出版社, 2005,17 J.R. Smith, et al. Integrating features, models, and semantics for TREC videoC. NIST Special Publication500-200: The Tenth Text REtrieval Conference (TREC 2001), 2001. 2402498 M. Ortega,

26、et al. Supporting similarity queries in MARSC. Proceedings of the ACM Multimedia. 1997, 4034139 M.R. Naphade, J.R. Smith. Learning visual models of semantic concepts. Proceedings of the IEEE ICIP 2003,200310 Richard O. Duda 等. 模式分类M. 北京: 机械工业出版社, 2003.9Image Classification Method Based on SVM UsingC

27、ombined Image FeaturesWu Hui1,Li Renfa21 College of Computer and Communication, Hunan University, Changsha (410012)2 College of Computer and Communication, Hunan University, Changsha (410012)AbstractSemantic image retrieval has become a crux to bridge the “semantic gap” between low-level featuresand

28、 abundant semantics delivered by images. In order to further comprehend these semantics, we propose an image classification method based on support vector machine which takes color and texture feature as input. Furthermore, we bring forward a new method of combining color and texture in image classification. Experimental results suggest that our method performs better than single-feature method as well as other combined-feature method.Keywords: Image Classification; Combined Feature; Support Vector Machine作者简介:伍卉,女,1984 年生,碩士研究生,主要研究方向是图像处理和模式识别。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号