基于LBP纹理特征的图像检索系统毕业论文.doc

上传人:文库蛋蛋多 文档编号:3938701 上传时间:2023-03-28 格式:DOC 页数:39 大小:5.47MB
返回 下载 相关 举报
基于LBP纹理特征的图像检索系统毕业论文.doc_第1页
第1页 / 共39页
基于LBP纹理特征的图像检索系统毕业论文.doc_第2页
第2页 / 共39页
基于LBP纹理特征的图像检索系统毕业论文.doc_第3页
第3页 / 共39页
基于LBP纹理特征的图像检索系统毕业论文.doc_第4页
第4页 / 共39页
基于LBP纹理特征的图像检索系统毕业论文.doc_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《基于LBP纹理特征的图像检索系统毕业论文.doc》由会员分享,可在线阅读,更多相关《基于LBP纹理特征的图像检索系统毕业论文.doc(39页珍藏版)》请在三一办公上搜索。

1、题目:基于LBP纹理特征的图像检索系统 院(系) 计算机科学与技术学院 专 业 软件工程 届 别 2008届 学 号 0825121037 姓 名 指导老师 指导老师职称 副教授 华侨大学教务处印制 2012年5 月摘 要随着计算机网络的飞速发展和多媒体编码技术的进步,网络上的资源日益丰富,尤其是直观的形象的多媒体信息备受人们的亲睐基于内容的图像检索,即(CBIR)。CBIR的核心是使用图像的可视特征对图像进行检索。纹理分类与分割是图像处理领域一个经久不衰的热点研究领域,纹理特征提取作为纹理分类与分割的首要问题,一直是人们关注的焦点,各种纹理特征提取方法层出不穷。局部二元模式(LBP)是一种灰

2、度范围内的纹理描述方式,它从一种纹理局部近邻定义中衍生出来。本文实现了恒定的基础局域二值模式和旋转不变的局域二值模式两种纹理特征提取方式。通过LBP纹理图生成灰度直方图,计算灰度直方图之间的欧式距离以完成图像检索比对。本文采用VC+6.0环境下MFC项目导入OpenCV图像处理函数库设计了检索系统实现基于LBP纹理特征的图像检索。在(加利福尼亚理工学院256类图像数据库)及(Queensland大学分类的brodatz自然纹理图像库)下进行测试并对结果进行分析与讨论。关键字: CBIR;LBP特征提取;图像识别ABSTRACTAlong with the rapid development o

3、f the computer network and multimedia code technology progress, the network resources are increasingly rich, particularly intuitive image of the multimedia information is peoples pro-gaze content-based image retrieval, namely (CBIR). The core of the image is used CBIR the visual features to do image

4、 retrieval. Texture classification and segmentation image processing area is a hot research field of enduring, texture feature extraction and segmentation texture classification as a priority, and has been the focus of attention, all kinds of texture feature extraction method are endless. Local Bina

5、ry Patterns is a gray within the scope of the texture description way, it from a different texture Local neighbors in the definition of derivatives. This paper realized the constant based Local Binary Patterns and rotation invariant of Local Binary Patterns two texture feature extraction method. Thr

6、ough the LBP texture map generating gray-level histogram, calculation of gray histogram Euclidean distance between to complete than image retrieval. This paper using vc + + 6.0 environment MFC project launch OpenCV image processing function library design the retrieval system based on texture featur

7、e LBP image retrieval. In (the California institute of technology 256 kinds of image database) and (Queensland university of classification brodatz natural texture images library) test and the results are analyzed and discussed.keyword: CBIR, LBP feature extraction, image recognition目录摘 要IABSTRACTII

8、1 绪论11.1 研究背景11.2 基于内容的图像检索11.2.1 基于内容的图像检索概述11.2.2 基于内容的图像检索体系结构21.2.3 基于内容的图像检索的特点41.2.4 基于内容的图像检索性能评价51.3 图像检索的国内外研究现状61.4 图像检索的优缺点级展望81.5 本论文结构92 基于纹理的图像检索92.1 基于纹理的图像检索92.2.1 发展与现状92.2.2 纹理的定义112.2 局域二值模式122.3 基本LBP132.4 旋转不变LBP142.5 本章小结163 基于LBP的纹理图像检索173.1 开发平台介绍193.2 系统流程图173.3 主要流程解释183.4

9、图像检索算法183.5 系统实现193.5.1 系统窗口93.5.2 系统主要算法114 实验结果及分析244.1 基于Brodatz纹理图测试194.2 基于Caltech 256类图像数据库纹理图测试174.3 图片旋转检索测试185 结论33参考文献:29致谢词:301 绪 论1.1 发展与现状随着互联网技术以及多媒体技术的迅速发展,多媒体数据(包括图像和视频)急剧增长,这为人们提供了一个取之不尽、用之不竭的信息源。而如何在浩如大海的多媒体信息世界中快速、准确得获得自己所需要的内容,己成为当前信息领域的重要课题。图像作为一种内容丰富、表现直观的多媒体信息,具有文字信息所无法替代的丰富内涵

10、和强大的描述能力,长久以来都受到人们的青睐,是日常生活中不可缺少的信息来源。随着科学技术的快速发展,计算机技术、通信技术、多媒体技术的迅速发展以及互联网的普及,多媒体信息源不断扩大,每天都会产生各式各样以千兆字节计数的图像信息。各行各业对图像的使用越来越广泛,研究也越来越深入,比如数字图书馆系统、遥感系统、医学图像管理、商标版权保护等。各种庞大的图像数据库的建立,使得人们对图像信息检索的需求与日俱增。图像信息资源的统筹管理与高效检索显得日益重要。自从上世纪70年代以来,随着计算机视觉和数据库两大研究领域技术的飞速发展,图像检索技术逐渐成为了一个重要而活跃的研究领域。但是,在这个领域仍然有许多技

11、术不够完善或尚待解决。因此,研究此课题既具有重大的意义,同时又面临严峻的挑战。1.2 基于内容的图像检索1.2.1 基于内容的图像检索概述在传统的图像检索中,通常采用的是基于关键字的图像检索技术1。该技术通过提取图像的文件名或者周边文字,建立图像索引。当用户输入关键字进行检索时,系统将输入的关键字与图像索引进行匹配,返回相应的结果该技术也被称为“字找图”。目前,互联网上众多实用化的搜索引擎如百度、Google等采用的就是基于关键字的图像检索。但是,该技术需要大量的人力对图像进行人工标注,并且人工标注无法准确描述蕴藏在图像中的丰富内容,而且还具有一定的主观性。为了弥补传统的图像检索技术的不足,基

12、于内容的图像检索(Content Based ImageRetrieval,CBIR)应运而生2。该技术通过提取图像的低层视觉特征(如颜色、纹理、形状等),对图像建立索引。用户可通过提供示例图或构造草图、轮廓等多种方式提出查询要求。系统对示例图和图像库中的图像进行匹配,根据相似度的大小决定查询结果的排列顺序。该方法被形象的称为“图找图”。1.2.2 基于内容的图像体系结构一个CBIR系统的基本组成如图11所示系统包括特征提取模块、索引模块、匹配模块以及相关反馈模块。图1.11. 特征提取模块所谓特征提取,就是对图像进行分析,提取出感兴趣的、可以反映图像内容的、并且适合于检索的特征,是CBIR系

13、统的核心内容现有检索系统所提取的内容特征大多包括颜色、纹理、形状、轮廓和空间位置关系等。2. 索引模块一幅图像可以用多种特征来描述,而每种特征又有可能由多个特征分量所组成,因此最终得到的图像特征的维数可能比较高。为了满足用户对检索系统实时性的需要,需要选择一种适合于多维检索的索引算法。目前,图像数据库索引技术主要包括:向量空间的索引(Spatial Access Methods,SAM)和度量空间的索引(Metric Access Methods,MAM)。3. 匹配模块基于关键字的图像检索一般基于精确的匹配,而基于内容的图像检索采用的是相似度匹配。图像的相似度实质上是图像对应的特征之间的相似

14、度。合理的相似度度量方式也是实现高效的图像检索的关键。不同的相似度度量方式有各自的优缺点,并非某一种度量方式适用于所有的图像检索系统。常用的相似度度量方式有Minkowski距离、二次式距离、直方图相交法、KL距离等,具体形式如下:设查询图像的特征向量为g,目标图像的特征向量为t,特征维数为M,D表示查询图像与目标图像之间的相似度。 (1)Minkowski距离 (1.1) 其中,取1、2时分别就是我们所熟知的绝对值距离和欧氏距离(Euclidean distance)。(2)马氏距离(Mahalanobis distance) (1.2)其中,为特征向量的协方差矩阵。(3)直方图相交法假设和

15、为含有M个bin的直方图,则二者之间的相交距离为: (1.3)(4)二次式距离对于基于颜色直方图的图像检索,二次式距离考虑到了不同颜色之间的相似度,因此比欧氏距离或直方图相交距离更有效。两个颜色直方图和含有M个bin,则二者之间的二次式距离为: (1.4)其中,A为颜色相似性矩阵。 (5)KL距离 (1.5)4相关反馈模块由于CBIR主要是针对图像的低层视觉特征进行提取和匹配,而低层视觉特征和高层语义之间存在较大的差距,即“语义鸿沟”,从而使得检索结果往往不尽如人意。为此,人们提出了相关反馈(Relevance Feedback,RF)技术来改善检索结果。相关反馈技术的核心内容是小样本学习问题

16、尽管该技术可以有效的改善曙义鸿沟”,但现实生活中的用户大多不愿对大量的图像进行标注,因此如何在样本个数较少的情况下,准确、迅速得捕捉用户需求己成为相关反馈技术的核心任务。1.2.3 基于内容的图像检索的特点基于内容的图像检索技术旨在通过对图像进行合理的描述,从而帮助用户更快捷、更准确地找到所需要的多媒体信息。该技术的研究涉及了诸多学科领域,比如人工智能、计算机视觉、模式识别、信号处理、数据库、认知心理学、人机交互等,具有重要的理论意义和广泛的应用前景。此外,CBIR系统还具有如下特点:1 直接从图像的内容中提取信息。它突破了传统的基于文本检索的局限,直接对图像进行分析和提取特征,利用这些特征对

17、图像进行描述并建立相应的索引。2 基于内容的图像检索采用的是近似匹配。这一点与传统检索所采用的精确匹配有着明显的区别。3 提取特征和建立索引都是由计算机自动完成,不仅避免了人工描述的主观性,还大大减少了工作量。4 具有很强的交互性。系统采用相关反馈,通过用户的评价来修正检索方法,从而使得检索结果更加符合用户的需求。整个检索过程是一个用户有限次的反馈和检索结果逐渐逼近最优结果的过程。1.2.4 基于内容的图像检索的性能评价CBIR系统的性能评价标准是CBIR系统的一个重要研究内容,指导和推动该系统的研发。针对图像检索领域的不同问题,研究人员不断得提出新的特征提取方法、相似度度量方式以及索引机制等

18、,期望可以提高系统性能。然而目前对于不同的图像检索系统,还没有统一的评价标准来衡量系统性能的优劣。图像检索系统的性能评价主要考虑计算复杂度和检索效率两个方面。计算复杂度指的是提取特征的计算时间和特征匹配的时间,其中特征匹配的计算复杂度是决定一个系统是否快速的关键。检索效率主要取决于系统选取的特征的区分能力以及匹配算法的有效性。基于以上两方面的考虑,目前的评价方式大致可以分为两类:第一类充分考虑人的主观视觉感受,这类方法主要是显示一系列的检索结果图像,由人的感受来评价检索结果的好坏。这种评价方法具有一定的个性和主观性,说服力有限,并且不利于交流。第二类方法是基于量化的方式。这类方法是根据统计得到

19、的结果,具有一定的通用性。常用的评价标准有以下几种3:1查全率(Recall)查全率指返回的检索结果中有效图像占整个图像库中所有相似图像的数量的比率,用于检测系统检索相关图像的能力。 (1.6)其中,为检索出的相似图像的个数,为未检索出的相似图像的个数。2查准率(Precision)查准率指返回的检索结果中有效图像的比率,用于检测系统排除无关图像的能力。 (1.7)其中, 为检索出的相似图像的个数,为检索出的不相似图像的个数。3误匹配率(Fallout)误匹配率指返回的检索结果中无效图像占整个图像库中所有不相似图像的数量的比率,用于检测系统检索不相关图像的能力。 (1.8)其中,为检索出的不相

20、似图像的个数,为剩余图像个数(,为图像总数)。查全率的主要含义是在一次查询过程中,用户所查到的相关图像的数目和数据库中与目标图像相关的所有图像数目之比;而查准率主要指在一次查询过程中所查到的相关图像数目同该次查到的所有图像数目之比。用户在评价算法的时候,可以预先选定含有特有目标的图像作为一组相关的图像,然后根据返回的结果计算查全率和查准率。查全率和查准率越高,说明该检索算法的效果越好。用查全率R作为x 轴,查准率P 作为y 轴,绘制一条查准率-查全率曲线,简称为PVR曲线。设PVR曲线为,则与-轴围成的面积为: (1.9) 称为PVR指数。据研究,该指数越大,图像检索性能越好。由此可以看出,查

21、全率反映检索的全面性,而查准率则反映检索的准确性,因此可以用查全率和查准率来评价系统的有效性。该方法的局限性在于没有考虑检索结果中相似图像所处的位置,同时,高的准确率与查全率并不一定表明一个系统工作得好,这还要视具体的应用而定。1.3 图像检索的国内外研究现状图像检索系统可以提供一个友好的人机交互界面,以便于用户快速准确得查找所需图像。交互界面的设计综合了数据库、图像处理、计算机视觉、模式识别、人工智能等多种技术。目前,人们已经开发了一些供商用的或研究用的图像检索系统。其中比较有影响的系统有QBIC、Virage、Photobook、VisualSEEK、WebSeek、MARS等。QBIC(

22、Query by Image Content) 4是由IBM公司20世纪90年代研究开发的著名的商用CBIR系统,该系统对后来的图像检索系统具有深远的影响。QBIC系统可以实现基于颜色、纹理和形状的检索。其中,颜色特征的提取主要采用的是颜色直方图,纹理特征的提取采用的是粗糙度、对比度和方向性的结合,而形状特征采用的是离心率、主轴方向和代矩等。此外,QBIC系统还支持基于文本的关键字的查询方式。Virage5是Virage公司开发研制的一种基于内容的图像检索搜索引擎。与QBIC系统相类似,该系统也支持基于颜色、颜色布局、纹理和形状等视觉特征的查询。此外,Virage系统还支持以上四种特征的任意组

23、合,并且用户还可以根据需要对不同的特征赋予不同的权值来改善检索结果。Virage弓I擎及其在图像对象层上的操作是Virage技术的核心,该引擎既可以应用到通用的图像查询系统中,还可以对其进行扩展并应用到特定的领域或场合。Photobook6是MIT媒体实验室研发的图像检索系统。该系统包括三个子部分,分别用于提取形状、纹理和人脸特征。用户可以在这三个部分分别按照特定的特征进行检索。Photobook系统的人脸识别技术也被成功应用到了美国的警察机关。为了便于用户的浏览和检索,该系统提供了一些交互式工具。比如提供了多种相似度度量方式,使得用户可以选择一种或几种算法的线性组合来计算图像的相似度。此外,

24、用户还可以勾画兴趣区域,参与特征提取过程。VisualSEEK7和WebSEEK都是美国哥伦比亚大学研发的检索系统。其中前者支持基于视觉特征及其空间关系的查询,而后者是面向Web的查询系统。系统利用图像区域的空间位置关系和从压缩域提取的视觉特征进行检索,而视觉特征是颜色特征和基于小波变换的纹理特征。为了提高检索的速度,系统采用了二叉树索引技术。MARS8是美国伊利诺斯大学Urbana Champaign分校研发的多媒体分析和检索系统。该系统引入了相关反馈机制,根据用户的反馈,优化查询结果,提高了检索效率。此外,还有斯坦福大学与滨州大学研发的SIMPLicity,加州大学Berkeley分校开发

25、的基于区域的图像检索系统Blobworld,以及加州大学伯克利分校所研发的Chabot等。近年来我国的研究人员越来越重视基于内容的图像检索系统的研发,相关单位也开发了不少各具特色的检索系统。由中国科学院计算技术研究所和北京图书馆共同研发了基于特征的多媒体信息检索系统MIRES,该系统可以方便的接入Internet,对图像和中文全文进行检索对图像提取颜色、纹理、形状进行检索,对中文全文进行的检索具有布尔检索、截词模糊匹配检索、完全字符串匹配检索等多种检索方式。该系统现在已经在北京图书馆、科学数据库、计算机学报、测绘研究院等单位得到了初步应用。清华大学计算机系于1997年研究开发了一个以Inter

26、net浏览器为平台的基于内容图像检索系统ImgRetr。该系统提取主颜色、颜色直方图、颜色分布、纹理特征、轮廓特征和主题词来对图像进行描述,在SS一树的基础之上提出了一种通用相似索引树,以此作为储存特征的底层相似索引结构。iFind9系统是微软亚洲院研发的一个结合语义和视觉特征的图像相关反馈检索系统,该系统通过图像的标注信息构造语义网络,并在相关反馈中与视觉特征进行结合,在基于内容的图像检索中取得了比较理想的效果,具有一定的应用价值。总之,CBIR技术是一个方兴未艾的研究领域,虽然已有不少的原型系统,然而随着科技的迅猛发展,许多问题仍需进一步的探索。CBIR技术依赖于数据库、图像处理、模式识别

27、等多个研究领域的发展,同时也将对其产生深远的影响,是一个很有发展前途的研究方向。1.4 基于图像检索的优缺点及展望网页搜索是基于文本的搜索,本身就是语义的一个直接表达,在文本中得到了直接的体现,所以搜索的技术相对比较简单,经过这几年的发展已经挺成熟了(至少在使用上是这样的感觉)。图片的搜索相对起步较晚些,且难度比较大。其中原因有很多:在早期的时候图片的数量远远少于文字(毕竟文字是信息的主要载体),但是随着社会进步,互联网的发展,多媒体在近几年得到了迅猛的发展,其中图片的量是爆炸式的增长。各类的视频分享网站的出现就是一个信号。基于人工标记的图片搜索已经远远跟不上人们的需求,而且如何有效的标记一张

28、图片便于搜索也是一个问题(你的标记是否是最贴近用户的想法)。举一个简单的应用例子,假如你看到一件衣服,很喜欢,但是不知道他叫什么,那么你去网络商城上搜索,根本无从下手。而如果基于内容的图像检索,这个问题就可以得到解决。他可以相对的准确的找出你想要的。当然这只是生活中的一个很小的事情。简单的说想对于传统的文本图像检索,基于内容的图像检索更为直观。个人觉得随着多媒体的迅猛发展,基于内容的图像检索必将有很大的发展空间和前景。1.5 本论文的结构安排第一章为绪论,介绍了图像检索的研究背景和意义,简要介绍了基于内容的图像检索的体系结构、特点、性能评价,以及图像检索的国内外研究现状,同时说明了本论文的内容

29、结构安排。第二章主要介纹理图像检索和局部二值模式的相关理论。第三章 对系统的主要模块及其算法进行分析。第四章对LBP纹理检索系统进行测试性能评价。2 基于纹理的图像检索2.1 基于纹理的图像检索2.2.1 发展与现状纹理是图像的重要特征之一在图像分析,识别及图像检索中起到非常重要的作用20世纪70年代以前出现了自相关函数法10功率谱方法,和一些与各种灰度频率相关的方法等。这些方法取得一定成功,但是没有具体的定义、描述或纹理模型,仅仅是某种数学变换。另外还有一些提取纹理特征的方法,也仅限于提取特定的图像属性,如纹理粗糙度,纹理直线性等。1966年, Brodatz给出了很多纹理图像的例子,即所谓

30、的Brodatz纹理库,成为后来人们研究纹理的重要数据源。20世纪70年代,最有代表性的是Haralick对纹理的分析和理解以及提出的纹理特征提取方法,为后续的纹理研究提供了理论支持和技术积累。1973年, Haralick在利用陆地卫星图像研究美国加利福尼亚海岸带的土地利用问题时,开创性地提出著名的GLCM,它在纹理分析中是一个很好的方法,广泛用于将灰度值转化为纹理信息。此外,这个阶段出现的方法主要还有灰度行程长度法、灰度差分统计法 ,自回归模型法等,这些方法在纹理分类中有一定效果,但是这些方法的后继研究很少,在实际应用中也较少采用。从20世纪80年代以来,MRF理论在纹理分析中掀起一阵热潮

31、,为纹理特征提取找到了一个新的方向,尔后相继出现了MRF模型、Gibbs模型、高斯马尔可夫随机场( GMRF)模型、同步自回归模型( SAR) 、隐马尔可夫随机场模型(HMRF) 、广义MRF模型和多分辨率MRF等等。同时,分形理论也为提取纹理特征注入了新的活力。1984 年,Pentland等人在这方面做了开创性的工作,指出分形模型非常适用于描述纹理图像。后来更多学者将分形用于纹理分类,以分数维来描述图像区域的纹理特征。其中引人瞩目的是Chaudhuri 和Sarker提出了差分计盒算法,这是一种简单、快速、精度高的分形维数计算方法,也是目前用得较多的一种方法。随后, Kapan等人提出了非

32、常吸引人的扩展分形特征。90年代以后,人们发现传统的纹理分析方法的一个瓶颈在于不能从多尺度有效描述纹理特征。小波理论的出现为时频多尺度分析提供了一个更为精确而统一的框架。小波变换提供了一种在不同尺度上研究分析图像纹理细节的工具,为更精细地进行图像纹理分类和分析提供了新思路,在纹理分析中具有广阔的发展空间。1989年,Mallat首先将小波分析引入纹理分析中之后,随之基于小波的纹理分析方法如雨后春笋般涌现出来。随着小波理论的发展,小波在纹理特征提取中的应用也不断发展。小波理论发展的许多分支,如多进制小波、小波包以及小波框架等等,它们均在图像纹理分析中发挥了积极的作用。如Chang等人提出的基于树

33、结构小波的纹理分类方法, Unser研究的基于小波框架的纹理分类方法。近年来,较引人瞩目的是Tojala等人于1996年提出的局部二进制模式(LBP) ,该方法分析纹理的吸引人的地方在于其计算复杂度小,具有多尺度特性和旋转不变特性,在纹理检索领域得到应用。总的来讲,纹理特征提取在国际范围内呈现更加灿烂的局面,一方面,人们对已有经典的纹理特征提取方法进行深入研究与扩展;另一方面,新的纹理特征提取方法以及纹理特征提取方法的融合亦在蓬勃发展,主要集中在纹理多尺度特征、旋转不变特征的提取以及纹理特征的选择与融合,如GLCM与MRF的融合,小波方法与MRF的融合等等。2 图像纹理应用2.2.1 纹理的定

34、义纹理的定义一直为人们所关注,但是,图像纹理定义问题至今没有得到圆满的解决,仍然不存在为众人所公认的定义,这正是由于图像纹理形式上的广泛性和多样性所造成的, 从而也使得研究者针对不同的应用提出了自己的概念与定义。下面是几个具有代表性的定义:定义111 纹理是一种反映像素的空间分布属性的图像特征,通常表现为局部不规则而宏观有规律的特性。定义210 如果图像内区域的局域统计特征或其他一些图像的局域属性变化缓慢或呈近似周期性变化,则可称为纹理。定义3 纹理就是指在图像中反复出现的局部模式和它们的排列规则。定义4 纹理被定义为一个区域属性,区域内的成分不能进行枚举,且成分之间的相互关系不十分明确。定义

35、512 纹理是一种反映图像中同质现象的视觉特征,体现了物体表面共有的内在属性,包含了物体表面结构组织排列的重要信息以及它们与周围环境的联系。定义6 纹理具有三大标志:某种局部序列性不断重复、非随机排列和纹理区域内大致为均匀的统一体。定义1从物质的组成及人类对物体的视觉感知的角度审视纹理。定义2中,局部属性的集合可以理解为一些基元类型和它们的空间关系,这个定义的一个重要部分是属性必须在恒定的纹理区域内重复出现。定义3通过纹理基元的局部模式的数目和类型以及它们的空间关系来描述纹理。其余定义都强调了随机性、重复性、规律性等特征并存于纹理。总之,上述诸定义都是基于特定应用背景的,其中的共识是: 纹理不

36、同于灰度和颜色等图像特征,它通过像素及其周围空间邻域的灰度分布来表现,即局部纹理信息; 局部纹理信息不同程度的重复性,即全局纹理信息。对纹理的认识或定义决定了纹理特征提取采用的方法,由于难以对纹理给出一个精确和统一的定义,不能对纹理做出完整的表达,一方面使纹理分析中的问题更为错综复杂、更具有挑战性;另一方面,图像的研究者们不断引入各种模型从不同侧面来描述纹理的多种属性,使得对纹理的研究缤纷多彩。2.2 局域二值模式局部二值模式(Local Binary Pattern,LBP) 13-15是由Tojala等在1996年提出的,由于理论、计算简单,因此受至U-J许多研究者的青睐,被广泛应用于图像

37、处理领域LBP可以刻画邻域内像素点的灰度相对于中心点的变化情况,注重像素灰度的变化,符合人类视觉对图像纹理的感知特点,是一种有效的纹理图像描述子。LBP严格来讲是一种特征提取方式。就特征提取方式而言,目前最成熟最常用的是gabor特征。这两种特征,gabor效果更加鲁棒,lbp的特点是运算速度快,便于在嵌入式等平台运行。一般如果条件允许,二者会进行结合,包括定义结合特征(比如LGBP,LGXP等),特征级融合和决策级融合。而影响人脸识别算法最终效果的因素还包括:鉴别特征提取方式(主流是PCA+LDA),特征点定位精度(眼睛定位或脸部器官轮廓特征点定位),以及最终距离的计算方式(欧式,MQDF,

38、以及各种融合,和阈值机制)。对于LBP本身,是一种纹理描述方法,在纹理分类,特征表示,物体检测等领域都有应用。此外,lbp本身还有很多变种,包括block-based lbp(lab),volume lbp(在相邻帧时域进行编码)等,是一种使用简单,运算速度快的特征,有很多应用。2.3 基本LBP首先定义局部纹理模式为图像局部区域内个像素点的灰度值的联合分布: (2.1)其中,是局部区域的中心像素的灰度值,则代表中心周围的像素点灰度值,这些邻近像素距离中心像素为,等距离成环形对称分布,如图2.1所示。图2.1对于一个包括1个中心像素和8个邻域像素的33窗口,以中心像素的灰度值为闽值,将其邻域的

39、8个灰度值与阈值进行比较,小于阈值的像素用0表示,反之用1表示然后顺时针方向读出8个二进制数值,作为该中心像素的特征值。具体过程如图22所示,其中,pattern=10001111;LBP=1+16+32+64+128=241。图2.2这个点的像素的lbp算子就是241。为计算和表达方便,将局域纹理模式的二值编码转化为一个实数编码:(2.2)其中=8,=1。2.4 旋转不变LBP当图像旋转后,领域的像素仅仅围绕中心像素转过一定角度,排列顺序没有改变,相应的灰度差分也没有变化,但因为坐标系没有旋转,所以二值编码中的0和1就要环形移动,如图2.3所示。实际上,这些模式应该视为相同的模式,为消除图像

40、旋转带来的影响,实现旋转不变性,调整式为: (2.3)图2.3当P=1,R=8是原来的256个二值模式被压缩为36个具有旋转不变性的二值模式。这些模式不是等概率出现的,差异很大,有些模式出现的几率非常高。所以我们把有部分模式出现的几率非常高的模式独立出来,它们代表了纹理的一些基本属性,或基本特征。这些模式有一个共同的特点:具有很少的空间结构的阶跃,即在环形的二值编码中,从0变为1或从1变为0的次数很少。图像旋转后由于插值的原因会造成像素灰度值的改变,进而导致二值编码发生变位。由于结构的特点,这些恒定二值模式相对于其它的二值模式,发生变位的几率要小的多。因此这些恒定二值模式可以看作纹理的微结构。

41、 图2.4局域纹理的恒定与非恒定二值模式()为了再次调整LBP计算公式(2.2),首先定义一个“恒定”度量,即计算环形二值编码中的0/1阶跃次数:(2.4)然后选择“恒定”度量不大于的模式作为恒定二值模式。为保证灰度尺度与旋转不变性,调整式(2.2)为(2.5)通常,。这样,原始的个二值模式就压缩为个恒定二值模式和一个非恒定二值模式,而且具有灰度与旋转不变性。2.5 本章小结显而易见的是,上述提取的LBP算子在每个像素点都能够获得一个LBP“编码”,那么,对一幅图像提取其原始的LBP算子尔后,获得的原始LBP个性依旧是“一幅图片”。不过,这里我们曾经将物体从图片(图片能够会意为物体在原始测量空

42、间获得的测量个性)转换为二次个性,也即便获得了我们等闲说的“个性”。不过,这个所谓的“个性”并不能直接用于分辨分析。因为,从上面的分析我们能够看出,这个“个性”跟位相消息是紧凑相干的。所以在这里我们就提取原始LBP个性图片的灰度直方图。计算每个像素值所含的个数,用灰度直方图进行相似度比对。3 基于LBP纹理的图像检索系统3.1 开发平台介绍VC+6.0 Visual C+ 6.0,简称VC或者VC6.0,是微软推出的一款C+编译器,将“高级语言”翻译为“机器语言(低级语言)”的程序。Visual C+是一个功能强大的可视化软件开发工具。自1993年Microsoft公司推出Visual C+1

43、.0后,随着其新版本的不断问世,Visual C+已成为专业程序员进行软件开发的首选工具。虽然微软公司推出了 Visual C+.NET(Visual C+7.0),但它的应用有很大的局限性,只适用于Windows 2000、Windows XP和Windows NT4.0。所以实际中,更多的是以Visual C+6.0为平台。Visual C+6.0由Microsoft开发, 它不仅是一个C+ 编译器,而且是一个基于Windows操作系统的可视化集成开发环境(integrated development environment,IDE)。Visual C+6.0由许多组件组成,包括编辑器、调

44、试器以及程序向导AppWizard、类向导Class Wizard等开发工具。 这些组件通过一个名为Developer Studio的组件集成为和谐的开发环境。Microsoft的主力软件产品。Visual C+是一个功能强大的可视化软件开发工具。自1993年Microsoft公司推出Visual C+1.0后,随着其新版本的不断问世,Visual C+已成为专业程序员进行软件开发的首选工具。虽然微软公司推出了Visual C+.NET(Visual C+7.0),但它的应用的很大的局限性,只适用于Windows 2000,Windows XP和Windows NT4.0。所以实际中,更多的是

45、以Visual C+6.0为平台。 Visual C+6.0以拥有“语法高亮”,自动编译功能以及高级除错功能而著称。比如,它允许用户进行远程调试,单步执行等。还有允许用户在调试期间重新编译被修改的代码,而不必重新启动正在调试的程序。其编译及创建预编译头文件(stdafx.h)、最小重建功能及累加连结(link)著称。这些特征明显缩短程序编辑、编译及连结的时间花费,在大型软件计划上尤其显著。MFC,微软基础类(Microsoft Foundation Classes),同VCL类似,是一种应用程序框架,随微软Visual C+ 开发工具发布。目前最新版本为10.0(截止2011年3月),并且发布

46、了中文版。该类库提供一组通用的可重用的类库供开发人员使用。大部分类均从CObject 直接或间接派生,只有少部分类例外。 MFC 应用程序的总体结构通常由开发人员从MFC类派生的几个类和一个CWinApp类对象(应用程序对象)组成。MFC 提供了MFC AppWizard 自动生成框架。 此外MFC的部分类为MFC/ATL 通用,可以在Win32 应用程序中单独包含并使用这些类。 由于它的易用性,初学者常误认为VC+开发必须使用MFC。这种想法是错误的。作为Application Framework,MFC的使用只能提高某些情况下的开发效率,只起到辅助作用,而不能替代整个Win32 程序设计。OpenCV1.0OpenCV的全称是:Open Source Computer Vision Library 。OpenCV于1999年由Intel建立,现在由Willow Garage提供支持。OpenCV是一个基于BSD许可证授权(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows和Mac OS操作系统上。它轻量级而且高效由一

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公文档 > 其他范文


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号