基于颜色特征的图像检索技术研究【毕业论文】.doc

上传人:文库蛋蛋多 文档编号:3940949 上传时间:2023-03-28 格式:DOC 页数:35 大小:434KB
返回 下载 相关 举报
基于颜色特征的图像检索技术研究【毕业论文】.doc_第1页
第1页 / 共35页
基于颜色特征的图像检索技术研究【毕业论文】.doc_第2页
第2页 / 共35页
基于颜色特征的图像检索技术研究【毕业论文】.doc_第3页
第3页 / 共35页
基于颜色特征的图像检索技术研究【毕业论文】.doc_第4页
第4页 / 共35页
基于颜色特征的图像检索技术研究【毕业论文】.doc_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《基于颜色特征的图像检索技术研究【毕业论文】.doc》由会员分享,可在线阅读,更多相关《基于颜色特征的图像检索技术研究【毕业论文】.doc(35页珍藏版)》请在三一办公上搜索。

1、西 安 邮 电 学 院 毕 业 设 计(论 文)题 目: 基 于 颜 色 特 征 的 图 像 检 索 技 术 的 研 究 与 实 现院 系: 计 算 机 学 院 专 业: 软 件 工 程 班 级: 学生姓名: 导师姓名: 职称: 起止时间: 2010 年 3月 8 日至 2010 年 6 月 11 日 毕业设计(论文)任务书 学生姓名 指导教师 职称 院系计算机学院专业软件0603题目基于颜色特征的图像检索技术研究 任务与要求1、熟悉图像的相关基本知识及检索技术;2、搜集并理解现有的颜色特征提取方法;3、在理解现有的颜色特征方法基础上提出自己改进的特征提取法4、用程序验证各种颜色特征提取法的检

2、索结果(VB、VC、Delphi、Java)5、写出内容详实的毕业设计论文开始日期201038完成日期2010611系主任(签字)2010年3月12日 毕 业 设 计 (论文) 工 作 计 划 学生姓名_ _指导教师_ _职称_ _院系_计算机学院_专业_ _软件0603 _题目_ 基于颜色特征的图像检索技术研究 _工作进程起 止 时 间工 作 内 容2010年: 3.83.19 熟悉目标任务,完成开题报告 3.204.6 熟悉图像检索技术的相关基本知识4.74.20 理解颜色特征提取方法及相似性度量方法 4.215.5 比较各种算法的优缺点并选择最佳的算法 5.65.31 根据算法理论写出程

3、序 6.16.10 写出内容详实的毕业设计论文主要参考书目(资料)1. 数字图像处理相关书籍2. 多媒体技术相关书籍3. 基于内容的图像检索技术相关书籍4. VB(或Delphi、Java、VC)相关书籍主要参考书目(资料)主要仪器设备及材料1、微机一台2、系统配有VB(或Delphi、Java、VC)环境论文(设计)过程中教师的指导安排每周周二56节检查、指导、讨论,随时的答疑指导对计划的说明 毕业设计(论文)开题报告 计算机 学院 软件工程 专业 级 班课题名称:基于颜色特征的图像检索技术研究学生姓名: 学号: 指导教师: 报告日期: 1本课题所涉及的问题及应用现状综述从20世纪70年代开

4、始,图像检索的技术就已经开始。传统的文本检索技术,是通过关键字式的提问查询,可以检索的关键字有图像名称、图像尺寸、压缩类型、作者、年代等图像标引。到90年代以后,多媒体信息迅速膨胀,全世界的数字图像的容量以惊人的速度增长,这些图像分布在世界各地,它们都是无序、无索引的。要检索靠传统技术全部都要人工标注,而人工标太主观,不确定,不同人,不同语种,对同一幅图像的理解不同,标注描述就会千差万别。而且随着数据库数以万计地增加,人们寻找资料变得非常耗时,造成资源无法有效利用。于是人们提出了基于图像内容的检索技术,它不需要用户参与,而是利用图像本身的特性,比如颜色、纹理、形状、空间等具有较强客观性的特征进

5、行检索。2.本课题需要重点研究的关键问题、解决的思路及实现预期目标的可行性分析(1)数学模型。数学模型是CBIR系统的核心,它决定了CBIR所能支持的查询类型和检索性能。建立的数学模型要充分反映图像对象的内容,反映与领域无关的和能够有效存储的物理特性及逻辑特征。本课题采用颜色模型作为图像查询,颜色是图像最重要的特征,具有尺度不变性、平移不变性和旋转不变性等特点,它定义明确,抽取容易,对图像的描述最简便而有效。(2) 特征提取。特征提取是基于内容的图像检索的基础。特征提取算法应简单易用,且具有自动提取的功能,所选择的特征应尽可能表达原始图像的信息。同时可以借助一些先进的数学工具来提取图像特征。

6、本课题采用基于HSV颜色直方图的特征提取技术,能够有效地提取颜色特征。(3) 索引技术。在对图像的检索中,最主要的方式是相似性检索。即在图像数据库中找到与给定图像最为相似的一幅。它的一般做法是提取出图像的特征建立特征库。由于图像特征一般都是高维的矢量数据,所以这时图像检索就转化为对空间数据库中高维数的近邻检索问题。为了能够高效的进行数据特征索引,从而实现图像信息的检索,目前对索引技术的研究主要集中在降低索引维数和建立良好的索引方法上。 本文采用二次式距离相似性区配算法,(4)累加直方图算法。累加直方图能体现信号在分布轴上各抽样点间的相关性,即分布轴上相对某个抽样点距离越近的点,在某种特性意义上

7、就越相似于该抽样点。但是累加直方图能体现这个性质的前提是:信号本身要有这样的特性,即特征分布轴上距离小的两点要比距离大的两点更相似。3.完成本课题的工作方案 3.83.19 熟悉目标任务,完成开题报告 3.204.6 熟悉图像检索技术的相关基本知识4.74.20 理解颜色特征提取方法及相似性度量方法 4.215.5 比较各种算法的优缺点并选择最佳的算法 5.65.31 根据算法理论写出程序 6.16.10 写出内容详实的毕业设计论文4指导教师审阅意见 对课题理解正确,方案可行,同意实施。指导教师(签字): 2010 年 3 月 19 日说明:本报告必须由承担毕业论文(设计)课题任务的学生在毕业

8、论文(设计) 正式开始的第1周周五之前独立撰写完成,并交指导教师审阅。基于颜色特征的图像检索技术研究摘要:多媒体技术和技术的普及导致了大量图像信息的出现,传统的文本关键词检索方法己经不能适应图像信息的检索需求,基于内容的图像检索技术成为目前研究的热点。本文在对基于内容检索,一的关键技术的分析的基础上,结合当前的研究趋势,重点探讨了基于颜色特征的检索方法和依赖于图像分割的基于区域的图像检索方法。基于内容的图像检索技术的应用使管理者从大量的、单调的人工管理工作中解放出来,能够方便、快速、准确的从图像数据库中查找特定图像。CBIR技术的核心是表示图像内容的特征,而颜色特征计算简单,性质稳定,作为图像

9、的一种重要视觉信息,在中已得到广泛应用。本文介绍了一种基于颜色特征的图像检索技术研究方法。首先介绍了课题的意义和背景,对基于内容的图像检索技术的研究现状做了简单的分析,并在此基础上讨论了该领域所涉及的一些关键技术。在当前的实际应用中,基于内容的图像检索系统的设计往往针对特定的环境,并采用特定的算法。面对这种研究现状,本文简单介绍RGB和HSV两种通用的颜色空间及两者的转化方法,详细分析了基于内容的图像检索系统所具有的优点、系统结构及相关处理技术,并对利用图像的颜色特征进行检索中涉及到的问题进行了详细的研究,重点探讨了图像颜色特征的表示、颜色特征的提取和相似性度量等方面的问题等。基于上述方法,本

10、文利用Matlab 技术,采用直方图特征建立了一个基于颜色特征图像检索原型系统,取得了令人满意的试验结果。最后本文指出了当前基于内容的检索技术的研究热点和今后的发展向。关键词:图像分割 图像检索 检索效率 相似性度量 matlabColor-based Image Retrieval Technology Abstract: The popularity of multimedia technology and technology led to the emergence of a large number of image information, the traditional text

11、 keyword search methods have been unable to meet demand for image information retrieval, content-based image retrieval technology become a research hotspot. This article on content-based retrieval, one of the key technologies based on the analysis, with the current research trends, focusing on the r

12、etrieval method based on color feature and rely on image segmentation method of image retrieval based on region. Content-based image retrieval technology to enable managers from large, monotonous labor in the management of liberation, can be easily, quickly and accurately from the image database to

13、find specific images. CBIR technology is the core of that image content features, and color characteristics of simple computation, the nature of stability as an important visual image information, has been widely used. This paper describes a color feature based image retrieval methods. First introdu

14、ced the topic of the meaning and context of content-based image retrieval research to do a simple analysis of current situation, and on this basis to discuss the areas of the Sheji some key technologies. In the current practice, content-based image retrieval system design is often for a particular e

15、nvironment with specific algorithms. Faced with this study, this paper briefly two common RGB and HSV color space and the transformation between the two methods, a detailed analysis of content-based image retrieval system has the advantage of system architecture and related processing, and use color

16、 characteristics of the image retrieval problem involved a detailed study, focusing on the representation of image color features, color feature extraction and similarity measure and so and so on. Based on the above method, this technique using Matlab, using the histogram feature set up a color feat

17、ure based image retrieval prototype system, and achieved satisfactory results. Finally, the paper pointed out that the current content-based retrieval technology research focus and future development to. Key words: image segmentation、image retrieval 、search efficiency 、similarity measure、 matlab 目录第

18、一章 绪论11.1课题背景及所涉及的问题11.2 图像检索的主要应用21.3 国内外研究现状21.3.1 国外研究成果21.3.2 国内研究成果31.4 相关反馈技术31.5 图像检索性能评价标准41.5.1 检索效果评价方法41.5.2 排序评价方法52.1 图像流的特点62.2 CBIR的定义72.3 CBIR的分类72.4 CBIR的系统结构82.5 CBIR的检索过程9第三章 基于颜色的图像检索103.1 颜色模型和颜色空间103.2 颜色的度量体系113.2.1 RGB颜色空间113.2.2 HSV颜色空间123.2.4 均匀颜色空间的量化123.3 颜色特征、特征提取及特征表达13

19、3.4颜色直方图143.4.1颜色直方图的定义143.4.2 颜色直方图的特性143.5 图像分割技术153.5.1 图像分割的概念153.5.2 阈值分割一提取目标图像163.6 图像的相似性度量16第四章 系统设计与实现194.1系统设计原则194.2系统运行平台和开发工具的选择194.3 系统框架194.4数据管理204.5 图像入库214.6 图像查询21第五章 全文总结与展望245.1 全文总结245.2 展望24参考文献25致 谢25第一章 绪论1.1课题背景及所涉及的问题从20世纪70年代开始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术(Text-based I

20、mage Retrieval,简称TBIR),主要在数据库领域中进行研究,它首先对图像用文本进行注解(关键字),然后用基于文本的数据库管理系统(DBMS)来进行图像关键字检索。TBIR沿用了传统文本检索技术,回避了对图像可视化元素的分析,而是从图像名称、图像尺寸、压缩类型、作者、年代等方面标引图像,一般以关键词形式的提问查询图像,图像所在页面的主题、图像的文件名称、与图像密切环绕的文字内容、图像的链接地址等都被用作图像分析的依据,根据这些文本分析结果推断其中图像的特征。或者根据等级目录的形式浏览查找特定类目下的图像,如Getty AAT使用近133,000个术语来描述艺术、艺术史、建筑以及其它

21、文化方面的对象,并推出30多个等级目录,从7方面描述图像的概念、物理属性、类型和刊号等。在图像数字化之前,档案管理者、图书管理员都是采用这种方式组织和管理图像。到90年代以后,多媒体信息迅速膨胀,全世界的数字图像的容量以惊人的速度增长,这些图像分布在世界各地,它们都是无序、无索引的。由于人工标注具有主观性和不确定性,基于文本的图像检索在图像的数据量非常大的时候存在很大困难:v 手工对图像进行注释所需的工作量太大;v 许多图像很难用文字的方式进行描述;v 不同的人对同一幅图像的理解不一样,即使同一个人对同一幅图像在不同环境下理解也不完全相同,这样使得对图像的描述不唯一,造成检索结果的千差万别;v

22、 由于世界上存在许多语种,采用不同的语言文字对图像进行描述而建立的索引在应用中造成了一定的障碍。基于文本方式的图像检索存在很大的局限性,图像中包含的大量有用信息无法被有效地访问和利用,在这样的环境下寻找资料是非常耗时的,因此人们提出了一种新的对图像内容语义的检索技术基于图像内容的检索CBIR(Contented-Based Image Retrieval),它不需要用户的参与,而利用图像自身的特征,如颜色、纹理、形状等特征来进行检索,具有较强的客观性。1.2 图像检索的主要应用基于内容的图像检索大大减少了人工标注的沉重负担,提高了检索的速度和效率。它涉及社会和生活的方方面面:如艺术馆和博物馆馆

23、藏资料的管理、地球资源遥感图像的检索、建筑和工程设计图纸的查询、时装设计以、数字图书馆、天气预报、知识产权保护、医疗图像管理、犯罪预防及犯罪记录调查、军事观察和地球资源观察系统、宇宙探测、交通检测等领域。尤其是计算机网络技术和通信技术的发展,在科学计算、可视化、工程制图、未来在网络购物和交互式电视方面及其他众多的应用领域,有着广阔的发展前景。1.3 国内外研究现状1.3.1 国外研究成果基于内容的图像检索技术是当前研究的热点,许多著名杂志如IEEE Trans.On PAMI 、IEEE Trans.On Image processing 等纷纷设专刊介绍该领域研究的最新成果,著名的国际会议如

24、:IEEE conference of CVPR 、 ACM conference on multimedia等纷纷设立专题交流最新的研究成果。各大研究机构和公司都推出了他们的系统:v IBM的QBIC系统 IBM的QBIC是第一个商业化的基于内容的图像检索系统,它的系统结构包括图像入库、特征计算、查询阶段三部分,允许使用例子图像、用户构建的草图和图画、选择的颜色和纹理模式、镜头和目标运动和其他图形信息等,对大型图像和视频数据库进行查询。 它的系统框架和结构对后来图像检索系统具有深远的影响。v 新加坡大学和MIT媒体实验室的Photobook系统 该系统是用于交互式浏览和搜索图像库的工具。图像

25、在装入时按形状、纹理和人脸的面部外形三种特征自动分类,同时还能结合文本关键字进行查询,图像根据类别通过显著语义特征压缩编码。 v Virage公司的Virage系统该系统是基于内容的图像搜索引擎,比QBIC更进一步,支持基于颜色、颜色布局、纹理和结构(对象边界信息)及这四个原子查询的任意组合。VirageVirageEngine主要有3方面的功能:图像分析、图像比较和图像管理,技术的核心是VirageEngine以及在图像对象层上的操作。v 美国哥伦比亚大学的VisualSEEK系统 VISualSEEK图像查询系统是一个可视化的图像特征搜索引擎,实现了互联网上的基于内容的图像/视频检索系统,

26、它由四部分组成:图形用户界面、服务器应用、图像检索服务器、图像归档。在VisualSEEK中,整幅图的颜色分布使用全局颜色直方图,区域颜色的索引采用二进制颜色集的表达方法。它采用基于小波变换的方法来表示图像的纹理特征。1.3.2 国内研究成果相对国外而言,国内在这方面的研究起步相对较晚:v 浙江大学从95年开始进行多媒体图像检索的研究,完成了基于颜色和基于形状的图像原型系统,总体设计思想是允许用户找到包含特定颜色、纹理和形状的图像。v 中科院计算技术研究所开发了一个图像检索原型系统“ImageSeek,作为“中国数字图书馆示范工程”课题的一个关键技术。该系统实现了基于文本、颜色、纹理特征的图像

27、检索。v 杭州贝尔研发的具有自主知识产权的智能图像检索系统,通过提取图像的颜色、纹理和形状等特征,实现了基于图像内容的快速智能检索,被列入2001年信息产业部重点科研计划。1.4 相关反馈技术目前,基于内容检索的图像数据库中存在的一个主要问题是现有的检索方法都是以计算机为中心的,使得一些查询结果计算机认为是相似的,而人却认为是不相似的,其主要原因是图像的底层特征和高层语义间存在很大差距。目前的计算机视觉、人工智能发展的程度对于高层的语义概念与底层物理特征之间的映射还是很不完善的。要解决这个矛盾,一方面对上述的检索方法进行改进,尤其是底层特征的选取、表示及匹配,尽可能缩小其与高层丰富语义之间的差

28、距;另一方面增进人机之间的交互,计算机将查询的信息反馈给人,人对查询结果的评判信息反馈给计算机,这种反馈技术使计算机能够具有一定的学习能力,从而使检索结果逐步达到用户的要求。相关反馈技术基本思路是:v 在检索过程中,用户提供的范例图像;v 系统根据范例图像与图像数据库中图像的相似距离,给出一个基于相似度的排序列表,数据库中图像和范例图像在特征空间越相似,则排序越靠前v 用户对检索结果进行评价和标记,指出结果中那些与查询结果相关的,那些不相关的;v 将用户标记的相关信息,作为训练样本反馈给系统进行学习,指导下一轮检索,从而使得检索结果更符合用户需要。NY检索系统 图像数据库查询结果图像满意?标记

29、图像获取用户信息查询图像结束用户与系统进行交互图相关反馈的人机交互过程图1.5 图像检索性能评价标准1.5.1 检索效果评价方法图像检索系统有效性评价可以从以下两个方面来考虑:一是人的主观感受;二是有一个量化的评价标准,而人的主观感受很不容易把握,因所以要对定义一些标准和指标,优化检索结果的有效性。一般地,图像检索分为两种主要类型:图像匹配和相似性查询。设图像库有 N 幅图像。对匹配问题,理想情况是正确图像是检索结果中的第一个。通常用下面的式子评价匹配效果:匹配比率检索性能的评价一般采用查准率查全率(PrecisionRecall)的相似检索评价准则,通过执行检索集合中的各个查询,就可以计算出

30、查询的平均查准率和查全率,据此就可以给出系统的检索性能评价。查准率和查全率的定义如下:v 查准率 Precision 定义为查询结果中与例子图像相关的图像所占的百分比例,Precision= 100%表示查询出图像均为相关图像。Precision =v 查全率 Recall 定义为查询结果中与例子图像相关的图像占全部相关图像的百分比。Recall= 100%表示全部相关图像均被检索出来。Recall =查准率则反映检索的准确性,而查全率反映检索的全面性,因此可以用来评价系统的有效性。查准率和查全率越高说明检索系统的效果越好。但是查准率和查全率是一对矛盾,当查全率较高时,查准率就会降低,反之亦然

31、。因此一般检索系统要求通过调整,使查准率和查全率两者达到一个最优平衡。1.5.2 排序评价方法如果图像匹配采用相似性比较,那么,根据不同的相似性尺度,返回的图像数目可能不同,此时采用该方法。检索到的相关图像的平均排序为P1;检索到的相关图像的数目;所有实际的相关图像的排序号之和为 SUM;则有理想的相关图像的平均排序P2;实际的相关图像数目N;则有相关图像丢失率:R=在理想情况下,所有相关图像都排在最前面,因此,平均值越小,表明检索算法越好。相关图像丢失率计算丢失的相关图像占所有相关图像的比例,这个值越小,表明成功率越高。第二章 基于内容的图像检索 2.1 图像流的特点图像和视频信息与传统的文

32、本、数值信息相比具有如下的特点:1)非结构化特性。传统的文本、数值数据,记录信息具有明显的结构特性,它是现实世界中对象间关系的反映,可通过实体关系模型抽象得到。图像和视频对象具有较强的非结构化特性,许多多媒体信息以流的形式存在(例如视频流),这种媒体想要得到它的信息,必须对它先进行结构化处理,而这种结构化不能通过简单的抽象来完成,而需要相应的媒体分割和组织技术。2) 内容多义性。在传统的文本、数值数据库中,每一个记录所包含的语义确定而且有限。而对于像图像或视频这样的多媒体对象来说,具内容往往对不同的用户、不同的应用具有不同的解释,即具有多义性的特点,这样其内容就很难通过有限的属性来充分描述。此

33、外,对多媒体对象的检索一般都是内容相似程度的检索即查找内容描述与检索要求最接近的对象。这就要求建立的内容描述支持内容相似性程度的比较,这是在传统的文本、数值数据库中广泛采用的定性描述所不能满足的。2.2 CBIR的定义基于内容图像的检索主要依据图像的画面内容特征和主题对象特征来进行检索。由图像分析软件对输入的图像先进行图像分析,根据图像自身所包含的颜色(灰度)、纹理、形状、空间关系等特征以及这些特征的组合,自动抽取特征,在将输入图像存入图像库的同时将其相应的特征向量也存入与图像库相连的特征库。在进行检索图像时,对每一幅给定的查询图,进行图像分析,并提取图像特征向量,利用基于这些特征定义的特征度

34、量函数计算或评价特征之间的相似性,将该图像的特征向量和特征库中的特征向量进行匹配,根据匹配的结果搜索图像库中将最相似的一些检索结果就可以提取出所需要的检索图,返回给用户。基于内容的视觉信息检索的目的不是去理解或识别图像目标,它所关注的是能否基于内容快速发现信息,旨在对视觉信息提供强有力的描述,实现视觉信息的结构化,在用户可以接受的响应时间内从图像库中查询到符合要求的图像,最终达到用户对这些视觉信息内容自由访问的目标。基于内容的图像检索过程充分体现了图像的信息特点又结合了图像处理、图像理解、数据库技术、计算机视觉(computer vision)、模式识别技术及神经网络等学科,同时也和人脑的认识

35、程度紧密相关,这诸多因素使得基于内容的图像检索的研究成为一项极富挑战性的课题。2.3 CBIR的分类按照检索时所基于的不同颜色特征,可将基于内容的图像检索技术分为如下四种类型:v 基于颜色特征的检索最基本的思想是利用颜色空间直方图的匹配,进一步研究集中在:表示颜色特征的颜色模型与人的视觉特征一致性研究;降低表示颜色特征维数的方法;与其它视觉特征结合进行多特征检索研究等几个方面。v 基于纹理特征的检索其本质是刻画像素的邻域灰度空间分布规律,区分有相似颜色的区域,分割物体和背景。它描述了图像或区域所对应景物的表面性质,包括表面结构组织及其与周围环境关系的许多重要信息。并且,纹理特征是一种统计特征,

36、有旋转不变性和较强的抗噪音能力。v 基于形状特征的检索对形状特征的提取主要是寻找一些几何不变量,主要难在对图像中感兴趣目标的分割。目前用于图像检索的形状描述方法主要有两类:基于边缘和基于区域的形状方法。前者利用图像的边缘信息,而后者则利用区域内的灰度分布信息。v 基于空间位置关系的检索是基于图像中对象所在的位置和对象之间的空间关系的研究。空间关系是指空间对象之间具有空间特性的关系,主要包括拓扑、方向、度量关系。空间关系特征的自动抽取非常困难的,所以大多采用人工绘制草图的查询方法。2.4 CBIR的系统结构CBIR系统由5个子系统构成,包括图像数据的存储,特征提取,相似性度量,高维特征索引过滤技

37、术,用户查询和浏览接口。 特征 索 引颜 色形 状纹 理空间关 系用户引擎领域知识图像源 图 像 库 查询 匹配 预处理 索引 结果 索引 相关反馈 过滤 用户 存储 相似度度量 索引 特征提取 子系统 子系统 子系统 子系统 子系统 CBIR的系统结构v 用户子系统是用户提交查询请求和接收浏览查询结果的接口。提交查询的方式:关键词查找、浏览查找(通过等级式类目组织检索)、特征输入查找(设置特征参数)、草图查找、示例查询。v 相似性度量子系统是检索引擎,利用图像的特征来度量图像之间的相似性,并按相似性的大小对结果图像集合排序,并返回给用户。v 索引子系统主要功能是对图像数据作索引。目前主要使用

38、图像的特征作为索引,利用相似性度量获得相似结果集合。图像特征主要用高维矢量来表示。v 特征提取子系统功能是提取图像的特征,表达图像的内容。目前主要以视觉特征为主,包括颜色特征,纹理特征,形状特征,物体空间关系特征等。v 存储子系统负责存储和管理原始图像数据。图像数据库中存储的信息有图像数据,特征索引数据和其他文本描述信息。存储技术包括图像预处理技术和压缩技术等。预处理技术是图像在入库之前的处理,包括滤出噪声,对比度调整,几何矫正和比例变换等。压缩技术是节约图像数据占用空间的手段,系统需要支持各种不同的压缩格式和它们之间的相互转换。2.5 CBIR的检索过程基于内容的图像检索是一个逐步求精的过程

39、,大致可以经过以下几个步骤:v 查询要求用户查找一个数据对象时,利用系统人机界面提供的输入方式形成一个查询条件。查询接口一般要对所提交的数据进行预处理,然后再传递给搜索引擎。v 特征提取特征提取是以手工提取、半自动提取或自动提取的广度提取图像的颜色、纹理、形状等特征或它们的组合。图像的特征,是人对图像视觉效果的量化表示,能较好的表征人对图像的视觉感受。v 相似性匹配在选取了特征之后,将待识别的图像的特(查询特征)与数据库中的特征按照一定的匹配算法进行匹配。将图像的特征看作是坐标空间中的点,通过距离度量函数计算两个点之间的接近程度来衡量图像特征间的相似度。v 结果返回将满足一定相似性条件的一组候

40、选结果按相似度大小排列后返回给用户。v 特征调整对系统返回的结果可通过浏览来挑选,直至找到满意的结果,或从候选结果中选择一个示例,经过特征调整,形成一个新的查询。如此重复,逐步缩小查询的范围,直到用户对查询结果满意为止。特征提取相似性匹配返回候选结果满意?输出检索结果用户查询说明示例、一般性描述从候选结果中选择一个示例修改用户查询说明 N Y CBIR的处理过程第三章 基于颜色的图像检索3.1 颜色模型和颜色空间颜色是视觉系统对可见光的感知结果。自然界中的任何一种颜色都可以由R、G、B这3 种颜色值之和来确定,它们构成一个三维的RGB矢量空间。颜色模型(color model)是用数值方法指定

41、颜色的一套规则和定义,可使人们方便地描述任何一种颜色,颜色模型通常用颜色空间描述,如RGB、CMY和CMYK,从这个意义上说,颜色模型和颜色空间互为同义词。任何一种颜色都可用三种基本颜色按不同的比例混合得到,显示彩色图像用RGB相加混色模型:颜色=R(Red 百分比)+G(Green 百分比)+B(Blue 百分比)颜色空间是表示颜色的一种数学方法,人们用它来指定和产生颜色,使颜色形象化。颜色空间通常用三维模型表示,空间中的颜色能够看到或者使用颜色模型产生。颜色空间中的颜色通常使用代表三个参数的三维坐标来指定,这些参数描述的是颜色在颜色空间中的位置,其颜色要取决于使用的坐标。3.2 颜色的度量

42、体系颜色度量体系(color system),也叫做颜色制或者叫做颜色体制,实际上就是人们组织和表示颜色的方法。组织和表示颜色的方法主要有两种:一种是颜色模型,一种是编目系统。颜色模型是用简单方法描述所有颜色的一套规则和定义。颜色空间是颜色模型最普通的例子,RGB、CIE XYZ、CIE LAB、CMYK等。对于颜色空间的构造需要满足三个要求:v 完备性(Completeness),颜色空间应能描述人能感知的所有颜色;v 一致性(Uniformity ),颜色在空间度量的差异和感知的差异相吻合;v 唯一性(Uniqueness),颜色空间中颜色在感知上彼此不同。3.2.1 RGB颜色空间RGB

43、空间模型是使用红、绿、蓝的亮度值,大小限定到一定范围,如0-255。R、G、B以不同程度的混合可以调出各种各样的色彩,并都能用三维空间中第一象限的一个点来表示,如图的立方体所示,三色图像的灰度级直方图是RGB空间的点分布。在RGB彩色空间的原点上,任何一种基色的亮度值都为0,即原点为黑色。三基色都达到最高亮度时则表示为白色。在连接黑色与白色的正方体对角线上,各原色的强度相等,产生由暗到明的白色,也就是不同的灰度值。立方体位于坐标轴上的三个顶点分别为三基色红、绿、蓝色,而另外三个顶点则对应于二次色黄色、青色以及品红。 蓝(0,0,1) B 青(0,1,1) 品红(1,0,1) 白(1,1,1)灰度

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公文档 > 其他范文


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号