《图像识别应用项目介绍亿拍.ppt》由会员分享,可在线阅读,更多相关《图像识别应用项目介绍亿拍.ppt(28页珍藏版)》请在三一办公上搜索。
1、1,亿拍天下图像识别技术介绍,2013年7月,目录,获取报纸标题对应的视频、音频等信息拍摄报纸标题,识别出标题,链接相对应的网址,获得视频信息,步骤1:使用手机拍摄的图像,步骤二:提取出的标题图片区域,视频画面截图,文明复兴是和平发展之本,步骤三:获得标题文本,步骤四:通过文本检索结果,报纸标题识别,对原图利用边缘算子求边界 去除不符合标题形状的边界 1.对原图进行分块操作,并统计块内的方差,2.若块内包含边界点则保留该方差值,否则记为零,3.利用K-means分类的方法,可以去除掉大部分干扰块。4.根据块的大小去除掉一些干扰块。形态操作抽取最大连通域文字OCR识别,报纸标题识别实现过程,原图
2、,边缘提取,删除不符合标题特征的区域,形态学膨胀之后的结果,提取出的标题,报纸标题识别实现流程,测试数据:2100个有扭曲的、倾斜的,典型的图片如下图。实验结果 1689 张能够准确定位出标题,扭曲,倾斜,报纸标题识别实测效果,身份证信息录入拍摄身份证,提取姓名、民族、身份证号码等信息;自动录入到数据库中,以备后续使用,身份证识别,自动录入身份证在需要记录和验证身份证的场景利用电脑自动分析与识别身份证相关信息比利用人工录入减少工作量和增加办公效率。,身份证识别,对图像利用边缘算子寻找边界并进行二值化 找到各个连通域并进行合并操作 统计图片中连通域的高度,由于文字或者数字的高度都非常相近,所以根
3、据这一特征,可以把同一行的小的连通域进行合并 删除非文字块的连通域 利用身份证号码是最长的这一信息,计算合并后的连通域的长度,判别出身份证号码块。根据名字、性别等信息与身份证号码是左对齐这一特征,将头像的区域块过滤。OCR,身份证识别实现原理,手机拍摄原图,边缘图结果,连通域分析,确定最终的文本区域并做字符OCR,形态操作,张绪进男,汉1977 06 11上海市*610103*,身份证识别实现流程,测试图片:1000张有代表性的身份证图片来进行测试。这些身份证包含不同民族,不同省份。如上海的和广西的就不一样,如下图。测试结果:997图片成功的提取出身份证上显示的全部信息。,身份证识别实测效果,
4、视频分析获取电视节目台标,识别台标获取该台更多的节目信息,与节目进行互动,电视台台标识别,台标分割 利用台标在电视画面出现位置的先验知识分割台标.台标特征的有效表示 结合形状和颜色信息。对台标区域进行分块,计算该块的梯度直方图,然后将所有块的梯度直方图合并组成一个向量来作为该台标的形状特征。台标识别 计算测试图中台标特征与模板特征的范式距离,找到距离最小者即为台标。,电视台台标识别实现过程,原图,台标特征表示,台标库(特征表示),电视台台标识别,实验样本:选取了三十个频道,分别为中央电视台12频道、湖北卫视、山东卫视、东方卫视、浙江卫视、湖南卫视等等,每个卫视录制2分钟视频。以每一帧作为一个测
5、试样本。实验结果:除中央电视台台标之外其它五个台标的识别准确率均在85%以上,中央电视台台标的识别准确率为65%。误识率为1%。,电视台台标识别实测效果,人体生理与病理裂纹舌图像的诊断分类 舌裂纹是一个重要的舌象特征,它是舌面上多少不等、深浅不一、形状各异的明显裂沟。通过建立舌裂纹特征与健康人和病人初步诊断类别之间的映射关系,辅助临床医生判断一个人是否处于健康或疾病状态。,病人,健康人,裂纹舌图像识别,原图,平滑滤波增强,舌体轮廓线,Snake算法舌体分割,裂纹舌图像识别预处理,预处理涉及到舌裂纹区域图像分割的步骤,由于舌裂纹区域和背景颜色对比度低,导致舌裂纹区域图像分割比较困难,鲜有文献报道
6、。常用的区域分割方法有数学形态学方法和多方向多尺度高斯滤波器方法,分割结果如下:,数学形态学方法,多方向多尺度高斯滤波器方法,裂纹舌图像识别预处理,原图,低饱和度或高亮度像素点二值图像,基于间隔差异度和先验知识增强图像,舌裂纹二值图像,提出了基于间隔差异度和先验知识的舌裂纹区域提取算法,较正确地把舌裂纹区域从背景中分割出来,好于数学形态学方法和多方向多尺度高斯滤波器方法,计算机化舌裂纹研究的关键性技术是正确、完整地提取出舌裂纹区域。而提出的舌裂纹区域提取算法为计算机化舌裂纹研究提供了较为可靠的技术支持。,裂纹舌图像识别,生理舌裂纹图像就是健康人的舌裂纹图像,病理舌裂纹图像就是不健康人的舌裂纹图
7、像。根据舌裂纹形状特征可以把舌裂纹图像归纳总结成两大类,即近单支裂纹舌图像和杂乱裂纹舌图像。近单支裂纹舌图像主要有一条舌裂纹组成,有如下特点:近似竖形、近似横形、近似斜形(仅有相对于主干短小的不明显分支)中的一种。,裂纹舌图像定义,杂乱舌裂纹图像:舌裂纹数量多,一般超过3条,而且至少有一条舌裂纹纹形紊乱有明显的分支且这些分支伸展的范围较宽,或舌裂纹呈岛状形态。,裂纹舌图像定义,健康人群和不健康人群中舌裂纹的区分,裂纹舌图像肉眼区分,健康人群和不健康人群中关于舌裂纹颜色、粗糙度、面积的区分:,正常,颜色绛,粗糙,面积大,裂纹舌图像肉眼区分,裂纹舌图像肉眼区分过程,已有的文献报道可以发现舌象特征提
8、取往往集中到舌质及舌苔的颜色、纹理方面。目前,使用舌裂纹的形状、以及在原始图像上舌裂纹区域的颜色和纹理特征进行裂纹舌图像分类的研究几乎没有。舌象的形状特征也是对舌体形状而不是舌裂纹形状进行量化提取。使用基于分形几何学的方法提取舌裂纹区域特征舌裂纹颜色-纹理特征:使用舌图像在RGB颜色空间上三个分量位于舌裂纹区域内数据的均值和标准差串接而成的向量表示舌裂纹颜色-纹理特征,裂纹舌图像识别特征提取,舌像采集设备:专用于舌图像采集的设备,保证采集的舌裂纹图像都是在一个统一、标准的采集环境下获得。实验数据:舌裂纹图像样本共计633个人的。其中包括377个健康人的裂纹舌图像,以及256个病人的裂纹舌图像。
9、感兴趣的区域:舌裂纹区域分类精度:生理舌裂纹图像与病理舌裂纹图像计算机化的自动分类所得到的编号与裂纹舌图像真实的类别(生理舌裂纹图像还是病理舌裂纹图像,抑或是属于健康人还是病人,也可以称为诊断类别)一致时,称为正确分类(Correct Classification);否则称为错误分类(Misclassification)。正确分类的样本数与样本总数之比称为分类精度。平均分类精度为96.75%。,裂纹舌图像识别分类结果,定义了生理舌裂纹和病理舌裂纹图像,并阐述了如何区分生理舌裂纹和病理舌裂纹图像。首次应用计算机的方法对生理舌裂纹图像和病理舌裂纹图像进行量化描述和分类,第一次进行了建立舌裂纹特征与健康人和病人初步诊断类别之间的映射关系。提出了基于间隔差异度和先验知识的舌裂纹区域提取算法,为计算机化舌裂纹研究提供了较为可靠的技术支持。,裂纹舌图像识别创新点,if(NO_Question)“Lets take a break!”;,谢谢,