《基于静止图像的车牌照汉字识别系统设计与实现.doc》由会员分享,可在线阅读,更多相关《基于静止图像的车牌照汉字识别系统设计与实现.doc(45页珍藏版)》请在三一办公上搜索。
1、西 南 交 通 大 学毕业设计(论文)基于静止图像的车牌照汉字识别系统设计与实现年 级: 2005 级 学 号: 20052220 姓 名: 郭强 专 业: 自动化 指导老师: 侯进 二零零九年六月院 系 信息科学与技术学院 专 业 自动化 年 级 2005 级 姓 名 郭强 题 目 基于静止图像的车牌照汉字识别系统设计与实现 指导教师评 语 指导教师 (签章)评 阅 人评 语 评 阅 人 (签章)成 绩 答辩委员会主任 (签章) 年 月 日 毕 业 设 计 任 务 书班 级 自动化1班 学 生 姓 名 郭 强 学 号 20052220 专 业 自动化 发 题 日 期:2009年 1 月 10
2、 日 完 成 日 期:2009年 6 月 10 日题 目 基于静止图像的车牌照汉字识别系统设计与实现 题目类型:工程设计 技术专题研究 理论研究 软硬件产品开发一、 设计任务及要求 车牌照识别是智能交通系统的一个重要课题,在车辆管理、不停车收费等系统中有广泛应用。基于中国车牌照的特点,我们需要设计一种能识别汉字的车牌照识别系统,使得这样的车牌照识别系统更优于其他只能识别数字和字母的系统,具有更广的适应性。具体要求如下: 1、对输入的车牌汉字字符图像进行字符特征提取; 2、基于车牌汉字的特点,建立一个车牌汉字字符标准识别样本字库; 3、通过训练统计或模式识别法来识别汉字并给出结果。 二、 应完成
3、的硬件或软件实验 1、利用MATLAB或VC+编程实现车牌照汉字的识别技术 2、设计一个人机交互界面能输入车牌照汉字图像并显示字符识别的结果 三、 应交出的设计文件及实物(包括设计论文、程序清单或磁盘、实验装置或产品等) 1、毕业设计论文(必须完全符合学校规范,内容严禁有丝毫的抄袭剽窃) 2、CD-R(含论文,程序,程序使用说明书,演示视频,盘面标注班级,姓名,专业,日期) 3、英文翻译按学校规定,导师无特殊要求 四、 指导教师提供的设计资料 1、研究报告介绍(包括课题背景、动机、内容、意义) 2、计划说明书 3、部分英文文献资料和Medialab LPR图像数据库 五、 要求学生搜集的技术资
4、料(指出搜集资料的技术领域) 1、本课题相关领域国内外重要论文及资料 2、MATLAB、C+编程指南 六、 设计进度安排第一部分 查阅相关资料,学习相关编程语言 ( 5 周)第二部分 编制程序并进行软件调试 ( 8 周)第三部分 撰写毕业论文 ( 2 周) 评阅及答辩 毕业论文修改和参加答辩 ( 1 周) 指导教师: 年 月 日系主任审查意见:审 批 人: 年 月 日注:设计任务书审查合格后,发到学生手上。 西南交通大学信息科学与技术学院 2008年制摘 要在汽车普及的今天,道路运输已经成为超越铁路运输的最重要的地面运输方式,在国民经济和社会发展中起着举足轻重的作用。但是随着汽车的普及、交通需
5、求的急剧增长,道路运输所带来的交通拥堵、交通事故和环境污染等负面效应也日益突出,成为阻碍经济和社会发展的全球性共同问题。进入90年代以后,随着电子计算机软硬件技术的发展,智能交通系统(Intelligent Transportation System,简称ITS)成为解决这一矛盾的有效途径之一。在上述智能系统中,字符识别都是其核心内容,而汉字识别(Chinese Character Recognition,简称CCR)又是字符识别的重点和难点所在。这个项目的目标就是开发出一个识别速度快、准确率的高的车牌汉字识别系统。本文提供了一种简单的车牌汉字识别方法。我国机动车使用的拍照主要是根据公安部19
6、92年颁布的中华人民共和国机动车号牌标准(GA36-92)制作的,其中汉字大约50个。所以我们只要考虑这50多个字的结构差别就可以准确的识别出这些汉字来。首先,对输入的图像进行尺寸规格化、二值化、反色、细化等预处理。然后,对预处理后的图像进行特征提取,包括独立结构的个数,笔画横、竖、撇(包括点和捺)的个数,将这些数放在同一个向量中。最后,采用模板匹配分类器将特征提取中得到的向量与标准库中的向量进行比较,找到该向量对应的汉字,并输出结果。实验表明,本文所介绍的方法方便简单,准确率高,速度快。对识别对象已知的车牌汉字识别有很好的识别效果。关键词:智能交通; 汉字识别; 二值化; 特征提取; 模板匹
7、配分类器AbstractWith the prevalence of automobiles, nowadays, road transport has gone beyond rail transport and becomes the most important ground transport mode. It is playing an important role in the national economy and societys development. However, popularity of motor vehicles and rapid growth in de
8、mand for transportation inevitably result in negative effects such as traffic jams, traffic accidents and pollution, which have become increasingly severe global common problems that hinder the development of economy and society.Since 1990s, with the development of computer hardware and software tec
9、hnologies, the intelligent transportation system (ITS) became one of the effective ways to solve this contradiction. As mentioned above, character recognition is the core content of intelligent systems, while the Chinese character recognition (CCR) is the most difficult and important part of charact
10、er recognition.The object of this project is to develop an efficient character recognition system for vehicle license plates with high speed and accuracy. This article provides a simple method. License plates on Chinas motor vehicles are mainly designed on the basis of the standard of the Peoples Re
11、public of motor vehicle number plate (GA36-92), which is published by the Ministry of Public Security department in 1992 involving about 60 Chinese characters. We could easily identify these characters as long as we figure out the difference in their structures. First, pretreatment needs to be carri
12、ed out for the input picture including size-normalization, binarization, and anti-coloring, detailing. Second, the features of the pre-treated picture will be extracted and then put on the same vector, including the number of independent structures, horizontal strokes, vertical, write (including poi
13、nt and Na). Finally, comparing the vector coming from the feature extraction with the vector from the standard library, the Template Matching Classifier is able to identify the Chinese characters corresponding to the vector, and then output the result.The experiment result showed the method describe
14、d in this article is simple and efficient, and has a good effect on identification of the known Chinese characters on the license plate.Keywords: Intelligent transportation; Chinese character recognition; Binaryzation; Feature extraction; Template matching classifier目 录摘 要ABSTRACT第1章 绪 论11.1 问题的提出及研
15、究意义11.1.1 问题的提出11.1.2 研究意义11.2 国内外研究现状21.2.1 车牌图像识别技术应用现状21.2.2 车牌图像识别技术研究现状41.3 设计的研究内容和方法51.3.1 研究内容51.3.2 研究方法51.4 本文结构安排81.5 本章小结8第2章 汉字图像的处理92.1 汉字图像的预处理92.1.1 不同尺寸汉字图像的规格化92.1.2 灰度图像二值化处理122.1.3 反色处理142.1.4 二值化图像细化处理152.2 汉字图像的特征提取172.2.1 笔画方向线素特征172.2.2 汉字结构特征点特征172.2.3 汉字结构笔画特征182.3 本章小结21第3
16、章 汉字图像的识别223.1 模版匹配分类器识别法223.2 识别性能分析263.3 本章小结27第4章 基于MATLAB的界面设计284.1 GUI简介284.2 系统界面设计284.3 本章小结32结 论33致 谢35参考文献36第1章 绪 论1.1 问题的提出及研究意义1.1.1 问题的提出在汽车普及的今天,道路运输已经成为超越铁路运输的最重要的地面运输方式,在国民经济和社会发展中起着举足轻重的作用。但是随着汽车的普及、交通需求的急剧增长,道路运输所带来的交通拥堵、交通事故和环境污染等负面效应也日益突出,成为阻碍经济和社会发展的全球性共同问题。进入90年代以后,随着电子计算机软硬件技术的
17、发展,智能交通系统(Intelligent Transportation System,简称ITS)1成为解决这一矛盾的有效途径之一。智能交通系统是在比较完善的道路设施基础上,将先进的电子技术、信息技术、传感器技术和系统工程技术集成运用于地面交通管理所建立的一种实时、准确、高效、大范围、全方位发挥作用的交通运输管理系统。近年来,随着国内经济的快速增长,汽车工业和交通运输产业迅速发展,对智能交通系统(ITS)提出了更高的要求,包括移动车辆稽查、高速公路收费站管理、停车场(小区)车辆管理等在内的一系列智能管理系统应运而生。在上述智能系统中,字符识别都是其核心内容,而汉字识别(Chinese Cha
18、racter Recognition,简称CCR)又是字符识别的重点和难点所在。虽然现在市面上已经有多种CCR软件出售,但是他们仅仅对高质量的标准印刷文本有较高的识别率,但是对于严重污染、变形、模糊、倾斜的忽地字符,特别是针对车牌识别系统中提取的车牌汉字字符,不能给出满意结果2。本课题通过对车牌汉字灰度图像识别的研究,提出针对汽车牌照中汉字字符的有效识别算法,以期达到较高的识别正确率。1.1.2 研究意义牌照识别技术在智能交通领域中的应用已经非常的广泛。 如在“公交车优化调度与智能管理”中要求建立车辆自动登记系统,包括:车辆自动识别、车辆定位(如GPS、路边塔标)、车辆位置跟踪、数据库及数据管
19、理。在“不停车电子收费系统(Do not stop electronic toll collection system,简称ETC)”中,电子收费将会减少不必要的收费闸门车道数目以及因排队交费所造成的交通延迟。其车辆通过的基本流程为:电子不停车收费系统(ETC)在一定的范围内,设置减速板、栏杆等装置,当车辆按一定的速度驶入高速公路进口处时,该系统通过车载电子标签中的交通卡,自动记录该车的车型、牌照、入口时间和地点;到出口处时,该系统读到这些数据并同时生成需付费金额,迅速在交通卡中自动扣除。万一在匝道出口处没有电子不停车收费系统(ETC),也可以通过交通卡读到相关数据,进行人工付费操作。 有些“
20、停车管理与停车场信息系统”中也应用了牌照识别技术,用来将车辆停泊信息记录在案,可以有效地加强管理,降低车辆丢失率,打击盗窃车辆的犯罪活动3。1.2 国内外研究现状1.2.1 车牌图像识别技术应用现状2002年,车牌图像识别产品第一次在国内实际应用于交通工程。刚开始主要用于高速公路收费辅助系统以降低交通通行征费收入的流失,后来逐步发展到城市交通、停车场管理、门禁管理等多种应用领域。 1车牌图像识别技术在高速公路领域的应用 高速公路是车牌图像识别技术在我国交通工程中最早应用的领域,也是车牌识别产品应用最多的领域。据统计,目前我国车牌识别产品主流供应商(如北京汉王科技、昆明利普视觉、上海高德威、沈阳
21、聚德、北京信路威等公司)的产品有一半左右是应用在此领域。主要用于高速公路收费管理、路径判别、收费征稽、交通数据采集等方面,其中,最常用的是高速公路收费辅助系统。 高速公路收费辅助系统一般是在高速公路入口处进行车牌图像采集、识别,将识别结果写入通行卡(票)或者通过网络传送至各出口站,在车辆到达出口时,再进行一次车牌图像采集、识别,并将识别结果与入口识别结果相比对,以防止或发现倒卡、换卡、换牌等逃费行为。 目前的高速公路收费辅助系统中,采用车牌图像识别技术在车牌识别速度指标基本可以满足,但识别结果正确率指标还不是很理想。从一些产品的解决方案来看,实际使用时一般仍然需要人工复核。因此,虽然车牌图像识
22、别技术在这一领域取得了较好的使用效果,但还不能实现真正意义上的智能化收费。 2车牌图像识别技术在城市交通领域的应用 随着我国机动车保有量的迅速增加,以及政府对公共安全的日益重视,城市交通监控和管理工作日趋繁重。因此,城市交通领域迫切需要应用一些较可靠、有效的智能化技术手段。目前,车牌图像识别技术己经开始在移动电子警察、城市卡口监控、超速布控报警等城市交通(治安)方面有了一定的应用。其中,最常用的场所是城市卡口监控。 城市卡口监控:公安部颁布的城市卡口监控系统部颁标准明确规定了车牌识别是城市卡口监控系统的一个重要组成部分,越来越多的城市公安部门正在积极筹建卡口系统。公安系统设立城市卡口监控点的主
23、要任务是对车辆进行车牌识别,并将识别结果与被盗抢、肇事、在逃、通缉的车辆牌号黑名单进行比对。 移动电子警察:移动电子警察现在逐渐应用到交警日常工作中,采用移动电子警察技术可以灵活地对非固定监控点的交通违章和事故进行取证处理,不仅提高了警察执法效率,而且增强了执法的公正性。 在城市卡口监控、移动电子警察方面,对车牌图像识别技术在车牌识别结果的正确率指标的要求比较高,否则将给执法工作带来很大的麻烦。目前的车牌图像识别产品在这方面尚不够理想,因此一般也是作为一种辅助手段,还不能实现真正意义上的智能化。 3车牌图像识别技术在停车场收费管理系统中的应用 停车场收费管理系统:用于对出入车辆号牌识别和匹配,
24、实现自动计时、计费管理。由于停车管理日益成为城市交通管理中一个严重问题,人们对停车管理的智能化呼声日渐高涨,通过车牌识别系统可以构建一个智能的停车管理系统,因此,在大中城市的商场、写字楼有很大的市场潜力。 停车场收费管理系统对车牌图像识别技术在车牌识别结果的正确率指标的要求也非常高,目前的车牌图像识别产品在这方面也不够理想,一般也需要人工干预。 此外,车牌图像识别技术超速抓拍、门禁管理等方面也有一定的应用,但与前述三个方面的应用一样,还存在着一些问题有待于解决。其中,车牌识别正确率是目前车牌识别产品中存在的最主要的问题,也是国内主流厂商最为头疼的问题,各个厂商所声称的识别正确率一般在95%左右
25、,与真正智能化的要求还有一定的距离。而且由于并没有建立一个标准规范的测试体系,因此有关数据的客观公正性、可比性和可靠性等方面尚值得商榷。由于各个厂商对其使用的车牌图像识别技术都是不公开的,我们很难了解其中采用的三个方面的关键技术(车牌区域定位、单个字符区域切分、字符分类识别)中使用的具体方法,因此很难具体评价其方法的优劣。但通过各个厂商在其有关网站提供的信息和对两家厂商提供的测试软件进行一定数量样本的测试后,可以发现,各个厂商声称的车牌识别正确率往往是通过对特定场所、特定时间范围内的样本进行测试而得出的结论。也就是说,所采用的车牌图像识别技术往往还在一定程度上要依赖待识别图像具体的采集环境和采
26、集方式等因素。如果这些因素变动时,就可能要根据具体的样本、通过一定的分析学习过程以确定和修改使用的有关参数,才可能获得较好的识别效果,否则其识别正确率可能不会很理想。由此可以推断,目前的车牌图像识别产品对于不同使用环境的适应性还不是特别理想,其原因主要是关键技术对于不同背景和不同自然条件下所采集图像的适应性还不是很好,会导致车牌识别产品软件的通用性还不是太好,往往需要在现场采集大量样本分析测试,并且要修改相应参数甚至方法,使得施工周期往往较长,识别结果的可靠性往往也不能让人完全放心。1.2.2 车牌图像识别技术研究现状上世纪90年代中后期开始,随着数字图像处理基础理论的不断发展和视频处理技术、
27、电子技术及计算机信息技术的迅速进步,国内从事车牌图像识别技术研发的厂商和研究人员增长迅速,提出了大量的关键技术算法,实际应用中也取得了一定的成果。 有关研究大多围绕车牌图像识别的三大关键技术(车牌区域定位、单个字符区域切分、字符分类识别)进行。通过对有关资源数据库中1998年2006年在各类期刊上公开发表的约380篇相关论文的统计,发现有关车牌区域定位的内容占50%以上。这在一定程度上反映了车牌定位技术的重要地位,也一定程度上反映出目前这方面尚有不尽人意之处。相关论文中提出了很多车牌图像处理、分割、分析、识别的算法,主要利用较经典的图像空间变换、智能计算和数据挖掘理论,并在一定程度上进行了实验
28、论证。 在车牌区域定位方面,公开资料中提出的方法主要有:基于神经网络分类器的车牌区域定位方法、基于彩色图像特征的车牌区域定位方法、基于纹理检测和边缘检测的车牌区域定位方法、基于区域的车牌区域定位方法、基于几何形状特征的车牌区域定位方法、基于离散图像空间变换的车牌区域定位方法、基于离散图像空间变换的车牌区域定位方法、基于遗传算法的车牌区域定位方法等。 在车牌字符切分方面,公开资料中提出的方法主要有:基于二值(灰度)图像水平(垂直)投影分布的车牌字符的切分方法、基于二值图像字符区域上下轮廓分布的车牌字符切分方法、基于模板匹配的车牌字符切分方法、基于聚类分析的车牌字符切分方法、基于车牌二值图像字符连
29、通性的字符切分方法、基于颜色分类的车牌字符切分方法等。 在车牌字符分类识别时的特征选择和提取方面,公开资料中利用的字符分类特征主要有:以二值图像中字符的笔画像素分布为基础的字符特征(主要包括四周边特征、粗网格特征、投影特征等)、以二值图像字符轮廓、骨架为基础的字符特征(包括字符笔画方向线素特征、汉字结构特征点特征等)、基于灰度图像小波变换的字符特征(包括小波系数特征、小波矩特征和小波能量特征)。 在车牌字符分类器设计方面,公开资料中提出的分类器主要有: 神经网络分类器、模板匹配分类器、基于概率统计的Bayes分类器、几何分类器等。 上述方法的提出,为本文的有关研究提供了重要的参考和对照,在本文
30、的第三章中进行了相应的分析4 5。1.3 设计的研究内容和方法1.3.1 研究内容车牌照识别是智能交通系统的一个重要课题,在车辆管理、不停车收费等系统中有广泛应用。基于中国车牌照的特点,我们需要设计一种能识别汉字的车牌照识别系统,使得这样的车牌照识别系统更优于其他只能识别数字和字母的系统,具有更广的适应性。车牌区域定位、单个字符区域切分和字符分类识别作为车牌图像识别系统的三个关键技术,同时又是一个有机的整体。关键技术水平的高低,决定了一个车牌图像识别产品性能的优劣,在某种程度上也决定着车牌识别技术的应用前景。对于92式普通民用车牌,识别的基本过程如图1-1所示。原始图像 车牌定位 字符分割 识
31、别第一个字符 识别第七个字符图1-1 92式普通民用车牌识别过程上述过程可以看作是一个三个方面九个环节组成的链式结构,而本课题主要研究的是其第三方面第一个环节的“识别第一个字符”,即汉字识别的方法。所以不考虑车牌定位及字符分割对识别的影响。采用的汉字库为已经分割好的灰度图像。1.3.2 研究方法本文在参考大量有关车牌图像识别技术公开资料的基础上,围绕着车牌汉字识别技术实际应用的特点和要求,并通过一定的实验分析手段,主要进行了如下几方面的工作:1对输入的车牌汉字字符图像进行预处理 在这部分工作中,重点分析研究了不同图像的规格化,灰度图像的二值化、反色、二值化图像的细化等方法在车牌图像识别中的作用
32、和应用特点。(1) 关于图像的规格化 在实际车牌采集时,由于拍摄角度、摄像头与车牌的距离等原因,照成采集到的车牌大小不同。给汉字特征提取造成计算量的不确定性。所以我们想法将输入的图像转化为某一固定尺寸大小的图像。图像的规格化就是将输入的任意尺寸(大小)的字符图像都处理成统一尺寸的标准汉字图像。在这里,我们所说的规格化不是简单的宽和高的同比例缩放,还要求保持拓扑不变。在改变原字符图像宽高比例的同时,尽可能的突出所提取特征。降低汉字图像特征提取的计算的复杂度。(2) 关于图像的二值化 在车牌图像识别中,图像二值化是一个非常重要的技术。目前提出的车牌字符切分和字符分类特征提取的方法,很多是以二值图像
33、为基础的。二值化阈值的确定应该以对图像进行二值化时期望达到的目的为依据。通过阈值的正确选择可以使汉字图像的灰度图像中的部分干扰噪声取出。在车牌图像识别中,对车牌汉字图像进行二值化可以大大的提升图像处理速度,而且降低对计算机硬件的要求,减少硬件方面的开支。在实际应用和产品推广方面有巨大的优势。(3) 关于图像的反色 在所提供的汉字库中,车牌汉字图像为白底黑字。由于MATLAB所提供的很多图像处理函数是对黑底白字的图像进行处理。如果自负图像为白底黑字,MATLAB会默认为汉字图像的背景为待识别图像。所以我们对二值化后的图像进行取反,将原二值化后的二值化图像转化为黑底白字的汉字图像,以供后面进一步进
34、行处理。(4) 关于图像的细化 二值图像的细化处理是本课题中起着非常重要的作用。其主要目的是提取出汉字图像的骨架,使得在识别过程中不会因为笔画本身的宽度,如使得三像素宽的竖当成宽来提取,影响到汉字结构特征提取的准确度。所以我们使用细化处理,将图像汉字细化为一个单像素宽的汉字图像。这样就可以大大增加各笔画提取的准确度。2对输入的车牌汉字字符图像进行字符特征提取 特征空间的设计是模式识别系统的基础。所选用的特征空间应使各类样品能够分布在该特征空间中彼此分开的区域内,分类识别才有可能;如果不同类别样品在该特征空间中混杂在一起,则一般不可能进行正确的分类识别。常选取的字符特征主要有以二值图像字符的笔画
35、像素分布为基础的字符特征及提取方法,以二值图像字符轮廓、骨架为基础的字符特征及提取方法,基于灰度图像小波变换的字符特征等。本课题所用的特征提取方法在二值图像字符轮廓、骨架为基础的字符特征及提取方法的基础上改进而来的。我们称为汉字结构笔画特征提取法。 3基于车牌汉字的特点,建立一个车牌汉字字符标准识别样本字库 车牌汉字字符标准识别样本库的建立要根据第二步所提取的字符特征的提取来建立。在第二步中,我们提取的字符特征为汉字的不相连独立结构、汉字笔画横、竖及撇、捺、点的个数。所以建立的车牌汉字字符标准识别样本库实际就是样本车牌汉字图像的四维特征向量库。 4通过训练统计或模式识别法来识别汉字并给出结果 在汉字识别系统中,现