毕业设计论文车牌号码识别仿真.doc

上传人:sccc 文档编号:4881846 上传时间:2023-05-21 格式:DOC 页数:25 大小:963.02KB
返回 下载 相关 举报
毕业设计论文车牌号码识别仿真.doc_第1页
第1页 / 共25页
毕业设计论文车牌号码识别仿真.doc_第2页
第2页 / 共25页
毕业设计论文车牌号码识别仿真.doc_第3页
第3页 / 共25页
毕业设计论文车牌号码识别仿真.doc_第4页
第4页 / 共25页
毕业设计论文车牌号码识别仿真.doc_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《毕业设计论文车牌号码识别仿真.doc》由会员分享,可在线阅读,更多相关《毕业设计论文车牌号码识别仿真.doc(25页珍藏版)》请在三一办公上搜索。

1、温州大学城市学院本科毕业设计(论文)本科毕业设计(论文)( 2010 届 )题 目:车牌号码识别仿真 分 院:电子信息分院专 业:电子信息工程班 级:06电子本1姓 名:学 号:指导老师:完成时间:2010年4月21摘 要车牌识别系统在交通的智能监视和管理中有着重要的应用,近几年发展非常迅速。基于图像和字符识别技术的车牌字符识别系统也是目前国内外模式识别应用研究领域的一个热点。尽管车牌的先验知识比较丰富,但是在复杂的背景下,车牌中的字符识别仍然比较困难。目前的车牌识别系统大多是针对简单场景、单一车牌。车牌字符识别系统的关键技术包括数字图像处理、车牌定位、车牌字符分割和字符识别技术。本文对已定位

2、好的车牌进行图像位图读取、图像二值化、字符分割、提取字符特征、BP神经网络设计等模块进行了初步的研究。在字符分割方面,分析了牌照图像二值化与标准归一化以及几何校正的各种算法。借助牌照字符固定宽度、间距的固定比例关系等先验知识实现字符的分割。在特征提取方面,将字符归一化,再采用13特征法进行字符特征提取。在字符识别方面,分析比较了常用的字符识别方法。在此基础上详细分析基于BP神经网络的识别方法。实验结果证明,所采用的BP神经网络具有良好的性能满足在复杂环境下实时识别车牌的要求,具有一定的理论和实际意义。关键词:车牌字符识别;特征提取;BP神经网络;MATLAB ABSTRACTLicense p

3、late recognition system has important applications in the intelligent traffic monitoring and management developed rapidly in recent years. Based on image and character recognition technology license plate recognition system pattern recognition at home and abroad is also a hot field of applied resear

4、ch. Although the license plate of the prior knowledge rich, but in a complex background, the license plate of the character recognition is still more difficult. Most of the current license plate recognition system is a simple scenario for a single plate. The key technologies of license plate recogni

5、tion system include digital image processing, license plate location, license plate character segmentation technology. This article has been positioning for a good license plate reads the bitmap image, image binarization, character segmentation, feature extraction of characters, BP neural network de

6、sign module for a more detailed study.In the character segmentation area. Analyze of the license plate image binarization with the standard normalization and geometric correction algorithms. With fixed-width character license, a fixed proportion of the relationship between the pitch prior knowledge

7、to achieve segmentation of characters.In feature extraction. The character normalization, again using 13 features of character feature extraction method.In character recognition, analyze and compared of the common character recognition. On the basis of this detailed analysis based on BP neural netwo

8、rks recognition. The results show that BP neural network used good performance in a complex environment to meet real-time identification license plate requirements, with some theoretical and practical significance. Keywords:License plate character recognition;Feature Extraction;BP neural network; MA

9、TLAB.目 录摘 要IABSTRACTII1 绪论11.1 课题背景11.2 国内外研究现状22 图像的预处理42.1 图像的二值化42.2 牌照上下边框和铆钉的去除52.3 车牌字符细化52.4本章小结63 车牌字符分割74 车牌字符特征提取94.1字符常用的特征提取方法94.2十三点网格特征提取方法105 车牌字符的识别115.1 字符识别简介115.2 基于BP神经网络的字符识别125.3BP神经网络的设计135.3.1 输入层神经元个数135.3.2 隐含层神经元数目135.3.3 输出层神经元个数135.3.4 传递函数的选择145.3.5 BP网络的参数设置145.3.6 BP神

10、经网络的创建145.4 BP神经网络的运用186 结论19致谢20参考文献211 绪论1.1 课题背景近几年,我国道路交通迅猛发展随之也带来了对交通管理自动化的迫切需求。车牌自动识别的研究与开发一直是现代化交通发展中倍受关注的问题,也是制约交通系统智能化、现代化的重要因素。智能交通系统己成为当前交通管理发展的主要方向。而车牌识别技术作为智能交通系统的核心,起着举足轻重的作用。车牌自动识别系统具有广泛的应用范围,主要应用于:高速公路收费、监控管理;小区、停车场管理;城市道路监控、违章管理;车牌登录、验证;车流统计、安全管理等。车牌自动识别系统应用于这些系统,可以解决通缉车辆的自动稽查问题,可以解

11、决车流高峰期因出入口车流瓶颈造成的路桥卡口、停车场交通堵塞问题,可以解决因工作人员作弊造成的路桥卡口、高速公路、停车场应收款流失的问题,还可以以最简单的方式完成交通部门的车辆信息联网,解决数据统计自动化,模糊查询的问题。车牌自动识别系统可安装于公路收费站、停车场、十字路口等交通关卡处,其具体应用可概括为:交通监控利用车牌识别系统的摄像设备,可以直接监视相应路段的交通状况,获得车辆密度、队长、排队规模等交通信息防范和观察交通事故。它还可以同雷达测速器或其他的检测器配合使用,以检测违犯限速值的车辆。当发现车辆超速时,摄像机获取该车的图像,并得到该车的牌照号码,然后给该车超速的警告信号。交通流控制指

12、标参量的测量为达到交通流控制的目标,一些交通流指标的测量相当重要。该系统能够测量和统计很多交通流指标参数,如总的服务流率,总行程时间,总的流入量流出量,车型及车流组成,日车流量,小时/分钟车流量,车流高峰时间段,平均车速,车辆密度等。这也为交通诱导系统提供必要的交通流信息。高速公路上的事故自动测报这是由于该系统能够监视道路情况和测量交通流量指标,能及时发现超速、堵车、排队、事故等交通异常现象。对养路费交纳、安全检查、运营管理实行不停车检查根据识别出的车牌号码从数据库中调出该车档案材料,可发现没及时交纳养路费的车辆。另外,该系统还可发现无车牌的车辆。若同车型检测器联用,可迅速发现所挂车牌与车型不

13、符的车辆。车辆定位由于能自动识别车牌号码,因而极易发现被盗车辆,以及定位出车辆在道路上的行驶位置。这为防范、发现和追踪涉及车辆的犯罪,保护重要车辆(如运钞车)的安全有重大作用,从而对城市治安及交通安全有重要的保障作用。车牌自动识别系统拥有广阔的应用前景,但若在每个街口都装配一套全新的车辆探测器的硬件系统则投资巨大,所以急需一个纯软件实行的车牌自动识别系统来最大限度的减少费用,而纯软件的设计,不仅投资小而且灵活性高,适合我国的国情。1.2 国内外研究现状从20世纪90年代初,国外就已经开始了对汽车牌照自动识别的研究,其主要途径就是对车牌的图像进行分析,自动提前车牌信息,确定汽车牌号。在各种应用中

14、,有使用模糊数学理论也有用神经元网络的算法来识别车牌中的字符,但由于外界环境光线变化、光路中有灰尘、季节环境变化及车牌本身比较模糊等条件的影响,给车牌的识别带来较大的困难。国外的相关研究有:J Barroso提出的基于扫描行高频分析的方法;Lancaster IT提出的类字符分析方法等。为了解决图像恶化的问题,目前国内外采用主动红外照明摄像或使用特殊的传感器来提高图像的质量,继而提高识别率,但系统的投资成本过大,不适合普遍的推广。车牌识别系统中的两个关键子系统是车牌定位系统11和车牌字符识别系统。关于车牌定位系统的研究,国内外学者已经作了大量的工作,但实际效果并不是很理想,比如车牌图像的倾斜、

15、车牌表面的污秽和磨损、光线的干扰等都是影响定位准确度的潜在因素。为此,近年来不少学者针对车牌本身的特点,车辆拍摄的不良现象及背景的复杂状况,先后提出了许多有针对性的定位方法,使车牌定位在技术和方法上都有了很大的改善然而现代化交通系统不断提高的快节奏,将对车牌定位的准确率和实时性提出更高的要求。因而进一步加深车牌定位的研究是非常必要的。车牌字符识别是在车牌准确定位的基础上,对车牌上的汉字、字母、数字进行有效确认的过程,其中汉字识别是一个难点,许多国外的LPR系统也往往是因为汉字难识而无法打入中国市场,因而探寻好的方法解决字符的识别也是至关重要的。目前己有的方法很多,但其效果与实际的要求相差得很远

16、,难以适应现代化交通系统高速度、快节奏的要求。因而对字符识别的进一步研究也同样具有紧迫性和必要性。从实用产品来看,如以色列的HiTech公司研制的多种See/Car system,适应于几个不同国家的车牌识别,就针对中国格式车牌的See/Car system而言,它不能识别汉字,且识别率有待提高。新加坡Optasia公司的VLPRS产品,适合于新加坡的车牌,另外日本、加拿大、德国、意大利、英国等西方发达国家都有适合于本国车牌的识别系统。我国的实际情况有所不同,国外的实际拍摄条件比较理想,车牌比较规范统一,而我国车牌规范不够不同汽车类型有不同的规格、大小和颜色,所以车牌的颜色多,且位数不统一,对

17、处理造成了一定的困难。在待处理的车牌图像中就有小功率汽车使用的蓝底白字牌照,大功率汽车所用的黄底黑字牌照,军车和警车的白底黑字,红字牌照,还有国外驻华机构的黑底白字牌照等。就位数而言,有七位数字的,有武警车九位数字的,有军车前两位字符上下排列的等,所以也造成了处理的难度。国内做得较好的产品主要是中科院自动化研究所汉王公司的“汉王眼”,此外国内的亚洲视觉科技有限公司、深圳市吉通电子有限公司、中智交通电子系统有限公司等都有自己的产品,另外西安交通大学的图像处理与识别研究室、上海交通大学的计算机科学与工程系、清华大学、浙江大学等都做过类似的研究。通常处理时为了提高系统的识别率,都采用了一些硬件的探测

18、器和其他的辅助设备如红外照明等,其中“汉王眼”就是采用主动红外照明和光学滤波器来减弱可见光的不可控制影响,减少恶劣气候和汽车大小灯光的影响,另外还要求在高速公路管理窗口到“汉王眼”识别点埋设两条线路管道,一条管道铺设220伏50赫兹1安培的交流供电线路;另一条管道铺设触发信号线路和汉王眼与管理计算机的通讯线路,投资巨大,不适合于大面积的推广。另外,还有两种专门的技术被用于车牌的识别中,条形码识别技术和无线射频技术。条形码识别要求预先在车身上印刷条形码,在系统的某一固定位置上安装扫描设备,通过扫描来读取条形码,以达到识别车辆的目的。无线射频技术要求在车内安装标示卡,在系统某一位置安装收发器等装置

19、,通过收发器来接受标示卡的信号,从而识别出经过的车辆。显然,这两种技术更难以推广。从目前一些产品的性能指标可以看出,车牌识别系统的识别率和识别速度有待提高。现代交通的飞速发展以及车牌识别系统应用范围的日益拓宽给车牌识别系统提出了更高的要求。因此,研究高速、准确的定位与识别算法是当前的主要任务,而图像处理技术的发展与摄像设备、计算机性能的提高都会促进车牌识别技术的发展,提高车牌识别系统的性能。2 图像的预处理2.1 图像的二值化二值图像是指整幅图像画面内仅黑、白二值的图像。在数字图像处理中,二值图像占有非常重要的地位。这是因为,一方面,有些需要处理的如文字图像、指纹图像、工程图纸等图像本身是二值

20、的;另一方面,在某些情况下即使图像本身是有灰度的,我们也设法使它变成二值图像再进行处理(即灰度图像的二值化)。这是考虑到在实用的图像处理系统中,要求处理的速度高、成本低、信息量大的浓淡图像处理的花销太大。此外,二值化后的图像能够用几何学中的概念进行分析和特征描述,比灰度图像优势大的多。在实际的车牌处理系统中。进行图像二值变换的关键是要确定合适的阈值,使得字符与背景能够分割开来,而且二值变换的结果图像必须要具备良好的保形性,不丢掉有用的形状信息,不会产生额外的空缺等等。同时,车牌识别系统要求处理的速度高、成本低、信息量大,采用二值图像进行处理,能大大地提高处理效率。二值化的关键是要找到合适的阈值

21、t来区分对象和背景。设原灰度图像为f(x,y),二值化后的图像为g(x,y),二值化的过程表示如下:g(x,y)= (2-1)阈值t的选择是关键,在这里运用了matlab图像处理工具箱(image processing toolbox)中的graythresh函数去求阈值,再运用二值图像函数im2bw将图像二值化。此时图像就是一个只含有0和1的矩阵,这对后面的图片操作方便了很多2。例如:I=imread (2.bmp); Level=graythresh (I);BW=im2bw (I, level);Figure; imshow (BW);程序运行结果如图2.1所示。Level是阈值,取值在

22、01之间。当输入图像的亮度小于level时,对应的输出图像的像素值为0,其他地方均为1。图2.1 二值化后的车牌将车牌图像进行二值化后,图像仅黑、自二值。白色像素点(灰度值255)取1,黑色像素点(灰度值0)取0。2.2 牌照上下边框和铆钉的去除在实际处理中,我们面对的要识别的牌照字符背景非常复杂,存在较大的干扰、噪声。当车牌的二值图像统一为黑底白宇后,会有汽车保险杠与牌照四条边框的残缺图像以及牌照上两个铆钉干扰的一个区域。借助一些先验知识,采取一些图像处理的方法可以从上述复杂背景中去除干扰。因为国内车牌的规格都是统一的,固定车牌的铆钉位置也是一样的,所以我只需在铆钉的位置上赋值0,原来的铆钉

23、区域就变成黑色了。例如:BW (1:2, 30:39) =0;BW (1:2,107:114) =0;BW (35:36, 85:146) =0;Figure;imshow (BW);程序运行结果如图2.2所示。图2.2 去除后2.3 车牌字符细化在被识别的各种文字字符中,由于不同文字和不同字体,笔划的粗细长短是不同的,使得它们的差别较大,这对后面的车牌字符特征提取有很大的影响,进而影响了车牌字符识别的准确性。如果将它们的线条进行细化以后,可以得到统一的宽度,那么对后面的工作将十分有利,因而对字符进行细化是必须的。对于字符细化,通常要遵守如下几条原则:要保持原有笔划的连续性,不能由于细化造成笔

24、划断开;要细化为单线,细化后的骨架应尽量是原来笔划的中心线;要保持字符原有特征,既不增加也不丢失。在字符细化方面,我运用了matlab的image processing toolbox中的bwmorph函数来将目标细化2。例如:bw_skel=bwmorph (BW,skel, 6);figure;imshow (bw_skel);程序运行结果如图2.3所示。图2.3 细化后细化后的车牌能很好的解决因拍摄距离等原因造成的字符粗细不一,从而影响特征值之间的误差。2.4 本章小结本章图像预处理环节是十分重要的,这对后面的字符分割和字符识别有着重要的影响,而这正借靠着matlab图像处理工具箱强大的

25、功能,才得以实现。3 车牌字符分割字符分割的任务就是把车牌图像中的每个字符从整个图像中分割出来,使其成为单个字符。字符分割是字符识别的基础,字符分割的质量直接影响到字符识别的效果。字符分割之前,首先要进行图像的二值化,然后再进行字符分割,从而分割出一个个具体的二值图表示的字符图像点阵,作为单字符识别的输入数掘。而我国车牌包含有7个字符,其中第一位是汉字,第二位是字母、第三、四位有可能是字母,也有可能是数字,第五、六、七位目前都是数字只有从车牌图像中准确的切割出单个车牌字符出来并进行归一化,才能为之后的神经网络或模板匹配识别器进行识别做好准备工作。字符分割常用算法7主要有水平投影法、模板匹配法、

26、聚类分析法,并且各种方法特点如下:水平投影法此方法比较常用,主要是针对在车牌定位、图像预处理后比较规则的车牌图像。优点:程序逻辑设计简单,循环执行功能单一,便于设计和操作;程序执行时间快(小于20 ms)。缺点:对字符的粘连问题,解决得不很理想;在解决一些汉字的不连通问题上也存在不足。模板匹配法这是另一种形式的水平投影方法,只是相比于第1种方法,设计的程序更加周密,边界划分得更加精确了。优点:程序执行时闻与水平投影方法相近:较好地解决了汉字不连通问题;较好地解决了车牌字符分割中存在的如复杂背景的干扰、车牌尺寸的变化、车牌磨损造成字符粘连等难题。缺点:程序逻辑设计复杂,循环扫描执行功能较多;对车

27、牌中的左右边框的分割有待改进;对一些特殊车牌如上下两行字符的车牌,本算法并不适用。聚类分析法该方法是利用模式识别中聚类分析算法来实现车牌字符分割的,也是当今比较流行的分割算法,其发展空阀比较宽阔。优点:较好地解决了汉字不连通问题;较好地解决了车牌字符分割中存在的噪声干扰、车牌磨损造成字符粘连等难题;通过改变预设类心的坐标,可以较好地处理一些新式车牌如上下两行字符的车牌;缺点:程序逻辑设计复杂,循环嵌套较多,执行时闻不如前两者快;为了提高预设类心的精确度,对车牌盼宽度有一定的限制。在字符分割方面,我并没有参考以上方法,而是借鉴了老师所提的在给定矩形区域进行剪切。因为上面已说,此次设计是在定位好的

28、车牌上进行剪切,而定位好的车牌尺寸大小是统一的,且根据我国车牌内的字符规律,标准车牌,字符间间距为12mm,第二、三个字符间间距为34mm,其中,中间小圆点宽10mm,小圆点与第二、三个字符的间距分别为12mm。根据这些先验知识,可以将字符区域划分好,且统一划分为2036,这对后面的字符特征提取有很好的帮助。例如:I = imread (2.bmp);level = graythresh (I);BW = im2bw (I, level);figure(7), imshow (BW);A=BW (1:36, 20:39);figure (1), imshow (A);B= BW (1:36,

29、48:67);figure(2), imshow (B);C= BW (1:36, 68:87);figure(3), imshow(C);D= BW (1:36, 88:107);figure (4), imshow (D);E= BW (1:36,108:127);figure (5), imshow (E);F= BW (1:36,127:146);figure (6), imshow (F);各车牌读入后,程序运行结果如表3.1所示。表3.1 字符分割4 车牌字符特征提取在车牌识别中,对获得的图像直接进行分类是不现实的,与其它识别系统一样,牌照字符识别系统的关键也在于字符特征的提取,也

30、就是如何选取既容易提取又能为识别系统提供尽可能高的模式鉴别能力,同时还要尽量少的特征维数的特征向量,它应该是最佳的样本特征属性的度量。特征的提取和选择对识别系统至关重要,它基本上决定了识别系统的性能和识别精确度,甚至还可能影响到整个系统的识别的成功与否。一般来说,用于字符识别的分类特征应满足以下要求:具有较强的分类能力,即同一类中各样本间距离应尽量小,而类与类之间的距离则应尽量大,最好没有交叠部分。具有较高的稳定性和抗干扰性,对字符的平移、旋转和尺度交换不敏感,受字符笔划断裂或粘连的影响尽可能小。特征向量应便于提取,算法要尽量简便,在保证识别系统的性能的条件下,特征向量的维数不能过高,以减少机

31、器开销,提高运算速度。4.1 字符常用的特征提取方法字符的识别特征可以分为结构特征和统计特征。结构特征12主要有骨架、轮廓、笔画等得到的结构特征。骨架特征的提取技术极大地依赖于图像细化质量,由于现有的细化算法都或多或少的出现一些拓扑结构的改变,如Y形分叉、毛刺、断线等,这就要求后继的识别有较大的灵活性,目前以骨架系统为主要方法的识别系统已很少。轮廓可以反映字符图像的结构,轮廓大致有两种描述方式:其一,同骨架一样,用结构点和弧,构成图的方式来描述:其二,则用标准化后的轮廓距边框的距离来攒述,对骨架引入了更精确的定位,也节省了细化的运算量,但容易受到笔画宽度和断线的影响,它较适用于图像质量较好、书

32、写较固定的环境。统计特征是从原始数据中提取与分类最相关的信息,使类内差距极小化,类间差距极大化。特征应对同一类字符的形变尽量保持不变,统计特征可以分为全局特征和局部特征。全局特征是对整个字符图像进行变换,将变换的系数作为图像的一种特征,主要包括:Gabor变换、矩特征、代数特征、小波交换、粗外围特征等。局部特征是在特定的位置对特定大小的窗内对象进行变换,主要包括局部灰度特征、投影特征、方向线素特征等。4.2 十三点网格特征提取方法当字符存在倾斜和偏移时都会对识别产生误差,13点特征提取方法可以解决这些问题,它是适应性比较强的特征提取方法,即从每个字符中提取13个特征点。算法如下4:把字符水平分

33、成两份,垂直分成四份,分别统计这8个区域的白像素的个数,得到8个特征。水平和垂直各划两条线把水平和垂直分割成三分, 统计这四条线穿过的白像素个数,得到4个特征。字符图像全部白像素数目作为1个特征, 总共得到13个特征。本次设计采用两种方法来提取特征值,因为我在后面的神经网络环节分别设计了用于识别数字的BP网络和用于识别英文的BP网络。数字环节我就统计字符图像整个白像素值,因为字符细化后,我发现车牌分割下来后整个字符图片中的白像素值和样本的很相近,且10个数字各个数统计后特征值不是很相近,所以我才有这个特征作为数字的特征值。而英文字符环节,因为字符比较多,所以采用十三点特征提取法来求英文字符的特

34、征值。在求特征值时,运用到很多关于矩阵方面的知识14, 包括阵列元素求和、矩阵转置等,例如: I = imread (2.bmp);numVal_1=sum (sum (I);该程序运行结果是统计了某幅二值图像的全部白像素数目。再按以上十三法,运用该程序可求得各部分的值,表4.2是对图2.3提取的十三特征。表4.2 各字符的十三点网格特征字符12345678910111213A01570716146681265T51853015201111480696579557485 车牌字符的识别5.1 字符识别简介字符识别属于模式识别的范畴。针对模式特征的不同选择及其判别决策方法的不同可将模式识别方法大

35、致分为4大类。这4类识别方法均可实现字符识别,但它们特点不同,必须根据条件进行选择8。统计模式法:对已知类别的模式样本进行各种特征的提取和分析,选取对分类有利的特征,并对其统计均值等按已知类别分别进行学习,按贝叶斯最小误差准则,根据以上统计特征设计出一个分类误差最小的决策超平面,识别过程就是对未知模式进行相同的特征提取和分类,通过决策平面方程决定该特征相应的模式所属的类别。此方法比较成熟,能考虑干扰、噪声等的影响,识别模式基元能力加。但对结构复杂的模式抽取特征困难;不能反映模式的结构特征,难以描述模式的性质,难以从整体角度考虑识别问题,统计特征法它的抗干扰能力不足,对存在较大噪声的字符的识别比

36、较困难。逻辑特征法:就是其特征的选择对一类模式识别问题来说是独一无二的,即在一类问题中只有1个模式具有某1种逻辑特征,此力法建立了关丁知识表示及组织,目标搜索及匹配的完整体系,对需通过众多规则的推理达到识别目示及组织,目标搜索及匹配的完整体系,对需通过众多规则的推理达到识别目标的问题有很好的效果,但当样品有缺损,背景不清晰,规则不明确甚至有歧义时,效果不好,它也不适于对存在较大噪声的字符的识别。模糊模式方法:就是在模式识别过程中引入了模糊集的概念,由于隶属度函数作为样品与模板相似程度的量度,故能反映整体的、主要的特性,模糊模式有相当程度的抗干扰与畸变,从而允许样品有相当程度的干扰与畸变,适于对

37、存在较大噪声的字符的识别,但准确合理的隶属度函数往往难以建立。目前有学者在研究,并将其引入神经网络方法形成模糊神经网络识别系统。神经网络方法:就是使用人工神经网络方法实现模式识别。可处理一些环境信息十分复杂,背景知识不清楚,推理规则不明确的问题允许图像有较大的缺损、畸变,神经网络方法的缺点是其模型在不断丰富完善中,目前能识别的模式类还不够多,神经网络方法允许样品有较大的缺损和畸变,这正是识别存在较大噪声的印刷体字符的识别所需要的。在车牌识别中要识别的字符并不多,所以用神经网络方法实现不必考虑其识别类不够多的问题。5.2 基于BP神经网络的字符识别前向反馈(Back Propagation,简称

38、BP)网络通常是指基于误差反向传播算法(BP算法)的多层前向神经网络。目前在人工神经网络的实际应用中,绝大部分的神经网络模型是采用网络和它的变化形式,它也是前向网络的核心部分,体现了人工神经网络最精华的部分。据统计有近90的神经网络应用是基于BP算法的。与感知器和线性神经网络不同的是,BP网络的神经元采用的传递函数通常是sigInoid型可微函数,所以可以实现输入和输出间的任意非线性映射。BP网络由输入层、隐含层和输出层构成,相邻层之问的神经元全互连,同一层内的神经元无连接。下面以图5.1所示的具有一个中间层(隐层)的三层BP网络来介绍BP算法的实现。图5.1中,输入层、中间层和输出层的单元数

39、分别是N、L和M,输入为X0,Xl,XN-1;中间层输出为ho,h1,hL-1;网络实际输出为yo,yl,yM-1;do,dl,dM-1表示训练样本期望输出。输入单元i到中间单元j的权值为Vij中间单元j到输出单元k权值为Wjk,用k和j来分别表示输出单元和中间单元的阀值。Y0WjkVijX0 Y1X1Ym-1Xn-1图5.1 具有一个隐层的三层BP网络于是,中间层各单元的输出为: (5-1)输出层各单元的输出为: (5-2)5.3 BP神经网络的设计设计BP网络的关键之处在于大量的有代表性的训练样本,以及高效、稳定、快速收敛的学习方法。BP网络的应用过程如图5.2 所示。识别结果BP网络样本

40、图片识别训练待识别数据 图5.2 BP网络的应用过程5.3.1 输入层神经元个数BP网络的输入层的节点个数,为图像预处理后所求的特征的维数。因为本次设计英文网络使用的是十三特征法,所以英文网络输入层神经神经元个数为13。数字网络为1。5.3.2 隐含层神经元数目在 BP网络中,隐含层节点数不仅与输入/输出层的节点数有关,更与需解决的问题的复杂程度和转换函数的形式以及样本数据的特性等因素有关。一般地,隐含层神经元的数目越多,BP网络越精确,但是训练时间也就相应越长。如果隐含层神经元选取太多,会造成识别率急剧下降,降低抗噪能力。确定隐含层节点数的基本原则是:在满足精度要求的前提下取尽可能紧凑的结构

41、,即取尽可能少的隐含层节点数。本次设计隐层神经元个数确定为22。5.3.3 输出层神经元个数输出层的节点数的确定,决定于如何设定标准输出,也就是说如何对目标期望输出进行编码。本次设计是对车牌中的数字和英文进行识别,所以我设计了两组神经网络,即用于识别数字的数字神经网络和用于识别英文的英文神经网络。在数字环节,因为识别的是 0-9十个数字,所以输出就是十个数以一组的方式输出,输出神经元就是1。在英文字符环节,识别的是A-Z除I外25个字母共35个字符。所以输出就是25个数以一组的方式输出,输出神经元个数确定为1。在编码时,0-9还是以0-9十个数字来作为目标向量来输出,而英文字母将用数字10-3

42、4来作为目标向量来输出。详见表5.3。虽然输出35个数,但是它们是以一组数的形式一起输出的,所以本次设计的两组网络输出神经元个数都为1。表5.3 各字符对应目标输出字符目标字符目标字符目标字符目标0099J18S2711A10K19T2822B11L20U2933C12M21V3044D13N22W3155E14O23X3266F15P24Y3377G16Q25Z3488H17R265.3.4 传递函数的选择BP网络中神经元的传递函数通常用log-sigmoid型函数logsig()、tansigmoid型函数tansig()以及纯线性函数purelin()。每个函数的功能都不一样,log-s

43、igmoid型函数输出约束在0和1之间,tansigmoid型函数输出约束在-1和1之间,而purelin型线性函数输出可以取任意值。所以可以根据自己的要求选择不同的函数。本次设计输出的目标是0-34的任意整数,所以我选择purelin函数作为输出函数,输入层、隐含层函数都选择tansig函数。5.3.5 BP网络的参数设置1本次设计的一些参数设置如下:设置训练步数:net.trainParam.epochs=10000; 设置训练目标:net.trainParam.goal=0. 000000001; 设置训练学习速率:net.trainParam.lr=0.3; 设置动量因子:net.tr

44、ainParam.mc=0.5。5.3.6 BP神经网络的创建训练网络首先得创建一个BP网络,而创建BP网络可以用newff()来创建一个BP网络,其调用格式为:Net=newffNet=newff(PR,S1 S2SN,TF1 TF2 TFN,BTF,BLF PF)其中PR是指由每组输入(共由R组输入)元素的最大值和最小值组成的R2维矩阵。Si是指第i层的长度,共计N层。BTF是指BP网络的训练函数,BLF是指权值和阈值的BP学习算法,PF是网络的性能函数,默认为mse。本次用于识别数字的的BP网络创建如下:P=69 33 50 51 66 62 57 48 106 55;T=0 1 2 3

45、 4 5 6 7 8 9;net=newff(minmax(P),1,22 ,1,tansig,tansig,purelin,trainscg,learngd);本次用于识别英文的的BP网络创建如下:P=0 15 7 0 16 14 6 6 8 1 2 65;8 15 16 5 16 5 15 0 3 9 2 2 80;2 5 17 2 2 19 5 4 4 5 1 1;T=10 11 12 13 14 31 32 33 34 35;net=newff(minmax(P),13,22 ,1,tansig,tansig,purelin,trainscg,learngd); 其中P为输入量,数字网络P为十个数字的特征值,英文网络就是25个字符的13个特征。T为目标量,数字网络就是0-9十个数作为一组输出,英文网络就是10-34共25个数字作为一组一起输出。在英文BP网络中,13,22 ,1中的13为输入层神经元个数,因为在特征提取环节是采用十三特征法,输入13组数;22为隐含层神经元个数;1为输出层神经元个数。训练函数我选择量化连接梯度BP训练函数trainscg,学习算法函数选择learngd,这个函数是基于梯度下降法学习函数。再运用函数train就可训练上面的BP网络,具体如下:net=train(n

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号