《模式与模式识别概论.ppt》由会员分享,可在线阅读,更多相关《模式与模式识别概论.ppt(35页珍藏版)》请在三一办公上搜索。
1、第一章 概论,模 式 识 别,Pattern Recognition,1 模式及模式识别的概念2 模式识别系统3 模式识别的应用4 模式识别的方法,第一章 模式识别概论,1.1 模式及模式识别的概念,模式识别(Pattern Recognition):确定一个样本的类别属性(模式)的过程,即把某一样本归属于多个类型中的某个类型.,样本(Sample):所研究对象的一个个体,如患者的细胞、一个汉字、一幅图片、一段视频等.,模式(Pattern):对研究对象所具有的特征和信息的描述,对某类事物的抽象也成为该类的模式.,人类具有很强的模式识别能力,时刻在完成某种模式识别的任务。模式识别是从样本到类别
2、的映射。,1.1 模式及模式识别的概念,1929年 G.Tauschek发明阅读机,能够阅读0-9的数字。30年代 Fisher提出统计分类理论,奠定了统计模式识别的基础。50年代 Noam Chemsky 提出形式化语言理论,傅京荪 提出句法结构模式识别。60年代 提出了模糊集理论,模糊模式识别方法得以发展和应用。80年代以Hopfield网、BP网为代表的神经网络模型使人工神经元网络复活,并在模式识别得到广泛的应用。90年代小样本学习理论,支持向量机受到了很大的重视。,模式识别简史,1、数据获取2、预处理3、特征抽取4、分类器设计,1.2 模式识别系统,1.2 模式识别系统,分类过程,学习
3、过程,在传送带上用光学传感器件对鱼按品种分类鲈鱼(Seabass)品种鲑鱼(Salmon),模式识别过程实例,识别过程,数据获取:架设一个摄像机,采集一些样本图像,获取样本数据预处理:去噪声,用一个分割操作把鱼和鱼之间以及鱼和背景之间分开,识别过程,特征提取和选择:对单个鱼的信息进行特征选择,从而通过测量某些特征来减少信息量长度亮度宽度鱼翅的数量和形状嘴的位置分类决策:把特征送入决策分类器,识别过程,识别过程,识别过程,识别过程,识别过程,1.数据获取,为了使计算机能够对客体进行分类识别,必须将客体用计算机所能接受的形式表示,通常从客体获得的信息有下列三种类型 二维图像,如文字、指纹、照片等;
4、一维波形,如语音、机械振动波、心电团等;物理参量或逻辑值,如体温、各种实验数据等。通过测量、采样和量化,可以用矩阵或向量表示二维图象或一维波形,这就是信息获取过程。,2预处理,预处理的目的是去除噪声,加强有用的信息,并对种种因素造成的退化现象进行复原。,某人声音有杂音,清晰声音,图像预处理,语音信号预处理,模糊图像,清晰图像,3特征提取,为了有效地实现分类识别,要对原始数据进行选择或变换,得到最能反应分类本质的待征,构成特征向量。,人脸几何特征人脸部件规一化的点间距离和比率特征点如眼角、嘴角、鼻尖等人脸的颜色特征 黄皮肤、黑眼睛统计特征脸形模板和图象灰度的自相关性,4分类器设计,为了把待识模式
5、分配到各自的模式类中去,必须设计出分类判别规则。基本作法是:用一定数量的样本(称为训练样本集)确定出一套分类判别规则,使得按这套分类判别规则对待识模式进行分类所造成的错误识别率最小或引起约损失最小。分类器按已确定的分类判别规则对待识模式进行分类判别,输出分类结果。,监督学习和非监督学习,监督学习,监督学习和非监督学习,划分的类别已知,且训练样本已知类别信息,非监督学习,半监督学习,没有类别标签,通常利用聚类方法完成样本的分类,部分样本有类别标签,目标与有监督分类一致,应用领域,1.3 模式识别的应用,文本分类文本图像分析工业自动化数据挖掘多媒体数据库检索生物特征识别语音识别生物信息学遥感,1.
6、3 模式识别的应用,准确性 速度 存储量 价格,指纹识别,1.3 模式识别的应用,语音信号处理与识别,语音识别 说话人识别 语种识别 口音识别,1.3 模式识别的应用,人脸图像识别,人脸检测和定位 人脸识别 虹膜识别,应用:图象压缩视频监视基于内容的图象检索,医学信号的处理、识别和分类:细胞正常与异常判断,染色体分类,心电脑电图,测谎仪,1.3 模式识别的应用,应用领域,1.3 模式识别的应用,1.模板匹配识别方法 2.句法识别方法 3.统计识别方法 4.人工神经网络方法,1.4 模式识别方法,模版匹配,首先对每个类别建立一个或多个模版输入样本和数据库中每个类别的模版进行比较,求相关或距离根据
7、相关性或距离大小进行决策优点:直接、简单缺点:适应性差,方法,句法模式,许多复杂的模式可以分解为简单的子模式,这些子模式组成所谓“基元”每个模式都可以由基元根据一定的关系来组成基元可以认为是语言中的词语,每个模式都可以认为是一个句子,关系可以认为是语法模式的相似性由句子的相似性来决定优点:适合结构性强的模式缺点:抗噪声能力差,计算复杂度高,方法,句法模式,方法,统计方法,根据训练样本,建立决策边界 统计决策理论根据每一类总体的概率分布决定决策边界判别式分析方法给出带参数的决策边界,根据某种准则,由训练样本决定“最优”的参数本课程的重点内容,方法,神经网络,神经网络是受人脑组织的生理学启发而创立的。由一系列互相联系的、相同的单元(神经元)组成。相互间的联系可以在不同的神经元之间传递增强或抑制信号。增强或抑制是通过调整神经元相互间联系的权重系数来(weight)实现。进行大规模并行计算的数学模型优点:可以有效的解决一些复杂的非线性问题缺点:缺少有效的学习理论,方法,习题,试简述样本,模式和模式类等概念间的关系。试简述模式识别系统的主要组成部分。,