《认知心理学 模式识别课件.ppt》由会员分享,可在线阅读,更多相关《认知心理学 模式识别课件.ppt(54页珍藏版)》请在三一办公上搜索。
1、第三章 知 觉,第二节 模式识别(pattern recognition),一、模式识别 模式(事物)是由若干元素或特征按照一定的关系组合在一起构成的,比如:汉字有8种笔划和251类偏旁等特征;英文字母有水平线、斜线、垂直线、直角、锐角、连续曲线和不连续曲线7种基本特征。音乐旋律中国好味道,模式识别:是指人把输入刺激(模式)的信息与长时记忆 中的信息进行匹配,并辨认出该刺激属于什么范畴的过程。因此,对物体、图像、语音、符号或人脸的识别过程,即为模式识别。模式识别依赖于人的知识经验,离开个体已有的知识经验,就无法理解输入信息的意义。,模式识别是人的一种基本认知能力,当代认知心理学的知觉研究主要涉
2、及模式识别,特别是视知觉的模式识别。模式识别受到计算机科学家的关注,为进一步开发人工智能,人们正试图将人类的模式识别过程及其能力赋予计算机,使其具有像人一样的认知活动和人工智能。,二、模式识别过程:分析、比较和决策分析:把感觉登记中短暂滞留的感觉信息的物理特征与属性抽取出来,并把这些信息分解成各个组成成分。如:把“A”分解成2条斜线、1条水平线。比较:把这些特征或属性与长时记忆中储存的各种知识经验进行比较。决策:比较后,对刺激信息模式与哪一种记忆信息编码最为匹配作出判断,从而了解模式的意义并赋予模式名称,使刺激信息模式得到识别,即识别了某个事物。,三、模式识别理论 模板匹配理论(Templat
3、e-matching Theories)原型匹配理论(Prototype Theories)特征匹配理论(Distinctive-Feature Theories)计算途径(computational approach),1、模板匹配理论(Template-matching Theories)在人长时记忆所编码的信息中,存储着各式各样的来自个体过去的各种外部模式的拷贝或复本,即模板,它们与外部的刺激模式存在着一一对应的关系。当一个刺激作用于人的感觉器官时,刺激信息得到编码并与头脑中所存储的模板进行比较和匹配,确定哪一个模板与刺激信息最为吻合,就把该刺激信息确认为是与头脑中的某个模板相同,即产生
4、模式识别效应。模式识别是刺激信息与脑中某个或某些模板产生最佳匹配的过程。,模板匹配理论的缺陷:强调刺激信息与脑中模板的最佳匹配,如果刺激信息稍有变化,就无法与模板最佳匹配,无法完成模式识别。要求在长时记忆中存储无数个模板,会给记忆带来沉重负担,也会使人在识别事物时缺少灵活性。无法解释为何有时能够非常迅速地识别一个新的、不熟悉的事物。没有说明模板匹配的信息编码形式,即外部刺激模式与脑中模板的比较是平行加工还是系列加工;是从局部开始还是从整体开始等。,2、原型匹配理论(Prototype Theories)原型:是一类事物所具有的基本的、共同的特征。原型匹配理论:所有的外部刺激信息,都是以原型的表
5、征方式存储于人 的长时记忆系统中,任何具体事物都是通过原型及其一 系列变式存储在人脑中的。人的长时记忆中,存储着的 不是与外部客观事物一一对应的具体模板,而是一系列 客观事物的原型,外部刺激信息或事物只要能与人脑中 的原型相匹配,即完成了模式识别。,Prototype Matching,例:各种不同形状、型号的飞机,其原型是有2个翅膀的 长筒,机场停着的飞机和画里的飞机,尽管差异很 大,但由于与脑中表征的原型相似,仍然能够被识 别出来。换了发型的张老师仍然能被识别出。原型匹配理论的优点:减轻记忆负担,使人的模式识别 活动更加灵活。缺点:没有非常具体和详细地描述刺激 与原型之间的匹配过程。,(3
6、)特征匹配理论或区别性特征理论(Distinctive-Feature Theories)特征匹配理论:任何模式都可以被分解成诸多特征或属性,模式识别就是通过对刺激信息特征的分析,抽取出该刺激模式的有关特征或属性加以合并,再与长时记忆中所存储的各种刺激的特征进行比较,一旦获得了最佳的匹配,来自外部的刺激信息模式就得到了识别。例如:各种字体的同一个字,只要其基本特征保持不变,就可得到识别。,特征模型支持证据,*诺贝尔奖得主 Hubel和 Wiesel 的研究 将微电极插入动物视皮层的一系列神经元中,呈现简单视觉刺激(垂直光栅),结果表明,每个神经元只对特定方向的光栅反应特别强烈。一小块视皮层包含
7、了各种各样的神经元,分别对垂直、水平、倾斜线条作出反应,视觉系统似乎有一些专门的特征检测器,帮助我们对字母和简单模式的某些特征作出反应。,feature detector,featural analysis model fits nicely with some neurophysiological evidence.,静止网膜像(stabilized image),EIMVWXXMZWVIVIEXWMWVXQIE,CDGORURDQOCGGRDCOUDCURZG,奈塞尔的视觉搜索实验:搜索字母“Z”,原因:表1中干扰字母的直线特征与“Z”的直线特征相同。表2中干扰字母的曲线特征与“Z”的直线
8、特征不同。心理学家从中得到启示:人在模式识别过程中,首先从刺激模式中抽取特征并加以编码,然后再把目标字母和背景字母加以比较。,*Gibson的研究表明:当一些字母共用很多关键特征(如P和R)时,判断这些字母是否相同需要花更长的时间。字母G和M各自使用许多不同的区别性特征,对类似于这样的字母对,判断的速度相对要快。,*局部优先效应(Local precedence effect,Martin,1979):当局部小字母的间距更宽时,整体优先效应反转,出现局部优势效应,即对局部特征的识别优先于整体特征的识别,当局部特征和整体特征不一致时,局部特征干扰整体的识别。这说明:整体优先效应的出现有一些制约条
9、件 小字母的间距,刺激的大小。,“魔鬼城堡”模型(Pandemonium Model)(谢夫里奇)“魔宫”里群居着许多“鬼”,他们分属于4个层次,每个层次的“鬼”执行着某个特殊的任务,并依次工作,直到最终实现模式识别。“映象鬼”对外部刺激信息进行编码,形成刺激模式的表象或映象。“特征鬼”从“映象鬼”得到的表象中搜索一定的特征,每个“特征鬼”都有 其特定的功能和任务,它们只搜索和选择自己负责的那个特 征,找到后就喊叫或标记出这种刺激特征及其数量。,“认知鬼”每个“认知鬼”负责一个特殊的模式,它们在倾听“特征鬼”的喊 叫中搜索自己负责的某个模式的有关特征,一旦发现有关特 征,就会大喊大叫,发现的特
10、征越多,喊叫声就越大。“认知鬼”的喊叫声表明它们已经组合了某个字母。“决策鬼”听取所有“认知鬼”的喊叫声,判断哪一个“认知鬼”的喊叫声最 大,根据喊叫声最大的“认知鬼”来决定并呈现出那个字母。,Selfridges Pandemonium model,特征模型不支持证据,整体优先效应(Global precedence effect):当要求识别整体时,局部特征的性质,即局部特征是否与整体特征相匹配,并不影响整体的知觉。然而,当要求识别局部时,整体特征的性质,即整体特征是否与局部特征相匹配,影响局部的知觉。这提示知觉过程中存在整体优先。,特征匹配理论或区别性特征理论的优缺点:优点:更灵活有效地
11、解释人的模式识别过程。缺点:忽略了自上而下的加工过程。一个模式识别理论,不应只是简单地罗列刺激中能够发现的一些特征,还必须描述特征之间的物理关系,如:T和L特征一样,但物理关系不一样。只能解释相对简单的字母识别,很难解释更复杂的刺激的识别过程。,(4)计算途径(computational approach)主要目的在于发展一些基于计算机的理论。利用这些理论,计算机能够完成一些人类能够完成的任务,如快速和精确的三维客体识别。目前已有几个模式识别的计算途径。其中一个是Biederman 的成分识别理论。,27,可编辑,成分识别理论:一个特定观察角度的物体,可以用一些简单的三维形状的排列来表征,这些
12、简单形状为几何子。象字母一样,几何子可以构成一些有意义的东西。如,几何子3和5可以形成具有不同意义的物体,即茶杯和提桶。本质上为三维物体识别的区别性特征理论。,成分识别理论的支持证据:迄今尚未得到广泛检验,在正常人和特异性视觉缺陷的病人身上进行的一些早期研究,基本支持成分识别模型(Banks 和Krajicek,1991)。,成分识别理论的不支持证据:,Cave&Kosslyn,1993的实验:,任务:识别2种碎片,一种是与几何子一致的“自然”碎片,一种是“非自然”的碎片。结果:识别速度同样快和准确。表明:首先编码整体,然后才对部分进行分析。,上面讨论的模式识别理论主要集中在如何觉察孤立的客体
13、。自下而上加工强调刺激本身在模式识别中的重要性,与刺激有关的信息来自感受器,这些信息触发了模式识别过程,简单的基础水平特征的结合,使我们能够识别更复杂的、整体的模式。但知识和期望也能帮助我们识别客体,除了自下而上加工外,模式识别还涉及另一个重要过程,即自上而下加工,这种加工强调概念和高水平过程对模式识别的影响。,四、自上而下加工和模式识别1、背景和模式识别 字词优势效应:识别一个字词中的字母,比识别一个单独的字母的正确率要高。客体优势效应:识别一个客体图形时,图形中的线段要优于识别结构不严的图形中的同一线段或单独的线段。构形优势效应:识别一个完整的图形要优于识别图形的某一部分。,Word Su
14、periority Effect(Reicher,1969;Wheeler,1970),D WORDD K WORD WORK,2、过去经验和模式识别 Schacter和他的同事(1991)证明,与物体有关的过去经验,的确能够帮助人们识别物体。Schacter等不可能图形的实验。,五、拓扑特征检测,陈霖于1982年提出视觉拓扑理论(visual topological theory)。拓扑学是数学的一个分支,它主要研究不受形状或大小变化影响的几何图形或固体物体的特点。图形的拓扑性质是指在拓扑变换下图形保持不变的性质与关系。典型的拓扑性质包括:连通性(connectedness)、封闭性(clo
15、seness)、洞(hole)等。图形的大小、角度、平行等几何特性在拓扑变换下会发生变化,因而不是拓扑特征。,莫比尔斯带,一种单侧、不可定向的曲面。每一张纸均有两个面和封闭曲线状的棱,如果有一张纸它有一条棱且只有一个面,使得一只蚂蚁能够不越过棱就可以从纸上的任何一点到达其他任何一点,这有可能吗?只要把一条纸带半扭转,再把两头贴上就行了。这是德国数学家莫比尔斯在1858年发现的。,陈霖认为,视觉处理的早期阶段检测的是图形大范围的、整体的拓扑性质,以后才处理图形的局部特征。用速示器成对呈现这些图形5ms,让被试判断图形的异同,就可以推测视觉早期加工是否对拓扑性质敏感。,64.5%,38.5%,43
16、.5%,报告成对图形不同的百分数,陈霖等人(2003)发表在美国科学院学报上的研究发现,蜜蜂虽然脑子很小,但它能够知觉到图形之间的拓扑性质差别。蜜蜂被放置在一个Y形迷宫里,圆圈图形在一侧,S形在另一侧。虽然在面积、周长和其他非拓扑特征上两者类似,但它们在拓扑结构上是不同的:圆圈有一个洞,而S形则没有。首先训练蜜蜂对圆圈作反应,即飞向圆圈可得到糖水作奖赏。,然后,在测验中改变图形,放置叉形与正方形;或空心圆与实心圆;或空心圆与有4个小洞的圆,每对图形中的图形拓扑性质都是不同的。蜜蜂顺利地通过了测验,仍然表现出对 洞(包括空心正方形)的偏向。最后放置圆圈与空心正方形(两者都有一个洞)让蜜蜂辨认,这
17、时它犯糊涂了,没有表现出任何偏好。蜜蜂的实验结果表明,蜜蜂能辨别拓扑结构上的差别。,陈霖在Visual Cognition 2005年第四期,概括其了拓扑性质知觉理论:知觉组织的拓扑学研究基于一个核心思想,包括两个方面:核心思想是,知觉组织应该从变换(transformation)和变换中的不变性(invariance)知觉的角度来理解。第一方面强调形状知觉中的拓扑结构,就是知觉组织的大范围(global)性质能够用拓扑不变性来描述;第二方面进一步强调早期拓扑性质知觉,就是拓扑性质知觉优先于(prior)局部特征性质的知觉。,优先有两个严格的含义:第一,由拓扑性质决定的整体组织是知觉局部几何性
18、质的基础;第二,基于物理连通性(physical connectivity)的拓扑性质知觉先于局部几何性质的知觉。,陈霖认为(Chen,2005),选择性注意所选择的是知觉物体,而且知觉物体可以定义为拓扑变换中的不变性。当一个实心圆变成空心圆时,按照知觉物体的拓扑知觉理论的定义,我们说产生了新的物体,因为其拓扑结构发生了变化;然而,当一个物体由红色变成绿色时,或由长方形变成正方形时,我们说没有产生新的物体,因为其拓扑结构未变。物体的各种几何性质可以用变换中的不变性来定义,从而为描绘形状性质(form properties)提供了统一的语言。,什么叫做知觉物体?注意选择什么?,各种几何学性质中,
19、拓扑性质最稳定,射影变换、仿射变换、欧氏变换依次是约束越来越强的变换,也就是越来越特殊的变换;相应的射影性质、仿射性质、欧氏性质的稳定性也越来越弱;欧氏性质(如朝向)是最不稳定的几何性质。B到E对的两个图形之间的差别代表着形状稳定性的不同水平,对应着上述几何学分类,其中E对代表的拓扑性质差别是最稳定的。,研究表明,人们能看见两个不同形状的图形(如圆和方形)之间产生似动,由此可以认为形状对似动知觉不那么重要。而各种几何学性质中,拓扑性质最稳定,射影变换、仿射变换、欧氏变换的稳定性依次越来越弱。可以假设:稳定性不同的几何学形状对似动可能有影响。,运动知觉领域中,各种行为实验结果所得到的一个普遍接受
20、的结论是,似动和真实运动是等价的。如果这种观点正确,那么大脑背侧通路(dorsal path-way)的MT区就很可能是与似动相关的区域,因为大量的包括来自PET 和fMRI 的实验证据都表明MT区是专司运动的,不论是真实运动还是运动错觉(如运动后效)。但是,大量的研究还表明,形状知觉是由腹侧通路(ventral pathway)负责的。那么,由不同形状几何图形间产生的似动,会激活什么脑区?MT?颞区?,卓彦等人发现,形状在长距离(long-range)似动中作用(fMRI)的结果:腹侧位置上的颞下回和颞中回前部(anterior temporal gyrus)有显著激活,而公认的运动区-背侧
21、MT区却没有得到激活。,The time course of signal changes,Activation patterns responding to each of these activation stimulus pairs.,在知觉到这些图形对之间产生似动时,颞回前部的激活随着两图形间结构差异的稳定性的增大而线性上升。刺激对结构差异最大(有洞和无洞的差别)时,激活程度最高。,The histograms of activation volumes and amplitude of signal change,averaged over the 11participants in
22、 the anterior temporal lobe for each of these activation stimulus pairs.,卓彦等人发现的意义在于:第一,几何形状在似动中起作用,颞回前部的激活说明此点;第二,几何形状性质用变换中的不变性来定义且具有功能层次的思想得到证明,即一对刺激形状差别越大,颞回激活程度越高。,拓扑性质知觉理论的意义,美国科学院院士R.Desimone(2005)认为:陈霖的大范围到局部的知觉拓扑模型是和神经生物学体系一致的,也是和心理学行为实验的物体基本表达的证据一致的。拓扑性质知觉模型将会激励神经生物学家对视觉系统特征分析采取新的研究方向,即强调物体特征是变换下不变性质的研究方向。,谢谢!,54,可编辑,