《认知模式识别理论及其在无字库智能造字应用研究.ppt》由会员分享,可在线阅读,更多相关《认知模式识别理论及其在无字库智能造字应用研究.ppt(26页珍藏版)》请在三一办公上搜索。
1、博士学位论文开题报告,认知模式识别理论及其在无字库智能造字应用研究,研 究 生:刘明友指导教师:皮佑国 教授,Outline,背景研究内容和创新点研究基础进度计划,背景模式识别,模式识别尚存在两个主要问题需要解决:小样本问题迄今为止的模式识别主要是基于被识别事物的区分机理,而不是基于认知机理,在“识”方面,即对事物认识(学习)方面与人类的认知过程差异较大而且学习能力不足,背景智能造字,字库方式存在的弊端:难于形成规模适度和长期稳定的汉字信息化标准 不符合汉字的造字规律,无法传承汉字文化不符合汉字认知规律,与汉字教学脱节不能满足整个社会的应用需求信息熵高,是效率最低语言文字信息系统之一,研究内容
2、和创新点,提出了基于原型匹配的认知模式识别理论提出了拟人的计算机无字库智能造字完善了汉字原型及结构提取理论和方法提出了汉字基元映射知识获取方法提出了汉字知识组织与表示方法,原型匹配的认知模式识别理论研究,恒常性与拓扑不变性模式的组成原型与成分的关系,恒常性与拓扑不变性,视知觉恒常性表述为:在对象图像信息足够确定其模式的条件下,图像的大小变化和形状变化不影响人对对象的知觉。用几何拓扑学的相关理论,建立物体对象的数学模型,从大小和形状恒常性两个角度加以证明。,模式的组成,从成分识别理论出发,研究现实世界中物体的组成法则。比如,世界上的物质种类多得数不清,但组成物质的化学元素却只有一百多种。又如,可
3、以通过红、绿、蓝三种颜色来构成五彩缤纷的颜色。Biederman的成分识别理论揭示了客观世界的构成模式:客观世界中的所有物体都是由一些成分构成的,也就是说,客观世界中物体都可以分解成一定的组成成分,各个成分之间的组合关系我们称之为结构。我们用集合理论来对物体的构建进行描述。,原型与成分的关系,原型是这一类客体所有的个体的概括表征。物体是由一些成分按照其结构所组成的,这里的成分是具体的、确定的。因此原型和组成物体的成分之间就存在一个由概括到确定,由抽象到具体的过程。我们用拓扑空间相关理论,研究原型与具体的组成成分之间的拓扑映射。从拓扑学的理论加以证明:原型匹配过程就是用原型集合中的一个或数个元素
4、的拓扑变换对模式中的组成成分进行覆盖的过程。,拟人的计算机无字库智能造字研究,汉字是用象形和指事及其符号按照一定的规则造出来的,传统的汉字造字理论包括:象形,指事,会意,形声。从认知心理学的知觉理论出发,研究人对汉字的认知机理,包括汉字的认读和书写过程。无字库智能造字的结构框架:,拟人的计算机无字库智能造字研究,将计算机比作人脑,建立包括基元库,汉字结构以及基元在结构中映射知识的知识库来模拟人的长时记忆;用推理机、解释机制、智能造字单元来模拟人在汉字认读和书写过程中脑的控制功能。汉字识别对应于认读过程,智能造字对应于书写过程。这样就将人的汉字认读和书写过程外延到计算机中了。,汉字原型及结构研究
5、,原型论即原型匹配理论,原型论的突出特点是它认为在记忆中储存的不是与外部模式有一对一关系的模板,而是原型(prototype)。原型不是某一个特定模式的内部复本,它被看作一类客体的内部表征,即一个类别或范畴的所有个体的概括表征。构成汉字的原型是汉字基元,汉字基元是智能造字中按照汉字结构组成汉字的基本单元;汉字的组成成分是汉字基元的拓扑变换,变换保持汉字基元的拓扑不变性;同一汉字基元在不同汉字中拓扑变换是同胚映射。汉字成分之间的拓扑关系构成了汉字的结构。,汉字原型及结构研究,通过初始原型集合汉字编码造字实验原型使用频率等统计修改原型集合的流程,反复实验,最终获得汉字的原型知识。研究汉字的拆分规律
6、,分析和总结汉字原型的形成规律。从图形符号的角度分析汉字原型之间组合规律,在传统汉字结构和实验室研究的基础上,进一步完善汉字结构。旨在用现代科学实验的方法来解决文字文化问题探讨。,汉字基元映射研究,基于区域的仿射变换系数自动获取基于特征提取的仿射变换系数自动获取,基于区域的仿射变换系数自动获取,该方法包括一个变换模型(参考图像坐标到对应的目标图像空间坐标),图像相似性度量(衡量两图像空间内对应特征的相似性),和优化算法(通过改变变换系数最优化图像相似性)。,基于区域的仿射变换系数自动获取,变换模型设W表示基元图像,x表示该图像中的一个点。定义基元图像的一个几何变换为:对于某一线性变换 A,其位
7、置系数t表示为:由上式知,线性变换系数可以看成是输入,而计算得到的平移系数看成是输出。,基于区域的仿射变换系数自动获取,图像相似性度量归一化相关系数(NCC)I表示子图像,T表示模板图像,R表示图像相关系数,基于区域的仿射变换系数自动获取,优化算法利用粒子群算法来优化仿射变换系数。粒子群算法因其简单性和有效性得到了广泛的应用,成为研究的热点。粒子群算法用于仿射变换系数寻优的过程为:随机产生m组仿射变换系数中的线性变换系数组成初始群体,分别对基元图像进行变换(模板图像),然后在汉字图像(搜索图)上寻找最佳匹配,由最佳匹配时的图像相似性系数决定每个粒子的适应度值,通过迭代寻优,获取最优的线性变换系
8、数和平移系数。,基于特征提取的仿射变换系数自动获取,仿射不变特征图像在仿射变换下保持不变的性质称为仿射不变特征。仿射不变特征可分为全局不变特征和局部不变特征。SIFT(尺度不变特征变换)算法是一种提取局部特征的算法,在尺度空间寻找极值点,提取位置,尺度,旋转不变量,对视角变化、仿射变换、噪声也保持一定程度的稳定性。,基于特征提取的仿射变换系数自动获取,基本思路汉字基元到汉字组成成分的仿射变换,通过提取局部仿射不变特征位置和尺度不变量,找到相对应的匹配点对,由三对不共线点计算得到仿射变换系数。,基于特征提取的仿射变换系数自动获取,获取流程兴趣点或角点检测:SIFT空间极值点检测往往会丢失掉重要的
9、关键点,比如角点和拐点,而角点和拐点是计算仿射变换系数最重要的参数。通过对各种兴趣点和角点算法的比较,如Harris角点检测,Susan角点检测,采用强角点检测汉字图像的角点,具有稳定性好,检测到的角点准确而全面等优点。角点描述子生成:检测到汉字角点以后,用改进的SIFT描述子生成角点特征向量,去除SIFT描述子的旋转不变性,提取位置和尺度不变量。确定匹配点对:角点特征向量生成后,采用角点特征向量的欧氏距离作为两幅图像中角点的相似性判定度量。取图像一中的某个角点,并找出其与图像二中欧氏距离最近的前两个角点,这样就找到了基元图像中某个角点在汉字图像中相匹配的两个角点,从而不漏掉重要的相匹配的角点
10、。随机选取不共线的相匹配三对点可以计算确定一组仿射变换系数,通过使用前面介绍的归一化相关系数作为相似性度量,由此可以确定一组最佳的仿射变换系数。,汉字知识组织与表示,语义网络是通过概念及其语义关系来表达知识的一种有向网络图。汉字集先按汉字一级结构聚类,构成语义网络的第一层次。,汉字知识组织与表示,在一级结构的基础上,汉字的结构或基元再按照自上而下的语义关系汇集,构成一个多层次的语义网络。,图3 左三包围结构汉字语义网络,研究基础,分别对GB2312-80和GB18030-2000汉字字符集进行了编码和造字,提取和归纳了汉字基元和汉字结构。搭建了无字库智能造字实验平台。发表相关论文和专著六篇。,进度计划,谢谢!请各位老师和同学提出宝贵修改和完善意见和建议!,