《模式识别习题及答案.docx》由会员分享,可在线阅读,更多相关《模式识别习题及答案.docx(13页珍藏版)》请在三一办公上搜索。
1、模式识别习题及答案 第一章 绪论 1.什么是模式?具体事物所具有的信息。 模式所指的不是事物本身,而是我们从事物中获得的_信息_。 2.模式识别的定义?让计算机来判断事物。 3.模式识别系统主要由哪些部分组成?数据获取预处理特征提取与选择分类器设计/ 分类决策。 第二章 贝叶斯决策理论 wp(x|w1) 如果l(x)=_p(w2)/p(w1)_,则x1p(x|w2)19.对于感知准则函数,满足的权向量称为解向量,解向量不止一个,而是由无穷多个解向量组成的解,称这样的区域为 。 T20.感知准则函数为 J(a)=极小值时的a为最优解 (-ay)P yYk证明使用梯度下降算法的迭代过程公式 a(1
2、),任意 a(k+1)=a(k)+ky yYk Jp(a)证明: J(a)= (-y)=pa yYkkpk yYk ra(k+1)=a(k)-rJ(a)=a(k)+ry21.下列哪种分类方法最不适用于样本集线性不可分情况:B AFisher线性判别的Lagrange乘子法 B感知准则的梯度下降算法 C最小错分样本数准则的共轭梯度法 D最小平方误差准则的梯度下降法 22.多类问题可以利用求两类问题的方法来求解。这样做的缺点是会造成(无法确定类别的区域增大),需要训练的(子分类器及参数增多)。 23.利用最小平方误差准则函数进行分类器设计,主要是求极小化时的权向量。当 时,最小平方误差准则函数的解
3、等价于(Bayes)线性判别的解。 24.叙述分类器错误率估计中的留一法的运算过程。 答:1.N个样本,取N-1个样本作为训练集,设计分类器。 2.剩下的一个样本作为测试集,输入到分类器中,检验是否错分。 3.然后放回样本,重复上述过程,直到N次,即每个样本都做了一次测试。 k4.统计被错分的次数k, e = 作为错误率的估计率。 N25利用两类问题的线性分类器解决多类问题常用的两种方法的优缺点。 答:优点:设计思想简单,容易实现。 缺点:需要训练的子分类器或参数多,效率低。 无法确定类别的区域多。 26线性分类器设计中的最小平方准则函数方法采用的准则函数公式是什么?当利用伪逆解方法求解时,遇
4、到计算量过大时,可以代替采用何种方法来训练分类器参数?叙述你所使用方法的基本原理,并解释为什么你的方法可以降低计算量。 N22答:因为e=Ya-b, s(a)=e= Ya-b TJi 常用梯度下降法来降低计算复杂度 i=1N TTJ(a)=2(ay-b)y=2Y(Ya-b)siii b=(1,.,1)T=2(ay-b)ii=1a(1),任意初始化批量样本修正法: Ta(k+1)=a(k)-rY(Ya(k)-b)k单样本修正法: Tkk kk 27利用两类别的线性分类器如何解决多类别的分类问题? i/i 法:将C类别问题化为(C-1)个两类问题,按两类问题确定其判别函数与决策面方程 i/j 法:
5、将C类中的每两类别单独设计其线性判别函数,因此总共有C(C-1)/2个线性判别函数 28.叙述分类器错误率估计中的m-重交叉验证方法的运算过程,并说明什么情况下该方法将退化为留一法。 a(1),任意初始化a(k+1)=a(k)+r(b-a(k)y)y答:N个样本被划分成m个不相交的集合,每组有Nm个样本。 在m个样本中取m-1个组的样本作为训练集,设计分类器。 剩下的一组样本作为测试集,输入到分类器中检验,统计错分数k. 然后放回,重复上述过程,直到m次。 设ki设计简单 分类性能优良 适用于线性不可分情况 缺点: 计算量大,存储量大 第六章 特征的选择与提取 1.叙述用于特征选择的增l减r搜
6、索算法的算法步骤。并考虑l值大于r值时,增l减r算法步骤应做出怎样的修改,以及该情况下,增l减r搜索算法的特点? 答步骤一:用SFS法在未入选特征组中逐个选入L个特征,形成新特征组Xk+L ,设置k=k+L,步骤二:用SBS法从特征组Xk中逐个剔除r个最差的特征,形成新特征组Xk-r,设置k=k-r,若k=d,则终止算法,否则设置xk=xk-r,转向第一步。 当Lr时,L-r法是一种自下而上的算法,先执行第一步,然后执行第二步,开始时,设置k=0,x0=空 当Lr时,L-r法是一种自上而下的算法,此时先执行第二步,然后执行第一步,开始时设置k=0,x0=x1,,xD 2模拟退火法采用Metropolis接受准则,冷却进度表的主要参数包括。 e3.遗传算法的运算过程主要分四个阶段:包括编码阶段、选择阶段、交叉阶段、。其中,阶段可以加入最优保留策略,该策略的优点是。遗传算法的初始群体规模过小,可能导致算法现象发生,从而降低算法的搜索性能。遗传算法的终止条件有多种,你认为使用方法终止算法,能较好提高搜索结果的质量。