《《动态聚类法三》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《动态聚类法三》PPT课件.ppt(20页珍藏版)》请在三一办公上搜索。
1、动态聚类法,思想:首先选择若干个样本作为聚类中心,再按照事先确定的聚类准则进行聚类.在聚类过程中,根据聚类准则对聚类中心反复修改,直到分类合理为止.,K-均值聚类,又称为C-均值聚类,是根据函数准则进行分类的聚类算法,使聚类准则函数最小化.,准则函数,K-均值算法的聚类准则,算法描述设共有N个模式样本,计算步骤如下:,算法讨论,K-均值算法受以下几个因素的影响(1)指定聚类中心的个数是否符合模式的实际分布;(2)所选聚类中心的初始位置;(3)样本分布的几何性质;(4)样本的读入次序.,试探,聚类结果的评价,常见的几个评价指标(1)聚类中心之间的距离 同一类样本相聚比较密集,不同类样本相距较远.
2、聚类中心之间的距离通常总大于各类样本的类内平均距离.类间距离太小,说明两类靠得太紧,有可能合并.,(2)诸聚类域中的样本数目 如果样本的抽取比较合理,通常各类的样本数相差不大.因此聚类结果中,若某一类的样本数较其它类的样本数明显多得多,该类有可能是几类样本的集合.综合考虑(1)、(2),(3)诸聚类域内样本距离的标准差向量 聚类域内样本与聚类中心对应分量差的平方和的平均值叫方差.方差的算术平方根叫做标准差.,此外还可以用其它距离度量之分析模式样本的聚类性质.例如:在一个聚类域内,距离聚类中心最远与最近的样本位置等.,考试重点,模式识别的基本概念模式识别系统最小错误率贝叶斯分类器最小风险贝叶斯分类器线性判别分类器的设计步骤广义线性分类器(非线性线性)感知器准则函数及迭代解最小均方误差准则与伪拟解Fisher判别分类的思想、原则及准则函数特征提取、特征选择的概念欧氏距离、马氏距离,基于类内散布矩阵的单类模式特征提取聚类的概念与理解监督分类、无监督分类聚类与分类基于距离阈值、函数准则的聚类近邻聚类法最大最小距离算法层次聚类法动态聚类法:K-均值聚类算法,考试题型,第一题 概念题(2个小题)10分第二题 简答题(3个小题)30分第三题 计算题(4个小题)50分第四题 综合应用题 10分,