模糊聚类分析ppt课件.ppt

上传人:牧羊曲112 文档编号:1425087 上传时间:2022-11-22 格式:PPT 页数:48 大小:3.04MB
返回 下载 相关 举报
模糊聚类分析ppt课件.ppt_第1页
第1页 / 共48页
模糊聚类分析ppt课件.ppt_第2页
第2页 / 共48页
模糊聚类分析ppt课件.ppt_第3页
第3页 / 共48页
模糊聚类分析ppt课件.ppt_第4页
第4页 / 共48页
模糊聚类分析ppt课件.ppt_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《模糊聚类分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《模糊聚类分析ppt课件.ppt(48页珍藏版)》请在三一办公上搜索。

1、模糊聚类分析,物以类聚,对事物按一定要求进行分类的数学方法,叫做聚类分析。现实的分类问题,大多伴随着模糊性。如地质上水油层之间的边界是不分明的,对农业区划的分界、土壤的分类、空气污染等级、公司竞争力也是模糊的等等。利用模糊聚类分析法去对地质分类,进行农业区划就更合理。,一、基本概念及定理,求传递闭包:平方法,1.确定聚类单元 这是第一步工作。在确定聚类单元时,主要根据研究对象和聚类的目的进行综合分析来确定。如研究的对象是三江平原大系统,则聚类单元以县为单位较妥;如研究对象是某个县,则以乡为单元较妥;如研究的目的是将耕地按肥力不同分成不同的类别,则以地块作为聚类单元。这里有一点需要注意,不管单元

2、如何划定,保证行政区划的完整性是必要的,只有如此,才能确保把聚类结果应用到实际生产中去。,二、模糊聚类的一般步骤,2. 确定聚类准则和聚类因子 聚类准则又叫聚类原则,是对聚类目的性的概括描述,也是筛选聚类因子的基本依据。如气候条件准则、经济发展水平准则、土壤肥力准则等。不难看出,这三个准则将指导把聚类单元分成不同气候区、经济发展区和土壤肥力分类等。 根据聚类准则要进一步确定聚类因子,这项工作应请有关专家参与,以便把握住与准则密切相关的特征参数,确保聚类的精确性。 根据需要可同时选择不同准则分别进行聚类分析,然后通过综合取交的方法,以做到兼顾多目标,使分类结果更科学。,3、建立数据矩阵,(1)标

3、准差标准化,(2)极差正规化,(3)极差标准化,4、建立模糊相似矩阵,(1)相似系数法,夹角余弦法,相关系数法,(2)距离法,Hamming距离,Euclid距离,Chebyshev距离,海明,欧式,切比雪夫,(3)贴近度法,最大最小法,算术平均最小法,几何平均最小法,5. 求模糊等价矩阵 用上述方法建立起来的模糊矩阵 ,一般说来只满足自反性和对称性,不一定满足传递性,即 不一定是模糊等价关系,需要将 改造成模糊等价矩阵 ,然后再在适当的阈值上进行截取,便可得所需分类。 改造的方法是将 自乘得 ,再自乘 ,如此继续下去,得 ,至某一步出现 为止。则 便是一个模糊等价关系。这个方法是由所谓“传递

4、闭包”理论而来,我们在此拿来直接应用,不再作详细介绍。,6. 截取等价类 模糊等价关系矩阵为系统聚类奠定了基础,要想在此基础上进行分类,还必须将模糊等价关系转变成非模糊的等价关系。为此定义模糊等价关系矩阵的 截矩阵如下: 设 为U上的一个模糊等价关系矩阵,且 ,则对任意一个 ,定义 则称 为 的一个 截矩阵。 很显然,取不同的 值就对应不同的分类结果,从而可以根据实际情况进行分类。,根据 结果可知, 取值越大,分类就越细,这无疑对更精确地研究问题是有利的。但如果一个单元划为一类,不仅工作量巨大,而且失去了聚类的意义。相反, 取值越小,分的类就越少(粗),同样这对研究问题也是不可取的。当然,究竞

5、将系统划分为几类,还应结合具体情况作具体分析,特别是要注意征询有关专家的意见,在多数专家认可的情况下,才做为最终的结果输出。,7. 撰写聚类分析报告 聚类分析是一项独立的研究工作,这项工作完成的好坏关系全局。作为聚类分析报告一般应包括以下几部分内容: 聚类分析的目的和意义。 聚类分析所采用的方法和研究结果。 结果分析。这部分的主要工作是将不同类上的基本情况和特征参数进行综合分析,指出不同类的特点,发展优势和问题等。,解:,由题设知特性指标矩阵为,采用最大值规格化法将数据规格化为,用最大最小法构造模糊相似矩阵得到,用平方法合成传递闭包,取 ,得,取 ,得,取 ,得,取 ,得,取 ,得,画出动态聚

6、类图如下:,总体样本的中心向量,对样本空间 ( 为样本总数), ,其中 为分类特征个数, 为 的第 个特征。设 为对应 值的类数, 为第 类的样本数,第 类样本为 。第 类的聚类中心为向量其中, 为该类样本第 个特征的平均值,即,总体样本的中心向量为 ,其中构造下列形式的F统计量,其中, 为 与 的距离, 为第 类中样本 与 的距离。,统计量分子表征类与类之间的距离,分母表示类内样本间距离,因此 值越大,说明类与类之间的距离大,表明类与类间的差异大,分类就越合理。对应于 统计量最大的水平 即为最佳阈值。,模糊聚类分析的简要流程:,企业综合竞争力评价分类,5个公司6个指标的样品数据如下,试根据以下数据评价5个公司的综合竞争力。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号