模糊数学教程第7章 模糊聚类分析ppt课件.ppt

上传人:小飞机 文档编号:1425083 上传时间:2022-11-22 格式:PPT 页数:35 大小:1.83MB
返回 下载 相关 举报
模糊数学教程第7章 模糊聚类分析ppt课件.ppt_第1页
第1页 / 共35页
模糊数学教程第7章 模糊聚类分析ppt课件.ppt_第2页
第2页 / 共35页
模糊数学教程第7章 模糊聚类分析ppt课件.ppt_第3页
第3页 / 共35页
模糊数学教程第7章 模糊聚类分析ppt课件.ppt_第4页
第4页 / 共35页
模糊数学教程第7章 模糊聚类分析ppt课件.ppt_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《模糊数学教程第7章 模糊聚类分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《模糊数学教程第7章 模糊聚类分析ppt课件.ppt(35页珍藏版)》请在三一办公上搜索。

1、第章 模糊聚类分析,一、模糊聚类分析及其步骤,二、基于模糊等价关系的传递闭包法,三、基于模糊相似关系的直接聚类法,四、基于模糊c-划分的模糊聚类法,模糊聚类分析是一类应用很广泛的数学方法,就其理论来说,大致分为三种:一是基于模糊等价关系的传递闭包法,二是基于模糊相似关系的直接聚类法,三是基于模糊c-划分的模糊聚类法。,.1 模糊聚类分析及步骤,数学上,把按一定要求和规律,对事物进行分类的方法叫聚类分析,它属于数理统计多元分析的一支,是对清晰事物进行分类的一种方法,然而现实生活中,事物间的界限往往不一定很清晰,很多分类问题,都多伴有模糊性,如天气,晴、阴、雨天之间就无绝对的界限,普通的聚类分析对

2、此是无能为力的;用模糊数学的语言和方法来描述和解决就成为自然和方便的了,这就产生了模糊聚类分析,模糊聚类分析的步骤:一、选择统计指标根据实际问题,选择那些具有明确的意义,有较强的分辨力和代表性的特征,作为分类事物的统计指标,统计指标选择的如何,对分类结果有直接的影响;二、数据标准化(正规化)把代表事物各特征的统计指标的数据进行处理,使之便于分析和比较,数据标准化可这样进行:令,其中x原始数据,,为其的平均值,为其标准差,三、标定所谓标定,就是根据实际情况,按一个准或某种方法,给论域 U中的元素两两之间,都赋以0,1间的一个数,叫做相似系数,其大小表征两个元素彼此接近或相似的程度;,设,为待分事

3、物的全体,,由一组数,据,来表征,用,表示元素,的相似,系数,,表示,截然不同,毫无相似,之处;,表示,完全相似或等同;当i=j时,,就是,和自己的相似程度,恒取1,可据实际情况,选择下列方法之一来确定:,(1)数量乘积法,其中,方法2. 令,于是,其中,(2)夹角余弦法,(3)最大最小法,(4)算术平均最小法,(5)绝对值减数法,其中c适当选取,使 在0 ,1中且分散开.,四、聚类,选择一种合适的聚类方法,便可以得到分类结果.,.2 基于模糊等价关系的传递闭包法,一、传递闭包法,Basic idea :,据上面标定所得的模糊矩阵R,,求出其传递闭包,为模糊等价矩阵,,然后由3.4之方法,令从

4、1降到0,便可按需要,对U进行分类,这样的聚类方法,称传递闭包法,例7.1 环境单元分类,环境单元有空气、水分、土壤、作物四个要素,环境,单元的污染状况由污染物在四个要素中含量的超限度来描述,若其污染数据为:,试对U进,行分类.,解:,(1)按绝对值减数法进行标定,如取c=0.1,则,于是得模糊相似矩阵,并按 将U分成等价类.,若=1, 便将U分为5类, 即,若=0.8, 便将U分为4类, 即,若=0.6, 便将U分为3类, 即,若=0.5, 便将U分为2类, 即,若=0.4, 便将U全归为为1类, 即,聚类图见教材3.4图3-3 ,二、最佳或值的确定,聚类图给出各值对应的分类,形成一种动态聚

5、类,便于全面了解元素聚类, 然后根据实际需要选择其或值便可确定一种分类, 至于如何选择或值, 使分类更合理, 除了凭经验外, 还可用F-统计量来选取.,为描述元素 的第k个特征的数据,又设c为对应于值的类数, 为第i类元素的个数,为第i类元素第k个特征的平均值, 称,为F-统计量, 其中,为第i类中心,例7.2 气象预报中最佳或值的选取(数据分析见教材第156页),.3 基于模糊相似关系的直接聚类法,Basic idea :,用传递闭包法分类需要先建立U上,的模糊等价矩阵, 但矩阵阶数较高时, 计算便变得较,困难.而采用相似矩阵R进行分类的直接聚类法其计算,量则要小很多,这种方法聚类的原则是:

6、,不低于的路联结 与,直接聚类法,最大树法,编网法,画出以被分类元素为结点,以相似矩阵R的元 素 为权重的一棵最大树;取定0,1,砍断权重低于的枝,得到一个不连通图,各连通分支便构成了在水平上的分类,.4 基于模糊c-划分的模糊聚类法,一、c-划分,1、普通集合上的c-划分,集合 上的c-划分是指U的c个子集,满足:,反之, 具有上述条件的矩阵A对应着U上的一个分类,A称为集合U的一个c-划分矩阵.如给定四元集U一,为,记,为,实矩阵的集合, 且,称为将U分成c类的分类空间.这样的分类是通,常意义下的分类, 称为硬分类.,2、模糊c-划分,设,一个,模糊矩阵,若满足:,(表示每类 不等于或U

7、),的程度总和为1);,则A称为U的模糊c-划分矩阵, 记,称为U的c类软分类空间.,显然,二、目标函数聚类法和硬c-均值算法,Basic idea :,在目标函数法中, 目标函数是对给定c的所有候选分类,进行度量,最优的类就是使目标函数达到局部最小的类,对于硬分类情形, 目标函数一般选为总体组内误差平,方和.其定义如下:,其中 为 中元素各特征分别取平均值后所得的聚类,中心向量, 也称 的聚类中心.,类中元素向量和,类中元素个数,记,V称为聚类中心矩阵, 若 则 到聚类中心,的距离为,中全体元素到中心距离平方和为,而V中其它元素到其所在类中心距离平方和为,Remark:,最理想的c-划分应该

8、是J(A, V)取,极小的A, 寻找最小的A并非易事,这是因为Mc的容量,虽有限但非常大, 最常见的方法是硬c-均值算法:,取定c (2cn), 并,初始化,心向量,其中,其它,(是一个非常小的常数),则停止算法;否则, 令,返回Step2,三、模糊c-均值算法,定义目标函数,其中r1是一个加权指数.,Basic idea :,模糊c-均值算法的目标在于找到,最小.,下面的定理给出了上述最小化问题之必要条件,定理 令,局部最小值.,注: 模糊c-均值算法是建立在定理必要条件(),和()的基础上的, 算法步骤如下:,Step1 给定数据集,心向量,Step4,若,则停止算法;否则, 令,返回Step2,(是一个非常小的常数),Remark:, 此算法也称为模糊ISODATA方法.,遇到只有一个样本的类,要在聚类前先排除, 待聚类,后再加上该类, 而参数r一般常取r=2., 此算法要求 ,因此取初始分类 时,三、模糊划分清晰化,实际问题中, 最后的分类结果都要求是明确的,因此,在使用模糊c-划分分类后, 都必须将模糊划分清晰化,可用下述方法进行:,类.,例7.3 模糊ISODATA聚类算法的应用(教材第169页),例7.4 应用模糊聚类分析对地下水位动态分类(教材 第170页),

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号