混合聚类分析方法.ppt

上传人:小飞机 文档编号:5996676 上传时间:2023-09-12 格式:PPT 页数:19 大小:1.45MB
返回 下载 相关 举报
混合聚类分析方法.ppt_第1页
第1页 / 共19页
混合聚类分析方法.ppt_第2页
第2页 / 共19页
混合聚类分析方法.ppt_第3页
第3页 / 共19页
混合聚类分析方法.ppt_第4页
第4页 / 共19页
混合聚类分析方法.ppt_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《混合聚类分析方法.ppt》由会员分享,可在线阅读,更多相关《混合聚类分析方法.ppt(19页珍藏版)》请在三一办公上搜索。

1、A new approach in e-learners grouping using Hybrid Clustering Method,组员:,一种运用混合聚类分析“在线分组学习”的新方法,指导老师:,论文研究背景和动机混合聚类分析方法的流程根据论文提供的实例验证方法根据论文留下的对未来聚类分析的市场预测和采用混合分析方法的新挑战进行扩展分析,Abstract(摘要),在线教育是近些年来刚兴起的一种教育模式,相对于传统的教学模式而言,在线教育便捷、实用、跨越时空界限、更接地气,更适应现代人快节奏的生活方式。分组学习是在线教育的一个基本功能和显著特征。分组学习能够根据广大受众体的个体特征,各取

2、所需,因材施教,大大提高了教学及学习的效率。目前,在全球排名靠前的名牌大学都纷纷开设了自己的网络课程,例如耶鲁大学、哈佛大学、北京大学,还有我们厦门理工。在线教育已经成为一种新的发展趋势。,朗读,SO,有效的分组能方便进行科学的教育投资 分组研究也加强在线教育的效果,反促进其发展,由于教师和基础设备的限制,无法实现一对一在线教育,故采大都采用分组学习根据所观察到学生的行为和学习特征换做维度,进行聚类分析,分析完的簇相当于组,一次进行个性化教育,如何进行相对应的有效分组是在线学习发展的关键,也是我们这次研究的对象。,不同研究者对比,Hybrid Clustering Method(HCM),英语

3、原著,It seems clustering learners by basic methods separately and then hybrid the result to decide about clusters is better than modifying just one method.,中文概括,首先先用各种常见聚类分析方法进行聚类分析,再将结果簇进行混合比较,最后修改成最佳结果,开始,:计算DB指数,确定簇的最佳个数,:选择聚类分析的基本方法,:对照不同聚类方法的结果,:在每一个对照组中选择最紧凑的簇,:重复修改聚类和删除元素,结束,原著,方法流程,步骤1,计算公式:,T

4、i是簇数量i的成员,Ci是是簇的中心i,Xj是i集群的成员第j个。dis(C,C)是左边等式中的中心第i个和第j个之间聚类的欧氏距离。,其中N是簇的数量,而Si是簇的成员i和簇的中心之间的平均欧氏距离。,这个距离被确定为:,步骤2,选择聚类的基本方法:选择聚类的基本算法,如K-means、C-means等,计算它们的DB指数,步骤3,对照不同聚类方法的结果:根据DB指数的定义特征,DB值越小,聚类分析效果越好。对比不同聚类方法下的DB值,筛选DB值最小的值作为簇的划分个数,步骤4,在每一个对照组中选择最紧凑的簇:选择最高的最佳候选压缩标准。压缩标准被定义为:,其中aij为第i个到第j个候选簇元

5、素的特征向量,c j是j聚类的特征向量,nj是聚类j的成员的数量。这个关系通过独立集群成员的数量,计算集群密实度的非线性方程。,步骤5,重复修改聚类和删除元素:选择最高的最佳候选压缩标准。压缩标准被定义为:有可能被重复元素在多个聚类或不在认可所有的聚类,因为聚类可能属于不同的集群的方法。解决重复元素的问题,在这一步中,确定多个集群成员的元素,然后决定他们的成员是否在一个聚类,以及删除部分内容.标准产生的最好的集群中,定义这些元素是表达式(4),其中 是特征向量和 是第j个簇的之间的欧几里德距离的平均值元素,并且该集群的中心,Hybrid Clustering Method(HCM),在上述的步

6、骤叙述中,每一个步骤的时间和空间复杂度并不是算法的关键。在“在线教育”这个研究范围中,不仅包含着大量的数据还有复杂的混合数据维度,所以算法的关键在于如何精确而又快速的进行聚类分析,实现分组学习。,方法简评,EVALUATION OF HYBRID CLUSTERING METHOD,为了评估所提出的方法,向学生收集关于学习风格(ILS)的问卷调查,再将每个学生的不同行为属性换算成0到11(共12个)的纯数字,以此作为各种学习方式的维度。,获取实验数据,EVALUATION OF HYBRID CLUSTERING METHOD,ILS的调查项目。将抽象的属性维转换成具体的数字维度,EVALUA

7、TION OF HYBRID CLUSTERING METHOD,用Evolutionary Fuzzy C-means(EFC)、C-means、K-means算法进行聚类分析,计算出DB指数。DB指数越低极为最佳簇的划分个数。如图,此处为DB值为4,如图,此为根据DB值为4的新的聚类分析,EVALUATION OF HYBRID CLUSTERING METHOD,计算各聚类算法精度,进行对比,P&G指数独立于集群的形状和数据分布,是用来找到最好的聚类数据集的指标。P&G指数越大,聚类精度越高。,CONCLUSION AND FUTURE WORK,任何改进的算法都是试图对聚类分析进行更好地优化,但对于不同的问题,它们还需要正确的对应运用。显然,混合聚类分析对于实验对象有了更优化的分析,但另一方面,在面对不同的研究对象,使用什么样的基础算法进行混合,将是我们未来不得不讨论的问题,感谢大家的聆听!不足之处,请多包涵,诚挚的希望我们小组能给大家带来新的收获!,END,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号