多元统计分析及R语言建模(第五版)课件第六七章.pptx

上传人:牧羊曲112 文档编号:1722118 上传时间:2022-12-16 格式:PPTX 页数:79 大小:3.97MB
返回 下载 相关 举报
多元统计分析及R语言建模(第五版)课件第六七章.pptx_第1页
第1页 / 共79页
多元统计分析及R语言建模(第五版)课件第六七章.pptx_第2页
第2页 / 共79页
多元统计分析及R语言建模(第五版)课件第六七章.pptx_第3页
第3页 / 共79页
多元统计分析及R语言建模(第五版)课件第六七章.pptx_第4页
第4页 / 共79页
多元统计分析及R语言建模(第五版)课件第六七章.pptx_第5页
第5页 / 共79页
点击查看更多>>
资源描述

《多元统计分析及R语言建模(第五版)课件第六七章.pptx》由会员分享,可在线阅读,更多相关《多元统计分析及R语言建模(第五版)课件第六七章.pptx(79页珍藏版)》请在三一办公上搜索。

1、第6章 判别分析及R使用,多元统计分析及R语言建模,第6章 判别分析及R使用多元统计分析及R语言建模,多元统计分析及R语言建模,6 判别分析及R使用,多元统计分析及R语言建模6 判别分析及R使用,多元统计分析及R语言建模,6 判别分析及R使用,基本要求,理解判别分析的目的及其统计思想了解并熟悉判别分析的三种类型掌握不同判别方法的判别规则和判别函数利用R语言程序,实际计算教材中的习题,多元统计分析及R语言建模6 判别分析及R使用基本要求理解判别,多元统计分析及R语言建模,6 判别分析及R使用,主要内容,判别分析的目的和意义几种判别分析准则和性质 包括Fisher判别法、距离判别法、Bayes判别

2、法R语言程序中有关判别分析的算法,多元统计分析及R语言建模6 判别分析及R使用主要内容判别分析,6 判别分析及R使用,6.1 判别分析的概念,概念和方法,判别分析概念,判别分析方法,是在已知的分类之下,对新的样本,可以利用此法选定一判别标准,以判定将该新样品放置于哪个类中。,判别分析(Discriminat Analysis)是多元分析中用于判别样本所属类型的一种统计分析方法。,6 判别分析及R使用6.1 判别分析的概念概念和方法判别分析,6 判别分析及R使用,6.1 判别分析的概念,判别分析的种类,一、确定性判别:Fisher型判别 (1)线性型 (2)距离型 (3)非线性型二、概率性判别:

3、Bayes型判别 (1)概率型 (2)损失型,6 判别分析及R使用6.1 判别分析的概念判别分析的种类一、,6 判别分析及R使用,6.2 线性判别分析,6 判别分析及R使用6.2 线性判别分析,6 判别分析及R使用,6.2 线性判别分析,一、求Fisher线性判别函数,二、计算判别界值,三、建立判别标准,6 判别分析及R使用6.2 线性判别分析 一、求Fisher,6 判别分析及R使用,6.2 线性判别分析,【例6.1】今天和昨天湿温差 x1及气温差x2是预报明天 下雨否的其中两个重要因子, 试建立Fisher线性判别函数,如测得今天 x1=8.1, x2=2.0试报明天是雨天还是晴天?,6

4、判别分析及R使用6.2 线性判别分析【例6.1】今天和昨,6 判别分析及R使用,6.2 线性判别分析,一、基本统计分析,6 判别分析及R使用6.2 线性判别分析一、基本统计分析,6 判别分析及R使用,6.2 线性判别分析,二、Logistic模型分析,6 判别分析及R使用6.2 线性判别分析二、Logistic,6 判别分析及R使用,6.2 线性判别分析,三、Fisher判别分析,6 判别分析及R使用6.2 线性判别分析三、Fisher判别,6 判别分析及R使用,6.2 线性判别分析,6 判别分析及R使用6.2 线性判别分析,6 判别分析及R使用,6.3 距离判别法,6.3.1 两总体距离判别

5、,马氏距离:,判别准则:,6 判别分析及R使用6.3 距离判别法6.3.1 两总体距离,6 判别分析及R使用,6.3 距离判别法,6.3.1 两总体距离判别,一、等方差阵:,直线判别,6 判别分析及R使用6.3 距离判别法6.3.1 两总体距离,6 判别分析及R使用,6.3 距离判别法,6.3.1 两总体距离判别,二、异方差阵:,曲线判别,6 判别分析及R使用6.3 距离判别法6.3.1 两总体距离,6 判别分析及R使用,6.3 距离判别法,【例6.2】对例6.1天气数据做距离判别分析,6 判别分析及R使用6.3 距离判别法【例6.2】对例6.1,6 判别分析及R使用,6.3 距离判别法,6.

6、3.2 多总体距离判别,一、协方差矩阵相同:,线性判别,6 判别分析及R使用6.3 距离判别法6.3.2 多总体距离,6 判别分析及R使用,6.3 距离判别法,6.3.2 多总体距离判别,二、协方差矩阵不同:,非线性判别,6 判别分析及R使用6.3 距离判别法6.3.2 多总体距离,6 判别分析及R使用,6.3 距离判别法,【例6.3】电视机品牌调查分析,20 个电视机 5 种畅销 8 种平销 7 种滞销,试建立判别函数,当一新产品其质量评分为8.0, 功能评分为7.5, 销售价格为65百元,问该厂产品的销售前景如何?,6 判别分析及R使用6.3 距离判别法【例6.3】电视机品牌,6 判别分析

7、及R使用,6.3 距离判别法,6 判别分析及R使用6.3 距离判别法,6 判别分析及R使用,6.3 距离判别法,1. 线性判别(等方差),1 0.9,6 判别分析及R使用6.3 距离判别法1. 线性判别(等方差,6 判别分析及R使用,6.3 距离判别法,6 判别分析及R使用6.3 距离判别法,6 判别分析及R使用,6.3 距离判别法,2. 二次判别(异方差),1 0.95,6 判别分析及R使用6.3 距离判别法2. 二次判别(异方差,6 判别分析及R使用,6.4 Bayes 判别法,6.4.1 Bayes判别准则,Fisher判别缺点,Bayes判别准则,一是判别方法与各总体出现的概率无关二是

8、判别方法与错判后造成的损失无关,以个体归属于某类的概率(或判别值)最大或错判总平均损失最小为标准,6 判别分析及R使用6.4 Bayes 判别法6.4.1 B,6 判别分析及R使用,6.4 Bayes 判别法,6.4.1 Bayes判别准则,一、概率判别,k个总体的先验概率,密度函数分别为,x来自第j类的后验概率为 (Bayes公式),6 判别分析及R使用6.4 Bayes 判别法6.4.1 B,6 判别分析及R使用,6.4 Bayes 判别法,6.4.1 Bayes判别准则,二、损失判别,x错判为第g总体的平均损失,6 判别分析及R使用6.4 Bayes 判别法6.4.1 B,6 判别分析及

9、R使用,6.4 Bayes 判别法,6.4.2 正态总体的Bayes判别,一、Bayes判别函数求解,k个总体的先验概率,密度函数分别为,6 判别分析及R使用6.4 Bayes 判别法6.4.2 正,6 判别分析及R使用,6.4 Bayes 判别法,6.4.2 正态总体的Bayes判别,二、协方差阵相等情形,6 判别分析及R使用6.4 Bayes 判别法6.4.2 正,6 判别分析及R使用,6.4 Bayes 判别法,6.4.2 正态总体的Bayes判别,三、后验概率的计算,6 判别分析及R使用6.4 Bayes 判别法6.4.2 正,6 判别分析及R使用,6.4 Bayes 判别法,【例6.

10、4】对例6.3数据应用Bayes判别法进行判别,(1)先验概率相等:,6 判别分析及R使用6.4 Bayes 判别法【例6.4】对,6 判别分析及R使用,6.4 Bayes 判别法,【例6.4】对例6.3数据应用Bayes判别法进行判别,(2)先验概率不等,6 判别分析及R使用6.4 Bayes 判别法【例6.4】对,6 判别分析及R使用,6.4 Bayes 判别法,两种结果比较:,6 判别分析及R使用6.4 Bayes 判别法两种结果比较:,两种结果比较,两种结果比较,6 判别分析及R使用,6.4 Bayes 判别法,两种结果比较,6 判别分析及R使用6.4 Bayes 判别法两种结果比较,

11、6 判别分析及R使用,小结,1. 判别分析方法是按已知所属组的样本确定判别函数,制定判别规则,然后再判断每一个新样品应属于哪一类。2. 常用的判别方法有Fisher判别、距离判别、贝叶斯判别等,每个方法根据其出发点不同各有其特点。3. Fisher类判别对判别变量的分布类型并无要求,而Bayes类判别要变量的分布类型。因此,Fisher类判别较Bayes类判别简单一些。4. 当两个总体时,若它们的协方差矩阵相同,则距离判别和Fisher判别等价。当变量服从正态分布时,它们还和Bayes判别等价。5. 判别分析中的各种误判的后果允许看作是相同的,通常将犯第一类错误的后果看得更严重些,但本章对此关

12、注的不够。,6 判别分析及R使用小结1. 判别分析方法是按已知所属组的样,6 判别分析及R使用,第六章讲到这里就结束了欢迎大家继续学习第七章!,6 判别分析及R使用第六章,第7章 聚类分析及R使用,多元统计分析及R语言建模,第7章 聚类分析及R使用多元统计分析及R语言建模,多元统计分析及R语言建模,7 聚类分析及R使用,多元统计分析及R语言建模7 聚类分析及R使用,多元统计分析及R语言建模,7 聚类分析及R使用,基本要求,理解聚类分析的目的意义及统计思想了解变量类型的几种尺度定义熟悉Q型和R型聚类分析的统计量的定义了解六种系统聚类方法及它们的统一公式掌握R语言中六种方法的具体使用步骤了解R语言

13、中快速聚类的基本思想和用法,多元统计分析及R语言建模7 聚类分析及R使用基本要求理解聚类,多元统计分析及R语言建模,7 聚类分析及R使用,主要内容,聚类分析的目的和意义聚类分析中所使用的几种尺度的定义初步掌握选用聚类方法与相应距离的原则六种系统聚类方法的定义及其基本性质R语言程序中有关聚类分析的算法基础掌握R语言中kmeans聚类的方法和用法,多元统计分析及R语言建模7 聚类分析及R使用主要内容聚类分析,7 聚类分析及R使用,7.1 聚类分析的概念和类型,概念和方法,基本概念聚类分析法(Cluster Analysis)是研究“物以类聚”的一种现代统计分析方法,在众多的领域中,都需要采用聚类分

14、析作分类研究。,分析方法,7 聚类分析及R使用7.1 聚类分析的概念和类型概念和方法基,7 聚类分析及R使用,7.1 聚类分析的概念和类型,7 聚类分析及R使用7.1 聚类分析的概念和类型,7 聚类分析及R使用,7.1 聚类分析的概念和类型,【例7.1】两个变量、九个样品数据及其散点图,7 聚类分析及R使用7.1 聚类分析的概念和类型 【例7.1,7 聚类分析及R使用,7.2 聚类统计量,7 聚类分析及R使用7.2 聚类统计量,7 聚类分析及R使用,7.2 聚类统计量,距离矩阵,相关矩阵,7 聚类分析及R使用7.2 聚类统计量距离矩阵相关矩阵,7 聚类分析及R使用,7.2 聚类统计量,相关系数

15、矩阵:cor(X),7 聚类分析及R使用7.2 聚类统计量相关系数矩阵:cor(,7 聚类分析及R使用,7.2 聚类统计量,7 聚类分析及R使用7.2 聚类统计量,多元统计分析及R语言建模(第五版)课件第六七章,7 聚类分析及R使用,7.3 系统聚类法,先将个样品分成类,每个样品自成一类,然后每次将具有最小距离的两类合并,合并后重新计算类与类之间的距离,这个过程一直继续到所有的样品归为一类为止,并把这个过程做成一张系统聚类图。,系统聚类法的基本思想,7 聚类分析及R使用7.3 系统聚类法 先将个样品分成类,7 聚类分析及R使用,7.3 系统聚类法,类间距离计算方法,(1)最短距离法(singl

16、e)(2)最长距离法(complete)(3)中间距离法(median)(4)类平均法(average)(5)重心法(centroid)(6)离差平方和法(Ward),7 聚类分析及R使用7.3 系统聚类法类间距离计算方法(1),类间距离计算公式,类间距离计算公式,7 聚类分析及R使用,7.3 系统聚类法,7 聚类分析及R使用7.3 系统聚类法,7 聚类分析及R使用,7.3 系统聚类法,系统聚类法过程,7 聚类分析及R使用7.3 系统聚类法系统聚类法(1)计算n,例7-1数据的系统聚类,最短距离法(采用欧氏距离),例7-1数据的系统聚类最短距离法(采用欧氏距离),例7-1数据的系统聚类,最长距

17、离法(采用欧氏距离),例7-1数据的系统聚类最长距离法(采用欧氏距离),例7-1数据的系统聚类,例7-1数据的系统聚类,7 聚类分析及R使用,7.3 系统聚类法,系统聚类R语言步骤,一、计算距离阵: dist二、进行系统聚类: hclust三、绘制聚类图: plot四、画分类框: rect.hclust五、确认分类结果: cutree,7 聚类分析及R使用7.3 系统聚类法系统聚类一、计算距离阵,【例7.2】续例3.1,研究全国31个省、市、自治区2007年城镇居民生活消费的分布规律,根据调查资料做区域消费类型划分。,【例7.2】续例3.1,研究全国31个省、市、自治区2007,多元统计分析及

18、R语言建模(第五版)课件第六七章,多元统计分析及R语言建模(第五版)课件第六七章,多元统计分析及R语言建模(第五版)课件第六七章,多元统计分析及R语言建模(第五版)课件第六七章,多元统计分析及R语言建模(第五版)课件第六七章,多元统计分析及R语言建模(第五版)课件第六七章,多元统计分析及R语言建模(第五版)课件第六七章,多元统计分析及R语言建模(第五版)课件第六七章,多元统计分析及R语言建模(第五版)课件第六七章,多元统计分析及R语言建模(第五版)课件第六七章,多元统计分析及R语言建模(第五版)课件第六七章,7 聚类分析及R使用,7.4 kmeans聚类法,概念和原理,概念 kmeans法是一

19、种快速聚类法,这种算法的基本思想是将每一个样品分配给最近中心(均值)的类中。原理 kmeans算法以k为参数,把n个对象分为k个类,使类内具有较高的相似度,类间的相似度较低。,7 聚类分析及R使用7.4 kmeans聚类法概念和原理概念,7 聚类分析及R使用,7.4 kmeans聚类法,概念和原理,相似度计算是根据类中对象的均值mean来进行,7 聚类分析及R使用7.4 kmeans聚类法概念和原理相似,7 聚类分析及R使用,7.4 kmeans 聚类法,【例7.3】kmeans算法的R语言实现及模拟分析:模拟正态随机变量,7 聚类分析及R使用7.4 kmeans 聚类法【例7.3】,多元统计

20、分析及R语言建模(第五版)课件第六七章,7 聚类分析及R使用,7.4 kmeans 聚类法,7 聚类分析及R使用7.4 kmeans 聚类法,7 聚类分析及R使用,7.4 kmeans聚类法,模拟10个变量2000个样品的正态随机矩阵,7 聚类分析及R使用7.4 kmeans聚类法模拟10个变量,7 聚类分析及R使用,7.5 聚类分析的一些问题,系统聚类分析的特点综合性形象性客观性,关于kmeans算法 kmeans算法只有在类的均值被定义的情况下才能使用 对于“噪声”和孤立点是敏感的,这种数据对均值影响极大,7 聚类分析及R使用7.5 聚类分析的一些问题系统聚类分析的,7 聚类分析及R使用,7.5 聚类分析的一些问题,关于变量变换平移变换极差变换标准差变换主成分变换对数变换,7 聚类分析及R使用7.5 聚类分析的一些问题关于变量变换,7 聚类分析及R使用,第七章讲到这里就结束了欢迎大家继续学习第八章!,7 聚类分析及R使用第七章,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号