spss教程13-1(判别分析).ppt

上传人:小飞机 文档编号:6520364 上传时间:2023-11-08 格式:PPT 页数:35 大小:267.49KB
返回 下载 相关 举报
spss教程13-1(判别分析).ppt_第1页
第1页 / 共35页
spss教程13-1(判别分析).ppt_第2页
第2页 / 共35页
spss教程13-1(判别分析).ppt_第3页
第3页 / 共35页
spss教程13-1(判别分析).ppt_第4页
第4页 / 共35页
spss教程13-1(判别分析).ppt_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《spss教程13-1(判别分析).ppt》由会员分享,可在线阅读,更多相关《spss教程13-1(判别分析).ppt(35页珍藏版)》请在三一办公上搜索。

1、判别分析 距离判别法 费歇尔判别法 逐步判别法,判别分析,判别分析是根据观察或测量到若干变量值,判断研究对象如何分类的方法。,判别分析,设有k个总体,分布函数分别为,从每个总体,中抽取,个样品,每个样品测量,)。,个指标,对于任一给定的新样本观测值关于指标,的观测值,判断该样本观测值应属于这k 个总体中的哪一个,判别分析,例如,在考古研究中,根据挖掘的古人头盖骨的容量,周长等判断此人的性别;在地质勘探中,根据某地的地质结构,化探和物探等各项指标来判断该地的矿化类型;在医学诊断中,医生要根据某病人的化验结果和病情征兆判断病人患哪一种疾病,等等,判别分析,判别分析,分类:1、按判别的组数来分,有两

2、组判别分析和多组判别分析2、按区分不同总体所用的数学模型来分,有线性判别和非线性判别3、按判别对所处理的变量方法不同有逐步判别、序贯判别。4、按判别准则来分,有费歇尔判别准则、贝叶斯判别准则,判别分析和前面的聚类分析有什么不同呢?主要不同点就是,在聚类分析中一般人们事先并不知道或一定要明确应该分成几类,完全根据数据来确定。而在判别分析中,至少有一个已经明确知道类别的“训练样本”,利用这个数据,就可以建立判别准则,并通过预测变量来为未知类别的观测值进行判别了。,判别分析,费歇尔判别法,费歇尔判别方法是历史上最早提出的判别方法之一,也叫线性判别法费歇尔判别的思想是通过将多维数据投影到某个方向上,投

3、影的原则是将类与类之间尽可能的分开,然后再选择合适的判别准则,将待判的样本进行分类判别。,一、判别原理设有k个总体G1,G2,Gk,每类中含有样本数分别为n1,n2,nk假定所建立的判别函数为,费歇尔判别法,a,b,a表示p维空间的一个方向,如果按这个方向做一条直线,表示向量x在这条直线上投影坐标,费歇尔方法就是要找一由p变量组成的线性函数,使得各组内点的函数值尽可能接近,而不同组间的函数值尽可能远,费歇尔判别法,2 判别函数,费歇尔判别法,费歇尔判别法,费歇尔判别法,费歇尔判别法,标准化判别函数,典则相关系数,费歇尔判别法,类型总体投影均值之间的相等性检验,Wilks 量,对于待判样本,计算

4、 和若,则x属于第k组,费歇尔判别法,3 判别准则,逐步判别分析,一、逐步判别原理 逐步判别分析从模型没有变量开始,每一步都对模型进行检验,把模型外对模型的判别力贡献最大的变量加到模型中,同时考虑已经在模型中但又不符合留在模型中条件的变量从模型中剔除。,二、选择变量方法1、Wilks 最小法2、RaoV最大法3、马氏距离最大法4、F统计量最大法5、剩余离差平方和最小法,逐步判别分析,Wilks 最小法,U统计量=组内平方和/总平方和,每一步都是统计量最小的进入判别函数容许度=1-Ri2(Ri2为偏相关系数),RaoV最大法,每步都是使RaoV统计量产生最大增量的变量进入判别函数P模型中的变量数

5、,g分类数,nk第k组样本大小,Wij*组间协方差矩阵的逆矩阵V两组均值之差,组间的F检验,每步都使任何两类间的最小的F值最大的变量进入判别函数,判别分析的适用条件:,1 各自变量为连续型或有序分类变量,2 样本来自多元正态总体,3 各组的协方差矩阵相等,4 变量间独立,无共线性,判别分析的基本步骤:,1、选择自变量及组变量2、计算各组单变量的描述统计量3、推导判别系数,给出标准化或未标准化的典则判别系数,并对函数显著性进行检验4、建立Fisher线性判别函数5、进行判别分组6、进行样本回判分析,计算错分率7、输出结果,具体操作,StatisticsClassify Discriminant:

6、,Grouping Variables:选择分类变量 Define range:定义范围 Independent:选择自变量 Use stepwise method 逐步判别,Select:选择观测值,一般可省略,具体操作,Statistics:输出统计量 Descriptives:描述统计量 Means:各类中各自变量均值,标准差 和各自变量总样品的均值,标准差 Univariate ANOVAS:检验各类中同一自变量 均值是否相等 BoxM:检验各组协差阵是否相等 Function Cofficients:判别函数系数Matrices:自变量的系数矩阵,具体操作,Method:选择逐步判别

7、的方法 Method:选择逐步判别的方法 Criteria:选择逐步判别停止的准则 Display:输出结果,具体操作,Classify:指定分类参数和判别结果 Prior Probabilities:先验概率 Use Covariance Matrix:选择分类使用 的协方差矩阵Display:输出 Casewise:逐步输出每个样品的分类结果 limit cases to:最大样品数 Summary table:分类概括表 Leave-one-out classification 剔除一个样品 后用其他样品得到的该样品的分类结果,具体操作,Plot:输出统计图Combined-groups

8、:各类输出在同一张散点图中Separate-groups:每类输出一张散点图中Territorial mao:分类区域图,具体操作,Save:保存新变量 Predicted group membership:建立新变量,表明预测的类成员 Discriminant score:建立新变量,表明判别分数 Probabilities of group membership:建立新变量.表明样品属于某一类的概率,例题分析,Discrim.sav,从心电图的5个不同指标中对健康人,硬化症患者和冠心病患者的数据,作判别分析,例题分析,wormwood.sav,作判别分析,练习,例题分析,World95.sav,根据气候,经济因素,人口信息来判断国家或地区属于哪一种类型,设有k个总体,均值向量分别为,协方差矩阵分别为,从每个总体,中抽取,个样品,每个样品测量,)。,个指标,对于任一给定的新样本观测值关于指标,的观测值,判断该样本观测值应属于这k 个总体中的哪一个,距离判别法,距离判别法,马氏距离:,判别准则:,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号