判别分析方法与SPSS分析课件.ppt

上传人:牧羊曲112 文档编号:3718043 上传时间:2023-03-16 格式:PPT 页数:33 大小:401.50KB
返回 下载 相关 举报
判别分析方法与SPSS分析课件.ppt_第1页
第1页 / 共33页
判别分析方法与SPSS分析课件.ppt_第2页
第2页 / 共33页
判别分析方法与SPSS分析课件.ppt_第3页
第3页 / 共33页
判别分析方法与SPSS分析课件.ppt_第4页
第4页 / 共33页
判别分析方法与SPSS分析课件.ppt_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《判别分析方法与SPSS分析课件.ppt》由会员分享,可在线阅读,更多相关《判别分析方法与SPSS分析课件.ppt(33页珍藏版)》请在三一办公上搜索。

1、判别分析方法,基于SPSS应用软件,一、判别分析意义,判别分析是根据表明事物特点的变量值和它们所属的类,求出判别函数。根据判别函数对未知所属类别的事物进行分类的一种分析方法。在自然科学和社会科学的各个领域经常遇到需要对某个个体属于哪一类进行判断。如动物学家对动物如何分类的研究和某个动物属于哪一类、目、纲的判断。不同:判别分析和聚类分析不同的在于判别分析要求已知一系列反映事物特征的数值变量的值,并且已知各个体的分类(训练样本)。,方法有,距离判别根据个案与总体均值间的距离大小的原则,进行判别。贝叶斯判别根据后验概率最大的原则。典型判别求原始变量的线性组合,使产生的新变量之更能将类分开。逐步判别有

2、逐步筛选的办法,将对判别有贡献的变量选出。,例 中小企业的破产模型 为了研究中小企业的破产模型,选定4个经济指标:X1总负债率(现金收益/总负债)X2收益性指标(纯收入/总财产)X3短期支付能力(流动资产/流动负债)X4生产效率性指标(流动资产/纯销售额)对17个破产企业(1类)和21个正常运行企业(2类)进行了调查,得如下资料:,距离的判别,由于已经知道所有点的类别了,所以可以求得每个类型的中心。这样只要定义了如何计算距离,就可以得到任何给定的点(企业)到这三个中心的三个距离。显然,最简单的办法就是离哪个中心距离最近,就属于哪一类。通常使用的距离是所谓的Mahalanobis距离(马氏距离)

3、。用来比较到各个中心距离的数学函数称为判别函数(discriminant function).这种根据远近判别的方法,原理简单,直观易懂。,贝叶斯判别,根据后验概率最大的原则,在企业的财务状况下,利用贝叶斯公式计算其判给各类的后验概率,哪个概率越大,则判给哪类。,典型判别法(先计算新变量的线性组合),考虑只有两个(预测)变量的判别分析问题。假定这里只有两类。数据中的每个观测值是二维空间的一个点。见图(下一张幻灯片)。这里只有两种已知类型的训练样本。其中一类有38个点(用“o”表示),另一类有44个点(用“*”表示)。按照原来的变量(横坐标和纵坐标),很难将这两种点分开。于是就寻找一个方向,也就

4、是图上的虚线方向,沿着这个方向朝和这个虚线垂直的一条直线进行投影会使得这两类分得最清楚。可以看出,如果向其他方向投影,判别效果不会比这个好。有了投影之后,再用前面讲到的距离远近的方法来得到判别准则。这种首先进行投影的判别方法就是典型判别法。,逐步判别法(仅仅是在前面的方法中加入变量选择的功能),有时,一些变量对于判别并没有什么作用,为了得到对判别最合适的变量,可以使用逐步判别。也就是,一边判别,一边引进判别能力最强的变量,这个过程可以有进有出。一个变量的判别能力的判断方法有很多种,主要利用各种检验,例如Wilks Lambda、Raos V、The Squared Mahalanobis Di

5、stance、Smallest F ratio或The Sum of Unexplained Variations等检验。其细节这里就不赘述了;这些不同方法可由统计软件的各种选项来实现。逐步判别的其他方面和前面的无异。,第一步:打开判别分析的窗口。,变量全部选入。,变量逐步选入全部选入。,第二步:定义类的代码。,第三步:将变量放入独立变量框。,Means计算平均数;Univariate ANOVAs讨论单变量的方差分析,看哪些本来在组间有差异;Boxs M统计量总体的协方差相等的检验。,Fishers判别函数的系数;Unstandardized 没有标准化的判别函数的系数;,关于协方差矩阵的要

6、求。,第四步:选择统计量。,Prior对先验概率的要求,上一个选项是先验概率相等,后一个是以样本的频率为先验概率;Display对输出数据的要求。Casewise result所有个案的结果;Summary table判别结果的表格;Leave-out-classification交叉核实。Use Covariance利用什么矩阵计算判别函数。组内的协方差矩阵,还是分组协 方差矩阵;Plot对典型变量进行分组,画直方图。分类区域散点图。,第五步:选择判类的一些前提条件和输出。,关于逐步判别的选项。,下面来观察输出结果,一、首先做全模型 要求:所有本来均进入;先验概率相等;输出判别函数;做交叉核

7、实;画分类散点地图;保存后验概率,判类结果和判别函数得分。,标准化的典型变量的函数,典型判别函数和原始变量的相关系数。,典型判别函数的系数,判别函数的得分由此计算。,典型变量在两类的均值。,距离判别法的判别函数。在正态假定下,它与贝叶斯判别等价。,错判和正判的结果。标志处是回代核实和交叉核实的正判率。,误判和正确判别率,从这个表来看,我们的分类能够100%地把训练数据的每一个观测值分到其本来的类。该表分成两部分;上面一半(Original)是用从全部数据得到的判别函数来判断每一个点的结果(前面三行为判断结果的数目,而后三行为相应的百分比)。下面一半(Cross validated)是对每一个观

8、测值,都用缺少该观测的全部数据得到的判别函数来判断的结果。这里的判别结果是100%判别正确,但一般并不一定。,二、利用SPSS软件的逐步判别法的结果,选择了两个变量。,判别分析要注意什么?,训练样本中必须有所有要判别的类型,分类必须清楚,不能有混杂。要选择好可能由于判别的预测变量。这是最重要的一步。当然,在应用中,选择的余地不见得有多大。要注意数据是否有不寻常的点或者模式存在。还要看预测变量中是否有些不适宜的;这可以用单变量方差分析(ANOVA)和相关分析来验证。判别分析是为了正确地分类,但同时也要注意使用尽可能少的预测变量来达到这个目的。使用较少的变量意味着节省资源和易于对结果进行解释。,判

9、别分析要注意什么?,在计算中需要看关于各个类的有关变量的均值是否显著不同的检验结果(在SPSS选项中选择Wilks Lambda、Raos V、The Squared Mahalanobis Distance或The Sum of Unexplained Variations等检验的计算机输出),以确定是否分类结果是仅仅由于随机因素。此外成员的权数(SPSS用prior probability,即“先验概率”,和贝叶斯统计的先验概率有区别)需要考虑;一般来说,加权要按照各类观测值的多少,观测值少的就要按照比例多加权。对于多个判别函数,要弄清各自的重要性。注意训练样本的正确和错误分类率。研究被误

10、分类的观测值,看是否可以找出原因。,SPSS选项,打开.sav数据。然后点击AnalyzeClassifyDiscriminant,把group放入Grouping Variable,再定义范围,即在Define Range输入13的范围。然后在Independents输入所有想用的变量;但如果要用逐步判别,则不选Enter independents together,而选择Use stepwise method,在方法(Method)中选挑选变量的准则(检验方法;默认值为Wilks Lambda)。,为了输出Fisher分类函数的结果可以在Statistics中的Function Coefficient选 Fisher和UnStandardized(点则判别函数系数),在Matrices中选择输出所需要的相关阵;,还可以在Classify中的Display选summary table,Leave-one-out classification;注意在Classify选项中默认的Prior Probability为All groups equal表示所有的类都平等对待,而另一个选项为Compute from group sizes,即按照类的大小加权。在Plots可选 Combined-groups,Territorial map等。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号