《多元统计分析复习整理.docx》由会员分享,可在线阅读,更多相关《多元统计分析复习整理.docx(4页珍藏版)》请在三一办公上搜索。
1、多元统计分析复习整理一、聚类分析的基本思想: 我们认为,所研究的样品或指标之间存在着程度不同的相似性。根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间的相似程度的统计量,以这些统计量为划分类型的依据,把一些相似程度较大的样品聚合为一类,把另一些彼此之间相似程度较大的样品又聚合到另外一类。把不同的类型一一划分出来,形成一个由小到大的分类系统。最后,用分群图把所有的样品间的亲疏关系表示出来。 二、聚类分析的方法 系统聚类法、模糊聚类法、K-均值法、有序样品的聚类、分解法、加入法 三、系统聚类法的种类 最短距离法、最长距离法、重心法、类平均法、离差平方和法 四、判别分析的基本思想 判别
2、分析用来解决被解释变量是非度量变量的情形,预测和解释影响一个对象所属类别。识别一个个体所属类别的情况下有着广泛的应用 判别分析将对象进行分析,通过人们选择的解释变量来预测或者解释每个对象的所属类别。 五、判别分析的假设条件 判别分析的假设条件之一是每一个判别变量不能是其他判别变量的线性组合;判别分析的假设之二是各组变量的协方差矩阵相等。判别分析最简单和最常用的形式是采用线性判别函数。判别分析的假设之三是各判别变量之间具有多元正态分布,即每个变量对于所有其他变量的固定值有正态分布。当违背该假设时,计算的概率将非常的不准确。 六、判别分析的方法 距离判别法、Bayes判别法、 Fisher判别法、
3、逐步判别法 七、距离判别法的判别准则 设有两个总体G1 和G2,x是一个p维样品,若能定义样品到总体G1 和G2的距离d和d,则用如下规则进行判别:若样品x到总体G1的距离小于到总体G2的距离,则认为样品x属于总体G1,反之,则认为样品x属于总体样品x属于总体G2,若样品x到总体G1 和G2的距离相等,则让它待判。 八、Fisher判别的思想 Fisher判别的思想是投影,将k组p维数据投影到某一个方向,使的它们的投影与组之间尽可能地分开。 九、Bayes判别的思想 Bayes统计的思想是:假定对研究的对象已有一定的认识,常用先验概率分布来描述这种认识,然后我们取得一个样本,用样本来修正已有的
4、认识,得到后验概率分布,各种统计推断都通过后验概率分布来进行。将Bayes统计的思想用于判别分析,就得到Bayes判别。 十、判别分析的方法和步骤 1.判别分析的对象2.判别分析的研究设计3.判别分析的假定 4.估计判别模型和评估整体拟合5.结果的解释6.结果的验证 十一、提取主成分的原则 1.累计方差贡献率大于85%,2.特征根大于1 ,3碎石图特征根的变化趋势。 十二、因子分析的步骤 1.根据研究问题选取原始变量。2.对原始变量进行标准化并求其相关阵,分析变量之间的相关性。3.求解初始公共因子及因子载荷矩阵。4.因子旋转。5.因子得分。6.根据因子得分值进行进一步分析。 十三、主成分分析与
5、因子分析的区别。 1.因子分析把展示在我们面前的诸多变量看成由对每一个变量都有作用的一些公共因子和一些仅对某一个变量有作用的特殊因子线性组合而成;主成分分析则简单一些,它只是从空间生成的角度寻 找能解释诸多变量变异绝大部分的几组彼此不相关的新变量。 2.因子分析中是把变量表示成各因子的线性组合,而主成分分析则是把主成分表示成各变量的线性组合。 3.主成分分析中不需要假设,因子分析则需要一些假设。 4.抽取主因子的方法不仅有主成分法,还有极大似然法等,而主成分只能用主成分提取法。 5.主成分分析中,当协方差矩阵或相关阵的特征值唯一时,主成分是固定的;因子分析中因子不是固定的。 6.在因子分析中,
6、因子个数需要分析者指定;在主成分分析中,成分的数量是一定的。 7.和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。 十四、因子载荷的统计含义 1.因子载荷aij的统计含义: 由模型 cov(Xi,Fj)=cov(aijFj+ei,Fj) j=1m =cov(aijFj,Fj)+cov(ei,Fj) j=1m =aij 即aij是Xi与Fj的协方差,而注意到,Xi与Fj都是均值为0,方差为1的变量,因此,aij同时也是Xi与Fj的相关系数。 十五、求解因子载荷有哪些方法 如主成分法,主轴因子法,最小二乘法,极大似然法,a因子提取法;常用的主要是主成分法,主轴因子法与极大似然法。