《多元统计检验》PPT课件.ppt

上传人:牧羊曲112 文档编号:5581699 上传时间:2023-07-30 格式:PPT 页数:32 大小:359KB
返回 下载 相关 举报
《多元统计检验》PPT课件.ppt_第1页
第1页 / 共32页
《多元统计检验》PPT课件.ppt_第2页
第2页 / 共32页
《多元统计检验》PPT课件.ppt_第3页
第3页 / 共32页
《多元统计检验》PPT课件.ppt_第4页
第4页 / 共32页
《多元统计检验》PPT课件.ppt_第5页
第5页 / 共32页
点击查看更多>>
资源描述

《《多元统计检验》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《多元统计检验》PPT课件.ppt(32页珍藏版)》请在三一办公上搜索。

1、第七章 实用多元统计分析,7.1.1 引言前述研究的总体(或观测指标)都是一个变量(一维)的情形。研究一维随机变量的分布、数字特征等统计特性一元统计方法。多元统计分析是运用概率论、数理统计线性代数和一元统计方法为基础来研究多维随机变量(指标)问题的一类数学方法,是一元统计学的推广。在实际问题中,多维随机变量普遍存在。很多随机现象涉及到的变量不止一个,且这些变量间又存在一定的联系。,71 多元分析的基本概念,例:表11 12名学生5门课程的考试成绩,如果仅用一元统计方法作成绩分析,每次分析处理一门课程的成绩,由于忽视了课程之间可能存在的相关性,因此,一般说来,丢失的信息太多,分析的结果不能全面反

2、映全年级的学习情况。需要研究很多问题:用各科成绩的总和作为综合指标,来比较学生学习成绩的好坏;根据各科成绩相近程度对学生进行分类(如成绩好的和成绩差的,又如文科成绩好的与理科成绩好的);研究各科成绩之间的相关关系(如物理与数学成绩的关系,文科成绩与理科成绩的关系等);都属于多元统计分析的研究内容。,多元分析是以p个变量的n次观测数据所组成的数据矩阵 为依据,对p维总体 进行统计推断的。,英国著名统计学家肯德尔(Kendall)在多元分析一书中把多元统计分析的研究内容和方法概括为以下几个方面:简化数据结构(降维问题)将复杂的数据结构通过变量代换等方式使相互依赖的变量(较多)变成(较少)互不相关的

3、;或把高维空间的数据投影到低维空间,使问题简化而损失的信息又不太多。例如,主成分分析、因子分析等一类方法;,分类与判别(归类问题)对所考察的观测点(变量)按相似程度进行分类(或归类)。如聚类分析、判别分析等;变量间的相互联系 相互依赖关系:分析一个变量或几个变量的变化是否依赖于另一些变量的变化?如果是,建立变量间的定量关系式,并用于预测或控制回归分析;变量间的相互关系:分析两组变量间的相互关系典型相关关系。参数估计与假设检验 检验由多元总体参数表示的某种统计假设,据此证实假设条件的合理性。,多元统计分析的应用,教育学:体育运动项目的研究(因子分析);医学:利用多元统计方法可建立诊断的准则(即专

4、家系统);气象学:气候预测,气候信息分析;环境科学:大气污染问题(假设检验、回归分析);地质学地质数学:矿石归类(判别分析);考古学;服装工艺;经济学:经济现象分析,预测,实证研究;工、农业:试验方案的优化;社会科学:根据研究对象进行某种分类(聚类分析);文学;其它.,样本与常用统计量,多维随机向量(P381-P389)多元统计分析的基本概念包括分布、数字特征、正态随机向量等,与一元统计分析类似有关概念如下:统计总体G,用p个数量指标来刻画:视X为一个p维随机变量。,对总体进行n次独立的观察(抽样)得到观测数据称为样本,每个称为样品,记为矩阵 X称为原始数据矩阵或(多元)样本数据矩阵。,总体的

5、均值向量、协方差矩阵、相关矩阵分别为其中,多元统计分析的任务:,一是分析各观测数据之间的关系;二是推断总体的某些性质。,常用统计量,样本均值(向量)、样本协方差矩阵、样本相关矩阵分别为,其中是一元统计中样本统计量的自然推广。对于i,j=1,2,p,有:,讲解例7.1(P270),定义7.1:如果样品 的函数,满足1)2)3)则称是样品之间的距离。,7.1.4 距离,为测度p维空间两个样品之间的差异,对样品进行分类,引入”距离”。数学上对距离(如欧氏距离)的三个公理:非负性、对称性和三角不等式。,常用的距离,欧氏距离 不足之处:各分量的单位不同时,比较没有意义。如考察患病指标(白血球数,体温),

6、有三个样品 但从医学常识看,显然是个谬误。(“大数吃小数”,数值分析)。因此要考虑各项数值的加权问题。,马氏距离定义:为样品之间的马氏距离;为样品到总体的马氏距离。其中:,V分别是总体G的均值向量和协方差。离差大的分量在距离中相应削弱它的影响程度。不足之处:马氏距离与测量单位无关,夸大了变化微小的变量的作用。,B模距离 对于给定的正定矩阵B,定义 为样品Xi与Xj之间的B模距离;闵可夫斯基距离 为样品Xi与Xj之间的闵可夫斯基距离q=2时为欧氏距离,q=1时为绝对距离,q=+时为切比雪夫距离。,讲解例7.2(P274),7.2 多元正态分布的参数估计与检验 7.2.1 预备知识,与一元类似,多

7、元正态分布在多元统计分析中处于中心地位。原因有三:大量实际问题服从正态分布;由中心极限定理,正态分布是其它分布的极限分布;理论完善。,多元正态分布的定义:设 其中是相互独立的标准正态随机变量,则称为p维正态随机向量,记为其中 是常向量,A是pn的常数矩阵。特别,基本性质,设总体则 X的密度函数为设 则,设 是总体X的样本,样本数据矩阵如前。由样本得到关于未知参数 的似然函数为,主要结论,(1)(引理7.1)A与S有关系式(2)(引理7.2)证明:(见P276),(3)(引理7.3)设 是总体 的样本,则样本均值(4)(引理7.4)设,令 则 证明:(见P277),7.2.2 参数和V的估计,定

8、理7.1设总体 是X的样本,且np,则1)是的极大似然估计(引理7.2);2)若已知,则 是V的极大似然估计;3)若未知,则 是V的极大似然估计。,定理7.2:设条件同前,则1)分别是和V的无偏估计;2)分别是和V的最小方差无偏估计;3)分别是和V的相合估计;定理7.3:设条件同前,则 是R的极大似然估计和相合估计。例7.3(P280),7.2.3 参数的检验,仅讨论均值的检验问题(一)单个多元正态总体 的情形 其中0是已知的p维向量。设 是总体的样本,分别是样本均值向量和样本协方差矩阵。构造假设的检验统计量,(1)当V已知时回顾,p=1时当假设为真时,。为推广至多元,改写为,类比引入统计量由引理7.4知,当 为真时,当 为假时,D将会变大。因此,给定显著性水平,假设的拒绝域为,(2)当V未知时用S取代V,可以证明,当 为真时 统计量因此,假设的拒绝域为,(二)两个总体 情形,设 是分别取自上述两个总体的样本,且相互独立,V0,类似于前,得到检验方法如下:,当V已知时,统计量当假设为真时,给定,假设的拒绝域为,当V未知时,由于(V的无偏估计),选用统计量,例7.4(P283),

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号