数学实验04-多元统计基本概念.ppt

上传人:小飞机 文档编号:5985066 上传时间:2023-09-11 格式:PPT 页数:48 大小:507KB
返回 下载 相关 举报
数学实验04-多元统计基本概念.ppt_第1页
第1页 / 共48页
数学实验04-多元统计基本概念.ppt_第2页
第2页 / 共48页
数学实验04-多元统计基本概念.ppt_第3页
第3页 / 共48页
数学实验04-多元统计基本概念.ppt_第4页
第4页 / 共48页
数学实验04-多元统计基本概念.ppt_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《数学实验04-多元统计基本概念.ppt》由会员分享,可在线阅读,更多相关《数学实验04-多元统计基本概念.ppt(48页珍藏版)》请在三一办公上搜索。

1、多元统计分析简介,多元统计分析:通过对多个随机变量观测数据的分析,来研究变量之间的相互关系以及解释这些变量内在的变化规律。,一元统计分析一个随机变量的 统计规律多元统计分析多个随机变量之间的 相互依赖关系及内在统计规律性,多元统计分析应用:经济学、工业、农业、医学、教育学、生态学、地质学、社会学、考古学、环境学、气象、文学等许多领域,多元统计分析主要内容:1、多元正态总体的参数估计和假设检验2、常用的处理多元数据的统计方法:1)聚类分析 2)判别分析 3)主成分分析 4)因子分析 5)多重多元回归分析等等,第一章多元统计中的基本概念,第一节 基本概念第二节 多元正态分布第三节 多元统计中的常用

2、分布,第一节基本概念,1.随机向量 Def1:将p个随机变量 的整体称为p维随机向量,记作。,分布函数,离散型:分布律连续型:密度函数,分布密度函数,满足,分布密度函数应满足的两个条件?,Def2:设 是p维随机向量,称由它的q(qp)个分量组成的子向量 的分布为 的边缘分布,相对的把 的分布称为联合分布。,边缘分布函数和边缘分布密度可由联合分布和联合密度确定。,Def3:若p个随机变量 的联合分布等于各自的边缘分布的乘积,则称 是相互独立的。,2.随机向量的数字特征,(1)数学期望,其中,,均值向量具有如下性质:,(2)协方差矩阵 设 称,为X的协差阵。,若X的协差阵存在,且每个分量的方差大

3、于0,则称随机变量X的相关阵为,其中为相关系数。,设标准离差阵为则有,称X和Y的协差阵为:,协差阵具有如下性质:(试证之),多元分析的任务分析各变量之间的关系,推断总体的性质,为一维随机变量为多维随机变量(随机向量),3.多元总体 多元分析研究具有多个(如p个)属性(指标)的对象组成的总体-多元总体。从总体中任意抽出一个对象(总体单元),其p个属性的值为,多元总体多维随机变量(随机向量)可能取值的全体。,观测矩阵(随机)(样本资料阵),4.多元样本的相关概念,从多元总体中随机抽取n个个体。,i.i.d.简单随机样本,多元分析的 研究对象,(1)样本平均值,样本平均值是n个样本点的重心,(2)样

4、本离差阵,样本均值和样本离差阵的矩阵表示:,(3)样本协差阵,(4)样本相关阵,-样本相关系数,非负定矩阵,第二节多元正态分布,1.多元正态分布,若随机向量 的分布密度函数为,则称 服从p维正态分布。记作:其数学期望与协方差矩阵分别为:,其中,为对称正定矩阵,,特例1(一元正态分布),则,特例2(二元正态分布),设,则,2.多元正态分布的常用性质,分布?,第三节 多元统计中的常用分布,在一元统计中,卡方分布、t分布和F分布在参数估计和假设检验中起着非常重要的作用。在多元统计中,他们分别发展为Wishart分布、Hotelling-T2分布和Wilks分布,在多元参数估计和假设检验中占有非常重要

5、的地位。,1、Wishart分布(1)Wishart分布由Wishart在1928年推导出来。,(2)Wishart分布的性质,2、Hotelling-T2分布,(2)Hotelling-T2分布的性质,3、Wilks分布,多元正态总体下的假设检验问题。,附 录,指标:定量;定性 类型:间隔尺度:用连续的量来表示,如长度,重量等;若存在绝对零点,又称比例尺度;有序尺度:没有明确的数量表示,只是划分一些等级,等级间有次序关系,如产品分上中下三等,有次序关系,但无数量表示。名义尺度:既无数量表示,又无次序关系,如某物体有红黄白三种颜色,回答问卷中是与否等等。,一、三种数据类型,二、距离,1.距离的

6、概念(描述样本间差异程度的量),2.距离的定义 定义如果第i号样本 和第j号样本 的函数 满足i)当且仅当 时;ii)对一切iii)则称 是一种广义距离。如果进一步还满足iv)则称 是一种距离。,3.欧几里德距离(欧氏距离),欧氏距离的性质)平移不变性 将每个坐标 加上一个常数 后,任何二点之间的距离保持不变。)对正交变换的不变性)如果将每个点的坐标都增加C倍,点间距离也增加C倍。缺点与测量单位有关,不同属性之间的差别等同看待。,4.马氏距离(Mahalanobis),设X是原始数据矩阵,S是其协方差矩阵,则马氏距离定义为,马氏距离的性质)平移不变性)对任意可逆线性变换的不变性 设 为可逆矩阵

7、,若对任何一个点 做变换而得到一个新的点,这个变换叫可逆线性变换。由标准化数据和中心化数据计算出的两点间的马氏距离相同,且与测量单位无关。进一步,作可逆变换后仍旧不变。缺点夸大了变化微小的变量的作用。,5.B模距离,设X是原始数据矩阵,B是一个正定矩阵,则B模距离定义为,说明 时为欧氏距离,时为马氏距离。当各变量对区分样本有不同作用时,可以给各变量以不同权重。这时可取B为 B矩阵元素的作用-权重。(根据专业知识或用统计方法来确定。),特别,当q=1时,即为绝对距离:,当q=无穷大时,即为 切比雪夫距离:,7.注释 可根据实际问题的要求,自己定义所需要的距离。样本单元之间的差异大小还可以用相似系数来表示。,6.明氏(Minkowski)距离,当q=2时,即为 欧氏距离,三、相似系数,1.概述,如果第i号样本 和第j号样本 的函数 满足当二样本点差异越大时 越小,二样本点越相似时 越大。则称为样本 和 之间的相似系数。相似系数一般满足,2.定量数据常用的相似系数 相关系数(注意与前面相关系数定义的不同之处。)夹角余弦,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号