【教学课件】第三章多元正态分布.ppt

上传人:牧羊曲112 文档编号:5660785 上传时间:2023-08-07 格式:PPT 页数:52 大小:685KB
返回 下载 相关 举报
【教学课件】第三章多元正态分布.ppt_第1页
第1页 / 共52页
【教学课件】第三章多元正态分布.ppt_第2页
第2页 / 共52页
【教学课件】第三章多元正态分布.ppt_第3页
第3页 / 共52页
【教学课件】第三章多元正态分布.ppt_第4页
第4页 / 共52页
【教学课件】第三章多元正态分布.ppt_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《【教学课件】第三章多元正态分布.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第三章多元正态分布.ppt(52页珍藏版)》请在三一办公上搜索。

1、1,第三章 多元正态分布,3.1 多元正态分布的定义3.2 多元正态分布的性质3.3 极大似然估计及估计量的性质3.4 复相关系数和偏相关系数3.5 和(n 1)S的抽样分布*3.6 二次型分布,2,3.1 多元正态分布的定义,一元正态分布N(,2)的概率密度函数为若随机向量 的概率密度函数为则称x服从p元正态分布,记作xNp(,),其中,参数和分别为x的均值和协差阵。,3,例(二元正态分布),设xN2(,),这里易见,是x1和 x2的相关系数。当|1时,可得x的概率密度函数为,4,二元正态分布的密度曲面图,下图是当 时二元正态分布的钟形密度曲面图。,5,二元正态分布等高线,等高(椭圆)线:上

2、述等高线上的密度值,6,二元正态分布的密度等高线族(使用SAS/INSIGHT,由10000个二维随机数生成),7,概率密度等高面,x:(x)1(x)=c2这是一个(超)椭球曲面,中心在,而决定了其形状和方向。,8,3.2 多元正态分布的性质,*(1)略。(2)。性质(2)常可用来证明随机向量服从多元正态分布。(3)设xNp(,),y=Cx+b,其中C为rp 常数矩阵,则该性质表明,(多元)正态变量的任何线性变换仍为(多元)正态变量。,9,例3.2.2 设xNp(,),a为p维常数向量,则由上述性质(2)或(3)知,(4)设xNp(,),则x的任何子向量也服从(多元)正态分布,其均值为的相应子

3、向量,协方差矩阵为的相应子矩阵。该性质说明了多元正态分布的任何边缘分布仍为(多元)正态分布。需注意,随机向量的任何边缘分布皆为(多元)正态分布该随机向量服从多元正态分布。反例:习题2.3。,10,还需注意,正态变量的线性组合未必就是正态变量。这是因为:x1,x2,xn均为一元正态变量()x1,x2,xn的联合分布为多元正态分布x1,x2,xn的一切线性组合是一元正态变量例 设xN4(,),这里,11,则(i);(ii);(iii)。,12,(5)设x1,x2,xn相互独立,且xiNp(i,i),i=1,2,n,则对任意n个常数k1,k2,kn,有此性质表明,独立的多元正态变量(维数相同)的任意

4、线性组合仍为多元正态变量。(6)设xNp(,),对x,(0)作如下的剖分:,13,则子向量x1和x2相互独立,当且仅当12=0。可作一般化推广,并对于多元正态变量而言,其子向量之间互不相关和相互独立是等价的。例3.2.5 设xN3(,),其中则x2和x3不独立,x1和(x2,x3)独立。(7)设xNp(,),0,则*(8)略,14,*(9)略*(10)略(11)设xNp(,),0,作如下剖分则给定x2时x1的条件分布为,其中12和112分别是条件数学期望和条件协方差矩阵,112通常称为偏协方差矩阵。,15,这一性质可作一般化推广,并对于多元正态变量,其子向量的条件分布仍是(多元)正态的。例3.

5、2.7 设xN3(,),其中试求给定x1+2x3时 的条件分布。,16,解 令,于是,17,给定y2时y1的条件均值和条件协差阵分别为 所以,18,3.3 极大似然估计及估计量的性质,简单随机样本(简称样本):满足:x1,x2,xn独立,且与总体分布相同。设xNp(,),0,x1,x2,xn是从中抽取的一个样本。数据矩阵或观测值矩阵:一、极大似然估计二、估计量的性质,19,一、极大似然估计,1.和的极大似然估计2.相关系数的极大似然估计,20,1.和的极大似然估计,似然函数:是样本联合概率密度 f(x1,x2,xn)的任意正常数倍,记为L(,)。不妨取,21,极大似然估计,一元正态情形:多元正

6、态情形:其中 称为样本均值向量(简称为样本均值),称为样本离差矩阵,称为样本协方差矩阵。,22,2.相关系数的极大似然估计,相关系数ij的极大似然估计为其中。称rij为样本相关系数、为样本相关矩阵。,23,二、估计量的性质,1.无偏性2.有效性3.一致性4.充分性,24,1.无偏性,如果,则称估计量 是被估参数的一个无偏估计,否则就称为有偏的。,是的有偏估计。E(S)=。,25,证明,26,2.有效性,设 是的一个无偏估计,若对的任一无偏估计 有 即 为非负定矩阵,则称 为的一致最优无偏估计。可以证明,对于多元正态总体,和S分别是和的一致最优无偏估计。,27,3.一致性,如果未知参数(可以是一

7、个向量或矩阵)的估计量 随着样本容量n的不断增大,而无限地逼近于真值,则称 为的一致估计,或称相合估计。估计量的一致性是在大样本情形下提出的一种要求,而对于小样本,它不能作为评价估计量好坏的准则。可以证明,和(或S)分别是和的一致估计(无需总体正态性的假定)。,28,4.充分性,如果一个统计量能把含在样本中的有关总体(或有关未知参数)的信息一点都不损失地充分提取出来,则这种统计量就称为充分统计量。可以证明,对于总体Np(,),当已知时,是的充分统计量;当已知时,是的充分统计量;当和均未知时,(,A)是(,)的充分统计量。用来作为估计量的充分统计量称为充分估计量。A,S这三者之间只相差一个常数倍

8、,所含的信息完全相同,故当和均未知时,也都是(,)的充分统计量。若按无偏性的准则,则可采用(,S)作为未知参数(,)的充分估计量。,29,3.4 复相关系数和偏相关系数,一、复相关系数*二、最优线性预测三、偏相关系数,30,一、复相关系数,(简单)相关系数度量了一个随机变量x与另一个随机变量y之间线性关系的强弱。复相关系数度量了一个随机变量y与一组随机变量x1,x2,xp之间线性关系的强弱。设,31,则y和x的线性函数lx(l 0)间的最大相关系数称为y和x间的复(或多重)相关系数(multiple correlation coefficient),记作yx或y1,2,p,它度量了一个变量y和

9、一组变量x1,x2,xp间的相关程度。若x1,x2,xp互不相关,则有,32,例 试证随机变量x1,x2,xp的任一线性函数F=a1x1+a2x2+apxp与x1,x2,xp的复相关系数为1。证明,33,yx的极大似然估计,设 这里np,则在多元正态的假定下,复相关系数yx的极大似然估计为 称为样本复相关系数。,34,例3.4.2 今对31个人进行人体测试,考察或测试的七个指标是:年龄(x1)、体重(x2)、肺活量(x3)、1.5英里跑的时间(x4)、休息时的脉搏(x5)、跑步时的脉搏(x6)和跑步时记录的最大脉搏(x7)。数据列于表。可算得x3与x1,x2,x4,x5,x6,x7的样本复相关

10、系数,35,表3.4.1 人体的测试数据,36,*二、最优线性预测,当我们用x的函数g(x)来预测y时,可用均方误差Ey g(x)2作为预测精度的度量。如果限制g(x)为线性函数,则使 Ey g(x)2达到最小的线性预测函数是 即有称 为用x对y的最优线性预测。,37,最优线性预测 的均方误差 的精度与yy和yx有关。被预测变量y可作如下分解:=最优线性预测+预测误差,(受x线性影响部分),(不受x线性影响部分),38,预测误差部分可看作是从y中扣除x的线性影响后剩余的部分,它不受x的线性影响,因为称之为总体复判定系数,它表示y的方差可由x1,x2,xp联合解释的比例,该值越大,表明预测效果越

11、好。,39,在y对x1,x2,xp的多元线性回归模型中,可以证明:(1)y与预测值 的样本相关系数等于y与x1,x2,xp的样本复相关系数,即(2)(样本)复判定系数为例3.4.3 在例中,建立x3对x1,x2,x4,x5,x6,x7的六元线性回归模型,拟合函数为可用来对x3进行预测,复判定系数R2=0.8480,(样本)复相关系数,也是x3与预测值 的样本相关系数。,40,三、偏相关系数,两个变量之间的相关性,除了受这两个变量彼此间的影响外,常常还受其他一系列变量的影响。由于这个原因,相关系数有时也称为总(或毛,gross)相关系数,其意思是包含了由一切影响带来的相关性。顺便指出,相关系数有

12、时亦称为简单相关系数或皮尔逊(Pearson)相关系数或零阶偏相关系数。,41,例3.4.4 x1家庭的饮食支出 x2家庭的衣着支出 x3家庭的收入x1和x2之间存在着较强的正相关性。x3分别与x1和x2的强正相关性导致了x1和x2的较强正相关性。如果我们能用某种方式把x3的影响消除掉,或者说控制了x3(即x3保持不变),则x1和x2之间(反映净关系)的相关性可能就很不一样了,很有可能会显示负相关性。,42,将x,(0),S剖分如下:称 为给定x2时x1的偏协方差矩阵。记,称 为偏协方差,它是剔除了 的(线性)影响之后,xi和xj之间的协方差。,43,给定x2时xi 和xj的偏相关系数(par

13、tial correlation coefficient)定义为其中。ijk+1,p度量了剔除xk+1,xp的(线性)影响之后,xi和xj间相关关系的强弱。对于多元正态变量x,由于112也是条件协方差矩阵,故此时偏相关系数与条件相关系数是同一个值,从而ijk+1,p同时也度量了在xk+1,xp值给定的条件下xi和xj间相关关系的强弱。,44,一阶偏相关系数可直接由相关系数算得。设x1,x2,x3是三个随机变量,则有(1)12=0并不意味着123=0,反之亦然。(2)12与123未必同号。此外,12与123之间孰大孰小也没有必然的结论。,45,偏相关系数的一般递推公式:在多元正态性的假定下,ij

14、k+1,p的极大似然估计为其中。称rijk+1,p为样本偏相关系数。,46,例3.4.5 假设对16个婴儿测量了出生体重(盎司)、出生天数(日)及舒张压(mmHg),数据见表。,表3.4.2 16个婴儿的出生体重、年龄及血压的数据,47,在控制出生天数后,舒张压与出生体重的样本偏相关系数为 在控制出生体重后,舒张压与出生天数的样本偏相关系数为,48,3.5 和(n 1)S的抽样分布,一、的抽样分布*二、(n 1)S的抽样分布,49,一、的抽样分布,1.正态总体 设xNp(,),0,x1,x2,xn是从总体x中抽取的一个样本,则2.非正态总体(多元中心极限定理)设x1,x2,xn是来自总体x的一

15、个样本,和存在,则当n很大且n相对于p也很大时,,50,*二、(n1)S的抽样分布,设随机矩阵X=(x1,x2,xq)=(xij):pq,称“vec”为拉直运算。当X=X时,因xij=xji,故只需取其下三角部分组成一个缩减了的长向量,记作vech(X),即vech(X)=(x11,xp1,x22,xp2,xp1,p1,xp,p1,xpp)X的分布是指vec(X)或(当X=X时)vech(X)的分布。拉直运算将矩阵分布问题转化为了向量分布的问题。,51,设随机向量x1,x2,xn独立同分布于Np(0,),0,np,则p阶矩阵 的分布称为自由度为n的(p阶)威沙特(Wishart)分布,记作Wp(n,)。当p=1,=2=1时,显然有,即有W1(n,1)=2(n)因此,威沙特分布是卡方分布在多元场合下的一种推广。,52,威沙特分布的性质,(1)设WiWp(ni,),i=1,2,k,且相互独立,则W1+W2+WkWp(n1+n2+nk,)(2)设WWp(n,),C为qp常数矩阵,则CWCWq(n,CC)设x1,x2,xn是取自Np(,),0的一个样本,np,则可以证明,和S相互独立,且有(n1)SWp(n1,),

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号