《第八章常用统计分布.ppt》由会员分享,可在线阅读,更多相关《第八章常用统计分布.ppt(18页珍藏版)》请在三一办公上搜索。
1、第八章 常用统计分布,2023/6/24,2,第一节 超几何分布,适用:小群体的两分变量。假定总体为K个成功类、(N-K)个为失败类 1.超几何分布为离散型随机变量的概率分布,它的数学形式是,2023/6/24,3,2.超几何分布的数学期望值和方差,如果用,则有,2023/6/24,4,例 以随机方式自5男3女的小群体中选出5人组成一个委员会,求该委员会中女性委员人数的概率分布、期望值与变异数。解 由题意可知:N8K3,NK5n5,代入(81)式,故概率分布如下:,由,代入(84)式、(85)式得(1)(2),2023/6/24,5,3.关于超几何分布的近似,设某校有l000名大学生,其中有外
2、国留学生10、名,现从该校学生中任抽2人,求抽到外国留学生的概率分布。解 抽到外国留学生人数X服从N1000、K10、n2的超几何分布,根据(81)式得,2023/6/24,6,由于 000201,用二项分布近似 计算有,由(86)式得,两种方法计算结果比较一下,仅在小数点后第5位上才出现误差。当然在01时,如此计算误差会比较大。另外,二项分布的计算量仍不算小,有时还可以将二项分布近似为泊松分布,这一点我们将在下一节讨论。,2023/6/24,7,第二节泊松分布,适用:稀有事件的研究。一个事件的平均发生次数是大量实验的结果,在这些试验中,此事件可能发生,但是发生的概率非常小。泊松分布亦为离散型
3、随机变量的概率分布,随机变量X为样本内成功事件的次数。若为成功次数的期望值,假定它为已知。而且在某一时空中成功的次数很少,超过5次的成功概率可忽不计,那么X的某一具体取值x(即稀有事件出现的次数)的概率分布为,2023/6/24,8,泊松分布的性质:x的取值为零和一切正整数;图形是非对称的,但随着的增加,图形变得对称;泊松分布的数学期望和方差均为。,2023/6/24,9,例 某城市50天交通事故的频数分布如 表所示,试求泊松理论分布。,解 由资料知查泊松分布表,得理论分布 将实测频数与理论频数比较,可知题中所述稀有事件是满足泊松分布的。,2023/6/24,10,第三节 卡方分布,卡方分布是
4、一种连续型随机变量的概率分布,主要用于列联表检验。1.数学形式 设随机变量X1,X2,Xk,相互独立,且都服从同一的正态分布N(,2)。那么,我们可以先把它们变为标准正态变量Z1,Z2,Zk,k个独立标准正态变量的平方和被定义为卡方分布(分布)的随机变量(读作卡方),且,我们把随机变量 的概率分布称为 分布,其概率密度记作。其中k为卡方分布的自由度,它表示定义式中独立变量的个数。,2023/6/24,11,关于卡方分布的分布函数,附表7对不同的自由度k及不同的临界概率(01),给出了满足下面概率式的 的值(参见图)。,注意 写法的含义:它表示自由度为k的卡方分布,当其分布函数 时,其随机变量
5、的临界值(参见图)。具体来说,在假设检验中,它表示在显著性水平上卡方分布随机变量 的临界值。,2023/6/24,12,解 查卡方分布表(附表7)得,例 试求下列各值:,例 已知k5,15,求临界概率。解 查卡方分布表,在表中自由度为5的横行中找到与15最接近的数值是15086,得到的近似值为001。由此可知 001,2023/6/24,13,式中:2代表总体方差,自由度为nl。,2.卡方分布的性质(1)恒为正值。(2)卡方分布的期望值 是自由度k,方差 为2k。卡方分布取决于自由度k,每一个可能的自由度对应一个具体的卡方分布。卡方分布只与自由度有关,这就给卡方分布的实际应用带来很大方便。分布
6、由正态分布导出,但它之所以与正态分布的参数和无关,是因为标准正态变量Z与原来的参数无关。(3)卡方分布具有可加性(4)利用卡方分布可以推出样本方差 S2 的分布,2023/6/24,14,所以,样本方差S 2落在33和87之间的概率约为90。,3.样本方差的抽样分布 例 由一正态总体抽出容量为25的一随机样本,已知26,求样本方差S 2在33到87之间的概率。解 已知n25,26,由 得,2023/6/24,15,第四节 F 分布,F 分布是连续性随机变量的另一种重要的小样本分布,可用来检验两个总体的方差是否相等,多个总体的均值是否相等。还是方差分析和正交设计的理论基础。1.数学形式 设 和
7、相互独立,那么随机变量,服从自由度为(k1,k2)的F分布。其中,分子上的自由度k1叫做第一自由度,分母上的自由度k2叫做第二自由度。,2023/6/24,16,我们把随机变量F的概率分布称为F分布,其概率密度记作。本书附表8,对不同自由度(k1,k2)及不同的临界概率(01),给出满足下列概率式的F(k1,k2)的值(参见图)。,注意 写法的含义:它表示自由度为(k1,k2)的F分布,当其分布函数 时,其随机变量 F 的临界值(参见图)。具体来说,在假设检验中,它表示在显著性水平上F分布随机变量 F 的临界值。,2023/6/24,17,例 试求下列各值:,如果 和 是两个独立随机样本的方差,样本来源于具有相同方差2的两个正态总体,样本容量分别为n1和n2,那么根据(822)式,随机变量F 服从于自由度为(n11和n21)的F分布。,解查F分布表(附表8)得,2023/6/24,18,2.F分布性质,(1)随机变量F恒为正值,F分布也是一个连续的非对称分布。(2)分布具有一定程度的反对称性。(3)F分布的期望值与变异数(方差),