几种常见概率分布.ppt

上传人:牧羊曲112 文档编号:6093221 上传时间:2023-09-23 格式:PPT 页数:47 大小:241KB
返回 下载 相关 举报
几种常见概率分布.ppt_第1页
第1页 / 共47页
几种常见概率分布.ppt_第2页
第2页 / 共47页
几种常见概率分布.ppt_第3页
第3页 / 共47页
几种常见概率分布.ppt_第4页
第4页 / 共47页
几种常见概率分布.ppt_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《几种常见概率分布.ppt》由会员分享,可在线阅读,更多相关《几种常见概率分布.ppt(47页珍藏版)》请在三一办公上搜索。

1、第五章 常见概率分布律难度级:,第一节二项分布第二节泊松分布第三节正态分布第四节其他概率分布律,内容提要,教学重点:1.正态分布、二项分布、泊松分布的概率 计算方法及应用;2.正态分布标准化的方法3.正态分布表、t值表的用法教学要求:掌握正态分布、二项分布、泊松分布的概率计算方法及应用,一、贝努利试验及其概率公式(一)独立试验和贝努利试验 对于n次独立的试验,如果每次试验结果出现且只出现对立事件 与 之一;在每次试验中出现A的概率是常数p(0p1),因而出现对立事件 的概率是1-p=q,则称这一串重复的独立试验为n重贝努利试验,简称贝努利试验。,第一节二项分布(Binomial distrib

2、ution),(二)二项分布的概率 在n重贝努利试验中,事件A发生x次的概率恰好是(q+p)n二项展开式中的第x+1项,因此将 称作二项概率公式。二、二项分布的意义及其性质(一)定义 设随机变量X所有可能取的值为零和正整数:0,1,2,n,且有(其中p0,q0,p+q=1),则称随机变量X服从参数为n和p的二项分布,记为,(二)二项分布的性质 二项分布是一种离散型随机变量的概率分布,由n和p两个参数决定,参数n称为离散参数,只能取正整数;p是连续参数,取值为0与1之间的任何数值。二项分布具有概率分布的一切性质,即:(k=0,1,2,n)二项分布的概率之和等于1,即:,二项分布的性质,三、二项分

3、布的平均数与标准差 统计学证明,服从二项分布B(n,p)的随机变量之平均数、标准差与参数n、p有如下关系:当试验结果以事件A发生次数k表示时 当试验结果以事件A发生的频率kn表示时,也称率的标准误。,四、二项分布的概率计算及其应用条件(一)概率计算 直接利用二项概率公式例6有一批种蛋,其孵化率为0.85,今在该批种蛋中任选6枚进行孵化,试给出孵化出小鸡的各种可能情况的概率。这个问题属于贝努里模型(?),其中,孵化6枚种蛋孵出的小鸡数x服从二项分布.其中x的可能取值为0,1,2,3,4,5,6。,思考:求 至少孵出3只小鸡的概率是多少?孵出的小鸡数在2-5只之间的概率是多大?,其中:,【例4.1

4、0】设在家畜中感染某种疾病的概率为20,现有两种疫苗,用疫苗A 注射了15头家畜后无一感染,用疫苗B 注射 15头家畜后有1头感染。设各头家畜没有相互传染疾病的可能,问:应该如何评价这两种疫苗?假设疫苗A完全无效,那么注射后的家畜感染的概率仍为20,则15 头家畜中染病头数x=0的概率为,同理,如果疫苗B完全无效,则15头家畜中最多有1头感染的概率为 由计算可知,注射 A 疫苗无效的概率为0.0352,比B疫苗无效的概率0.1671小得多。因此,可以认为A疫苗是有效的,但不能认为B疫苗也是有效的。,(二)应用条件(三个)n个观察单位的观察结果互相独立;各观察单位只具有互相对立的一种结果,如阳性

5、或阴性,生存或死亡等,属于二项分类资料。已知发生某一结果(如死亡)的概率为p,其对立结果的概率则为1-P=q,实际中要求p 是从大量观察中获得的比较稳定的数值。,要观察到这类事件,样本含量n必须很大。在生物、医学研究中,服从泊松分布的随机变量是常见的。此外,由于泊松分布是描述小概率事件的,因而二项分布中当p很小n很大时,可用泊松分布,泊松分布是用来描述和分析稀有事件即小概率事件分布规律的函数。在生物、医学研究中,服从波松分布的随机变量是常见的。如,一定种群中某种患病率很低的非传染性疾病患病数或死亡数,种群中遗传的畸形怪胎数,每升饮水中大肠杆菌数,计数器小方格中血球数,单位空间中某些野生动物或昆

6、虫数等,都是服从波松分布的。,第二节 泊松分布Possion distribution,一、泊松分布的意义(一)定义 若随机变量X(X=k)只取零和正整数值,且其概率分布为 则称X服从参数为的泊松分布,记为XP()。(二)特征=2=,【例4.13】调查某种猪场闭锁育种群仔猪畸形数,共记录200窝,畸形仔猪数的分布情况如表4-3所示。试判断畸形仔猪数是否服从波松分布。,表4-3 畸形仔猪数统计分布 样本均数和方差S2计算结果如下:=fk/n=(1200+621+152+23+14)/200 S2=0.51,=0.51,S2=0.52,这两个数是相当接近的,因此可以认为畸形仔猪数服从波松分布。,是

7、波松分布所依赖的唯一参数。值愈小分布愈偏倚,随着的增大,分 布趋于对称。当=20时分布接近于正态分布;当=50时,可以认 为波松分布呈正态分布。所以在实际工作中,当 20时就可以用正态分布来近似地处理波松分布的问题。,二、波松分布的概率计算 由(4-23)式可知,波松分布的概率计算,依赖于参数 的确定,只要参数确定了,把k=0,1,2,代入(4-23)式即可求得各项的概率。但是在大多数服从波松分布的实例中,分布参数往往是未知的,只能从所观察的随机样本中计算出相应的样本平均数作为 的 估计值,将其代替(4-23)式中的,计算出 k=0,1,2,时的各项概率。,如【例4.13】中已判断畸形仔猪数服

8、从波松分布,并已算出样本平均数=0.51。将0.51代替公式(4-23)中的得:(k=0,1,2,)因为e-0.51=1.6653,所以畸形仔猪数各项的概率为:P(x=0)=0.510(0!1.6653)=0.6005P(x=1)=0.511(1!1.6653)=0.3063P(x=2)=0.512(2!1.6653)=0.0781,P(x=3)=0.513(3!1.6653)=0.0133P(x=4)=0.514(4!1.6653)=0.0017 把上面各项概率乘以总观察窝数(n=200)即得各项按波松分布的理论窝数。波松分布与相应的频率分布列于表4-4中。,表4-4 畸形仔猪数的波松分布

9、将实际计算得的频率与根据=0.51的泊松分布计算的概率相比较,发现畸形仔猪的频率分布与=0.51 的 波松分布是吻合得很好的。这进一步说明了畸形仔猪数是服从波松分布的。,【例4.14】为监测饮用水的污染情况,现检验某社区每毫升饮用水中细菌数,共得400个记录如下:试分析饮用水中细菌数的分布是否服从波松分布。若服从,按波松分布计算每毫升水中细菌数的概率及理论次数并将頻率分布与波松分布作直观比较。,经计算得每毫升水中平均细菌数=0.500,方差S2=0.496。两者很接近,故可认为每毫升水中细菌数服从波松分布。以=0.500代替(4-23)式中的,得(k=0,1,2)计算结果如表45所示。,表45

10、 细菌数的波松分布 可见细菌数的频率分布与=0.5的波松分布是相当吻合的,进一步说明用波松分布描述单位容积(或面积)中细菌数的分布是适宜的。,注意,二项分布的应用条件也是波松分布的应用条件。比如二项分布要求n 次试验是相互独立的,这也是波松分布的要求。然而一些具有传染性的罕见疾病的发病数,因为首例发生之后可成为传染源,会影响到后续病例的发生,所以不符合波松分布的应用条件。对于在单位时间、单位面积或单位容积内,所观察的事物由于某些原因分布不随机时,如细菌在牛奶中成集落存在时,亦不呈波松分布。,一、正态分布的定义及其特征(一)定义 若连续性随机变量X的概率分布密度函数为:其中,为平均数,2 为方差

11、,则称随机变量服从正态分布,记为(,2).相应的概率分布函数为,第三节 正态分布normal distribution,(二)特征正态分布密度曲线是以=为对称轴的单峰、对称的悬钟形;f(x)在=处达到极大值,极大值为f(x)是非负数,以x轴为渐进线;,正态分布密度函数曲线,正态分布有两个参数,即平均数和标准差。是位置参数,是变异度参数。分布密度曲线与横轴所夹的面积为1,即:,正态分布密度函数曲线,特征,相同而不同的三个正态总体,相同而不同的三个正态总体,特征,(一)定义 称=0,2=1的正态分布为标准正态分布。标准正态分布的概率密度函数及分布函数如下:若随机变量服从标准正态分布,记作(0,1)

12、,二、标准正态分布standard normal distribution,(二)标准化的方法 对于任何一个服从正态分布(,2)的随机变量,都可以通过标准化变换:u=(-)/即减平均数后再除以标准差,将其变换为服从标准正态分布的随机变量。对不同的及P(Uu)值编成函数表,称为正态分布表,从中可以查到任意一个区间内曲线下的面积,即为概率。,三、正态分布的概率计算(一)标准正态分布的概率计 设u服从标准正态分布,则落在1,2内的概率,应熟记的几种标准正态分布概率,(二)一般正态分布的概率计算 将区间的上下限标准化:服从正态分布的随机变量落在1,2内的概率,等于服从标准正态分布的随机变量u落在 的概

13、率。查标准正态分布表例如,u=1.75,1.7放在第一列0.05放在第一行。在附表1中,1.7所在行与 0.05 所在列相交处的数值为0.95994,即(1.75)=0.95994,【例4.6】已知uN(0,1),试求:(1)P(u-1.64)?(2)P(u2.58)=?(3)P(u2.56)=?(4)P(0.34u1.53)=?,利用(4-12)式,查附表2得:(1)P(u-1.64)=0.05050(2)P(u2.58)=(-2.58)=0.024940(3)P(u2.56)=2(-2.56)=20.005234=0.010468(4)P(0.34u1.53)=(1.53)-(0.34)=

14、0.93669-0.6331=0.30389,例若服从=30.26,2=5.102的正态分布,试求P(21.64x32.98)。令u=(-30.26)/5.10,则u服从标准正态分布,故,高梁品种三尺三的株高服从正态分布N(156.2,4.822),求:(1)X164cm的概率;(3)X在152162cm的概率。解:(1)根据P(X164)=-(164-156.2)/4.82=(-1.62)=0.05262=1-(164-156.2)/4.82=1-0.94738=0.05262(3)P(152X162)=(162-156.2)/4.82-(152-156.2)/4.82=0.69278,有

15、时 会 遇 到 给 定(u)值,例 如(u)=0.284,反过来查u值。这只要在附表1中找到与 0.284 最接近的值0.2843,对应行的第一列数-0.5,对应列的第一行数 值 0.07,即相应的u值为 u=-0.57,即(-0.57)=0.284,(三)双侧(两尾)概率与单侧(一尾)概率随机变量x落在平均数加减不同倍数标准差区间之外的概率称为双侧概率(两尾概率),记作 对应于双侧概率可以求得随机变量x小于-k或大于+k的概率,称为单侧概率(一尾概率),记作/2 如x落在(-1.96,+1.96)之外的双侧概率为0.05,而单侧概率为0.025。即,标准正态双侧分位数的查法:附表3 标准正态

16、分布,正态分布密度函数曲线,前面讨论的三个重要的概率分布中,前两个属离散型随机变量的概率分布,后一个属连续型随机变量的概率分布。三 者间的关系如下:对于二项分布,在n,p0,且 n p=(较小常数)情况下,二项分布 趋于 波 松布。在这种场合,波松分布中的参数 用二项分布的n p代之;在n,p0.5时,二项分布趋于正态分布。在这种场合,正态分布中的、2用二项分布的n p、n p q代之。在实际计算中,当p0.1且n 很大时,二项分布可由波松分布近似;当p0.1且n很大时,二项分布可由正态分布近似。,对于波松分布,当时,波松分布以正态分布为极限。在实际计算中,当 20(也有人认为6)时,用波松分布中的代替正态分布中的及2,即可由后者对前者进行近似计算。,中心极限定理 中心极限定理告诉我们:不论x变量是连续型还是离散型,也无论x服从何种分布,一般只要n30,就可认为 的分布是正态的。若x的分布不很偏倚,在n20时,x 的分布就近似于正态分布了。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号