《《常用概率分布》课件.ppt》由会员分享,可在线阅读,更多相关《《常用概率分布》课件.ppt(38页珍藏版)》请在三一办公上搜索。
1、第五章 常用概率分布,二项分布,二项分布的概念与特征 一个袋子里有5个乒乓球,其中2个黄球,3个白球,我们进行摸球游戏:每一次摸到黄球的概率是0.4,摸到白球的概率是0.6。先后摸5次,摸到黄球次数为0、1、2、3、4和5的概率分别是多大?,该实验有三个特点:一、是各次摸球是彼此独立的;二、是每次摸球只有二种可能的结果,黄球或白球;三、是每次摸到黄球(或摸到白球)的概率是固定的。具备这三点,n次中有X次摸到黄球(或白球)的概率分布就是二项分布。,例5-1 用针灸治疗头痛,假定结果不是有效就是无效,每一例有效的概率为。某医生用此方法治疗头痛患者5例,3例有效的概率是多少?因为每例有效的概率相同,
2、且各例的治疗结果彼此独立,5例患者中可以是其中的任意3例有效。,医学研究中很多现象观察结果是以两分类变量来表示的,如阳性与阴性、治愈与未愈、生存与死亡等等。如果每个观察对象阳性结果的发生概率均为,阴性结果的发生概率均为(1);而且各个观察对象的结果是相互独立的:那么,重复观察n个人,发生阳性结果的人数X的概率分布为二项分布,记作B(X;n,)。,二项分布的概率函数P(X)可用公式(5-1)来计算。,例5-2 临床上用针灸治疗某型头痛,有效的概率为60%,现以该法治疗3例,其中两例有效的概率是多大?,表5-1 治疗3例可能的有效例数及其概率,由表5-1可知,各种可能结果出现的概率合计为1,即P(
3、X)=1(X=0,1,n)。因此,如果欲求1例以上有效的概率可以是P(x1)=P(1)+P(2)+P(3)=0.288+0.432+0.216=0.936也可以是P(x1)=1P(0)=10.064=0.936,二项分布的特征,二项分布的图形特征 接近0.5时,图形是对称的;图5-1 离0.5愈远,对称性愈差,但随着n的增大,分布趋于对称。图5-2 当n时,只要不太靠近0或1,当nP和n(1P)都大于5时,二项分布近似于正态分布。二项分布图形取决于与n,高峰=n处,二项分布,图5-1=0.5时,不同n值对应的二项分布,二项分布,图5-2=0.3时,不同n值对应的二项分布,二项分布的均数和标准差
4、 总体均数:方差:标准差:,如果将出现阳性结果的频率记为总体均数:标准差:,例5-4 研究者随机抽查某地150人,其中有10人感染了钩虫,钩虫感染率为6.7%,求此率的抽样误差。,二项分布的应用(一)概率估计 例5-5 如果某地钩虫感染率为13%,随机观察当地150人,其中有10人感染钩虫的概率有多大?从n=150,=0.13的二项分布,由公式(5-1)和(5-2),可以得出150人中有10人感染钩虫的概率为,(二)单侧累积概率计算二项分布出现阳性的次数至多为k次的概率为出现阳性的次数至少为k次的概率为,例5-6 例5-5中某地钩虫感染率为13%,随机抽查当地150人,其中至多有2名感染钩虫的
5、概率有多大?至少有2名感染钩虫的概率有多大?至少有20名感染钩虫的概率有多大?,根据公式(5-10)至多有2名感染钩虫的概率为,至少有2名感染钩虫的概率为,至少有20名感染钩虫的概率为,研究非遗传性疾病的家族集聚性 非遗传性疾病的家族集聚性(clustering in families),系指该种疾病的发生在家族成员间是否有传染性?如果没有传染性,即该种疾病无家族集聚性,家族成员患病应是独立的。此时以家族为样本,在n个成员中,出现X个成员患病的概率分布呈二项分布;否则,便不服从二项分布。,例5-7 某研究者为研究某种非遗传性疾病的家族集聚性,对一社区82户3口人的家庭进行了该种疾病患病情况调查
6、,所得数据资料见表5-1中的第(1)、(2)栏。试分析其家族集聚性。,如果该社区的此种疾病存在家族集聚性,则以每户3口人的家庭为样本,在3个家庭成员中,出现X(=0,1,2,3)个成员患病的概率分布即不服从二项分布。为此,可作如下假设检验。H0:该疾病的发生无家族集聚性H1:该疾病的发生有家族集聚性=0.10,本例调查的总人数为:N=823=246(人)其中患病人数为:D=026+110+228+318=120(人)以这246人的患病率估计总体的患病率,即=D/N=120/246=0.49。,在n=3、=0.49时,利用二项分布,求得X=0,1,2,3的概率P(X),并以此得到相应的理论户数。
7、对理论户数与实际户数进行拟合优度(goodness of fit)的检验。此时,自由度为=组数2=42=2。计算结果列于表6-1中的第(3)至(7)栏。,Poisson分布,一、概念 Poisson分布也是一种离散型分布,用以描述罕见事件发生次数的概率分布。医学上人群中出生缺陷、多胞胎、染色体异常等事件等都是罕见的,可能发生这些事件的观察例数n常常很大,但实际上发生类似事件的数目却很小很小。,Poisson分布可以看作是发生的概率(或未发生的概率1)很小,而观察例数n很大时的二项分布。除二项分布的三个基本条以外,Poisson分布还要求或(1)接近于0或1(例如0.999)。,Poisson分
8、布的特征Poisson分布的概率函数为 式中,为Poisson分布的总体均数,X为观察单位内某稀有事件的发生次数;e为自然对数的底,为常数,约等于2.71828。,(三)Poisson分布的图形不同的参数 对应不同的Poisson分布,即 的大小决定了Poisson分布的图形特征,见图5-3。当 越小,分布就越偏态;当 越大时,Poisson分布则越渐近正态分布。当 1时,随X取值的变大,P(X)值反而变小;当 1 时,随X取值的变大,P(X)值先增大而后变小。如若 是整数,则P(X)在X=和X=-1位置取得最大值。,图5-3 取不同值时的Poisson分布图,由图5-3可以看到Poisson
9、分布当总体均数值小于5时为偏峰,愈小分布愈偏,随着增大,分布趋向对称。Poisson分布有以下特性:(1)Poisson分布的总体均数与总体方差相等,均为(2)Poisson分布的观察结果有可加性 即对于服从Poisson分布的m个互相独立的随机变量X1,X2,Xm,它们之和也服从Poisson分布,且其均数为这m个随机变量的均数之和。,Poisson分布的应用(一)概率估计例5-7 如果某地新生儿先天性心脏病的发病概率为8,那么该地120名新生儿中有4人患先天性心脏病的概率有多大?=n=1200.008=0.96,(二)单侧累计概率计算如果稀有事件发生次数的总体均数为,那么该稀有事件发生次数至多为k次的概率 发生次数至少为k次的概率,例5-8 例5-7中,至多有4人患先天性心脏病的概率有多大?至少有人患先天性心脏病的概率有多大?至多有4人患先天性心脏病的概率至少有人患先天性心脏病的概率为,例5-9 实验显示某100cm2的培养皿平均菌落数为6个,试估计该培养皿菌落数小于3个的概率,大于1个的概率。该培养皿菌落数小于3个的概率 菌落数大于1个的概率为,正态分布、二项分布和Poisson分布的关系,正态分布,二项分布,Poisson分布,发生的概率很小,而观察例数n很大,n和n(1-)均大于5,20,