方积乾卫生统计学第四章 常用概率分布双语.ppt

上传人:sccc 文档编号:6614438 上传时间:2023-11-18 格式:PPT 页数:53 大小:3.41MB
返回 下载 相关 举报
方积乾卫生统计学第四章 常用概率分布双语.ppt_第1页
第1页 / 共53页
方积乾卫生统计学第四章 常用概率分布双语.ppt_第2页
第2页 / 共53页
方积乾卫生统计学第四章 常用概率分布双语.ppt_第3页
第3页 / 共53页
方积乾卫生统计学第四章 常用概率分布双语.ppt_第4页
第4页 / 共53页
方积乾卫生统计学第四章 常用概率分布双语.ppt_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《方积乾卫生统计学第四章 常用概率分布双语.ppt》由会员分享,可在线阅读,更多相关《方积乾卫生统计学第四章 常用概率分布双语.ppt(53页珍藏版)》请在三一办公上搜索。

1、,Chapter 4 Probability Distributions常用概率分布,Binomial Distribution 二项分布,1.1 Concept and feature(概念与特征)例4-2 临床上用针灸治疗某型头痛,有效的概率为60%,现以该法治疗3例,其中0例有效的概率是多大?1例有效的概率是多大?2例有效的概率是多大?3例有效的概率是多大?,Urn Model 瓮模型,一个袋子里有5个乒乓球,其中2个黄球,3个白球,我们进行摸球游戏,每次摸1球,然后放回再摸。先后摸100次,请问摸到零次黄球的概率有多大?(1)每次摸到白球的概率=0.6(2)第1次摸到白球的概率=0.6

2、 第2次摸到白球的概率=0.6 第100次摸到白球的概率=0.6(3)100次摸到零次黄球的概率=(0.6)(0.6)(0.6)=(0.6)100,Urn Model,先后100次,摸到3次黄球的概率有多大?(1)每次摸到黄球的概率=0.4(2)黄黄黄白白白白白白白 概率=(0.4)3(0.6)97 黄白黄黄白白白白白白 概率=(0.4)3(0.6)97 黄白黄白黄白白白白白 概率=(0.4)3(0.6)97(3)100次摸到3次黄球的概率=(0.4)3(0.6)97+(0.4)3(0.6)97+=(0.4)3(0.6)97 先后100次,摸到x次黄球的概率=,n times,result i

3、n x events,Binary(二分类):每次摸球只有二种可能的结果,或黄球或白球;Independent(独立):各次摸球是彼此独立的;Repeat(重复):每次摸到黄球或白球的概率是 和 1-先后 n 次,摸到x 次黄球的概率=,一般地,若随机变量取值 x 的概率为其中,则称此随机变量服从二项分布。称为二项分布的概率函数。二分类、独立、重复试验,若每次出现某事物的概率为,则 n 次中有X 次出现该事物的概率服从二项分布。,Binomial Distribution,Newtons Binomial Expansion,The general term of the Binomial E

4、xpansion:,例4-2 临床上用针灸治疗某型头痛,有效的概率为60%,现以该法治疗3例,其中2例有效的概率是多大?2例以上有效的概率是多大?3例都无效的概率是多大?,图4-1=0.5时,不同n值对应的二项分布,图4-2=0.3时,不同n值对应的二项分布,1.2 Features of Binomial Distribution,1.2.1Plots of Binomial distribution B(n,)取决于 与 n均数在=n 处 接近0.5时,图形是对称的;离0.5愈远,对称性愈差 随着n的增大,分布趋于对称n时,只要 不太靠近0或1,二项分布近似于正态分布(n 和 n(1)都大

5、于5时),1.2.Mean and standard deviation of B(n,)出现阳性结果的次数 X 总体均数 总体方差 总体标准差 出现阳性结果的频率 总体均数 总体标准差,1.2.1 Estimation of the probability例4-5 如果某地钩虫感染率为13%,随机观察当地150人,其中有10人感染钩虫的概率有多大?分析:二分类(感染、不感染)独立(假定互不影响)重复(n=150人),每人钩虫感染率均为(=13%)感染钩虫的人数X 服从二项分布 B(150,0.13),1.2 Application of Binomial Distribution,单侧累积概

6、率计算单纯计算二项分布X 恰好取某值的概率没有太大意义经常需要计算的是二项分布的累积概率,例4-6 某地钩虫感染率为13%,随机抽查当地150人,其中至多有2名感染钩虫的概率有多大?,至少有20名感染钩虫的概率有多大?,2.Poisson distribution泊松分布,2.1 Concept of PoissonPoisson distribution:描述罕见事件发生次数的概率分布。例:出生缺陷、多胞胎、染色体异常、癌症患病数或死亡数的分布。Poisson distribution可以看作是二项分布的特例:独立、重复的次数n很大很大 每次出现某事件的概率 很小(或未出现某事件的概率1 很

7、小),可以证明,当,时,定义:若随机变量X的的概率函数为则称此变量服从Poisson分布,记为,其中参数 是总体均数。,例:1毫升水样品中大肠杆菌数目X的分布.,将1毫升水等分为n 个微小体积,这里n 很大;每一个微小体积中大肠杆菌是否出现,互相独立;每一个微小体积中大肠杆菌出现的概率都是,且 很小每毫升水中大肠杆菌数目的分布服从Poisson分布,例:放射性物质一定时间内放射出质点数的分布,时间“n 很大、独立、概率都是 且很小”的二项分布-Poisson分布,若每次观察互不独立、发生概率不等,则不能看作Poisson分布!,观察结果不独立:例如,传染性疾病首例出现后便成为传染源,会增加后续

8、病例出现的概率;又如,污染的牛奶中细菌成集落存在、钉螺在繁殖期一窝一窝地散布等等这些现象均不能用Poisson分布处理。,2.2 Plot and feature,图4-3 取不同值时的Poisson分布图,Properties of Poisson distribution:(1)总体均数=总体方差=(2)观察结果有可加性If X1 and X2 are independent each other,then,例:从同一水源独立地取水样5次,进行细菌培养。,第一次水样中的菌落数 X1(1)第二次水样中的菌落数 X2(2).第五次水样中的菌落数 X5(5)把5份水样混合,合计菌落数也服从Poi

9、sson分布 X1+X2+X5(1+2+5)医学研究中常利用其可加性,将小的观察单位合并,来增大发生次数X,以便用后面讲到的正态近似法作统计推断。,2.3 Application of Poisson distribution,2.3.1 Estimation of the probability例4-8 如果某地居民脑血管疾病的患病率为150/10万,那么,该地1000名居民中,2人患脑血管疾病的概率多大?=150/10万,n=1000,则患病人数X服从二项分布。因为150/10万较小,n=1000较大,将1000名居民看作是一个观察单位,平均有1000150/10万1.5个患者。可以认为1

10、000名居民中患脑血管疾病的人数近似地服从Poisson分布,=n=10000.0015=1.5,2.3.2 Calculation of cumulative probability 与二项分布问题相同,Poisson分布也经常需要计算累积概率。稀有事件发生次数至多为k次的概率为发生次数至少为k次的概率为,例4-9 实验显示某100cm2的培养皿平均菌落数为6个,试估计该培养皿菌落数小于3个的概率;大于1个的概率。,该培养皿菌落数小于3个的概率为菌落数大于1个的概率为,3.Normal Distribution正态分布,3.1 Concept of Normal distribution正态

11、分布是自然界最常见的一种分布 测量的误差、人体的尺寸、许多生化指标等等都近似服从正态分布。许多其它分布可用正态分布近似共同点:变量的数值,中间多,两边渐少,近似对称。,图4-4 体模“骨密度”测量值的分布-接近正态分布(频率密度=频率/组距)正态分布概率密度函数,频率密度,1,2,3,正态概率密度曲线的位置与形状具有如下特点:(1)关于X=对称。(2)钟形曲线,X=处最大值 处有拐点(3)曲线下面积为1。(4)决定曲线在横轴上的位置(5)决定曲线的形状 N(,2)表示均数为、标准差为 的正态分布。,图4-6 正态分布曲线下的面积分布,若X服从正态分布 N(,2),可作如下的标准化变换(称Z变换

12、)则Z服从正态分布 N(0,1),称为标准正态分布统计学家编制了标准正态分布曲线下面积表(附表1)。,标准正态分布 N(0,1)(standard normal distribution),例4-11 某地1986年120名8岁男孩身高 均数=123.02cm,标准差=4.79cm试估计(1)该地8岁男孩身高在130cm以上者占该地8岁男孩总数的百分比;(2)身高在120cm128cm者占该地8岁男孩总数的百分比;(3)该地80%的男孩身高集中在哪个范围?,(1)计算130对应的Z值后查表,(2)身高在120cm128cm者的百分比:先计算120 和128所对应的Z值:120 对应的Z值为 1

13、28对应的Z值为 正态曲线下区间(-0.63,1.04)上的面积等于(3)80%的8岁男孩身高集中在哪个范围?标准正态分布曲线下左侧面积为0.10所对应的Z值为-1.28,所以80%的8岁男孩身高集中在,3.3 Additive property,不论 X1和X2是否独立,X1+X2 仍服从正态分布当X1和X2独立时,3.4 Application of Normal distribution,3.4.1 Determine the reference ranges(参考值范围)特定的“正常”人群中大多数个体的取值范围。“大多数个体”:习惯上指95%的个体1.若变量服从正态分布 正态分布变量X

14、在区间 上取值的概率为0.95,例4-12 调查某地120名健康女性血红蛋白,直方图显示,其分布近似于正态分布,试估计该地健康女性血红蛋白的95%参考值范围。,双侧95%参考值范围:,2.若变量不服从正态分布 找出 和 双侧95%参考值范围:,0.025,0.025,P2.5,P97.5,必须注意:1)医学参考值范围在临床上只能作为参考,不 能作为诊断标准。2)确定医学参考值范围必须抽取足够例数的样 本。3)若测定值在性别间或年龄组间差别明显,应 分“层”确定参考值范围。,3.4.2 Control chart(控制图)质量控制的一种重要工具 基本原理:如果某一波动仅仅由个体差异或随机测量误差

15、所致,那么观察结果服从正态分布。例4-13 骨密度测量的质量控制。通常在每天开机后首先对固定在机器内的“体模”进行测量,将每天的“体模”测定值点在控制图上:,一旦出现8种情形之一,说明仪器需要调整:,(1)有一个点距中心线的距离超过3个标准差(位于控制限以外)。(2)在中心线的一侧连续有9个点。(3)连续6个点稳定地增加或减少。(4)连续14个点交替上下。(5)连续3个点中有两个点距中心线距离超过2个标准差。(6)连续5个点中有4个点距中心线距离超过1个标准差。(7)中心线一侧或两侧连续15个点距中心线距离都在1个标准差以内。(8)中心线一侧或两侧连续8个点距中心线距离都超出1个标准差范围。,

16、1,2,6,3,7,8,4,有一个点距中心线的距离超过3个标准差 5.连续3个点中有两个点距中心线距离超过2个标准差,2.在中心线的一侧连续有9个点。6.连续5个点中有4个点距中心线距离超 过1个标准差,3.连续6个点稳定地增加或减少;7.中心线一侧或两侧连续15个点距中心线距 离都在1个标准差以内。,4.连续14个点交替上下;8.中心线一侧或两侧连续8个点距中心线距离都超出1个标准差范。,5,3.4.3*Normal approximation of Binomial distribution and Poisson distribution,当n 和 n(1-)都大于5时,二项分布近似于正

17、态分布,例4-14 某地钩虫感染率为13%,如果随机抽查当地150人,至少有20人感染钩虫的概率有多大?,至少有20人感染钩虫的概率为50%。,当 20 时,Poisson分布近似于正态分布 N(,),例4-15 实验显示某放射性物质半小时内发出的脉冲数服从Poisson分布,平均为360个,试估计该放射性物质半小时内发出的脉冲数大于400个的概率。,Summary,Discrete variable:Binomial distribution Poisson distribution Continuous variable:Normal distribution1.Binomial dist

18、ribution Possible values:0,1 Probability of positive event in one trial=,Probability of negative event in one trial=1,Independently repeat n times Total number of positive event2.Poisson distribution When or(1)is very small,n very large,thebinomial distribution approximates to Poisson distribution.,

19、3.Normal distribution-very important Many phenomena follow normal distributions;Important basis of statistical theory.Two parameters:Mean Standard deviation Z-transformationArea under the curve of normal distribution,4.Normal approximation When n is large(both of n and n(1-)5),approximates to When is large(20),approximates to,Thanks,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号