《第二部分离散型概率分布课件.ppt》由会员分享,可在线阅读,更多相关《第二部分离散型概率分布课件.ppt(51页珍藏版)》请在三一办公上搜索。
1、高级社会统计学,闵学勤 ,第二部分 离散型概率分布,第一节 二项分布一、二项分布的定义 二项分布是一种具有广泛用途的离散型随机变量的概率分布,也叫贝努里分布。 二项分布的具体定义是:设有n次试验,各次试验是彼此独立的,每次试验某事件出现的概率都是p,某事件不出现的概率都是q(等于1-P),则对于某事件出现X次(0,1,2, n)的概率分布为:,第二部分 离散型概率分布,第一节 二项分布二、二项分布的讨论1、二项分布为离散型分布。当独立试验次数为n时,二项分布共有n+1个取值。除了用分布律表示二项分布外,还可用折线图来表示。P117,第二部分 离散型概率分布,第一节 二项分布二、二项分布的讨论,
2、第二部分 离散型概率分布,第一节 二项分布二、二项分布的讨论2、n和p是二项分布的两个参数。q值永远等于1-p。因此二项分布三个参数:n,p,q实际只要知道n和p两个参数就够了。3、二项分布的图形当 时是对称的。当时是非对称的,而当n愈大时非对称性愈不明显。,第二部分 离散型概率分布,第一节 二项分布二、二项分布的讨论4、二项分布的数学期望 ,变异数5、二项分布的概率值,除了根据公式直接进行计算外,还可利用查表求得。(P473,附表2),第二部分 离散型概率分布,第一节 二项分布三、二项分布的概率1、事件至多出现m次的概率为:2、事件至少出现m次的概率为:,第二部分 离散型概率分布,第一节 二
3、项分布三、二项分布的概率3、事件出现次数不少于a,不大于b的概率为:4、根据事件的完备性,必然有:,第二部分 离散型概率分布,第一节 二项分布例1,根据生命表,年龄为60岁的人,可望活到下年的概率为p=0.95。设某单位年龄为60岁的人共有十人。问:1)其中有九人活到下年的概率为多少;2)至少有九人活到下年的概率是多少?解:1)根据二项分布,其中有九人活到下年的概率为:2)至少有九人活到下年的概率为:,第二部分 离散型概率分布,第一节 二项分布习题1: 某社区老年人口的比例为10%,设随机抽查六位居民。问:1)其中有两名为老年人的概率是多少?2)至少有两名为老年人的概率是多少?答案:1)0.0
4、98; 2)0.114,第二部分 离散型概率分布,第一节 二项分布习题2: 某地区回族占全体居民人数的6%,今随机抽取十名,问其中恰有两名是回族的概率是多少答案:0.099,第二部分 离散型概率分布,第二节 超几何分布 在社会抽样调查中,只有在大群体的情况下,二项分布的独立试验要求才能近似地得到满足(二项分布要求每次试验彼此独立)。 如果研究对象是小群体,那么每次试验之间独立的可能性较小,也即不满足二项分布的独立试验条件。而超几何分布就适用于小群体研究。,第二部分 离散型概率分布,第二节 超几何分布例:设小组共有成员十名,其中男性共七名,现从中任抽三名,问其中男性人数的概率分布如何?解:根据题
5、意有:总数N=10人,男性人数M=7人, 女性人数F=3人任抽三名中含男性人数共有四种情况:X=0(0男;3女) X=1(1男;2女)X=2(2男;1女) X=3(3男;0女),第二部分 离散型概率分布,第二节 超几何分布(续)由古典法可求得,第二部分 离散型概率分布,第二节 超几何分布(续)合并起来,任抽三人男性人数的概率分布为:,第二部分 离散型概率分布,第二节 超几何分布一、超几何分布的定义 对小群体而言,总体性共分两类:A类与非A类。总体总数为N,A类共有M个。设从中任抽n个 ,则n中含有A类个数X的概率分布为:,第二部分 离散型概率分布,第二节 超几何分布一、超几何分布的定义例:某班
6、共有学员三十名,其中音乐爱好者有十三名,问任抽五名,其中音乐爱好者人数的概率分布。解:设X=“抽样中音乐爱好者的人数”,根据题意,代入超几何分布公式:,第二部分 离散型概率分布,第二节 超几何分布二、超几何分布的数学期望与方差如果 ,则,第二部分 离散型概率分布,第二节 超几何分布三、超几何分布与二项分布的关系 超几何分布适合小群体研究,但如果群体规模逐渐增大,以致抽样个体间的概率改变可以忽略不计,这时也可采用二项分布来讨论。且两种分布计算的结果应该是逐渐接近。即:,第二部分 离散型概率分布,第二节 超几何分布三、超几何分布与二项分布的关系例:某班共有学员三十名,其中音乐爱好者有十三名,问任抽
7、五名,其中音乐爱好者有两人的概率。(分别用二项分布和超几何分布计算)解:,第二部分 离散型概率分布,第二节 超几何分布习题: 某公司共有四十名员工,其中女性十名。今任抽五名进行访问,问被访中至少有四名女性的概率是多少?解:,第二部分 离散型概率分布,第三节 泊松分布(Poisson distribution) 在二项分布 中,如果n值很大,且p又很小,那么运算就相当麻烦,因此有必要研究当n很大时,二项分布的极限分布是什么。 当n很大,且p又极小,设,第二部分 离散型概率分布,第三节 泊松分布(Poisson distribution)一、泊松分布的公式 泊松分布是二项分布的极限分布,但它只有一
8、个参数 ,只要知道了 值,泊松分布就被确定了。,第二部分 离散型概率分布,第三节 泊松分布(Poisson distribution)二、泊松分布的性质1、泊松分布为离散型随机变量的概率分布。它的取值x为零和一切正整数值。2、泊松分布的数学期望和方差都为 ,特别是参数 就是数学期望这一点,常作为经验性的确定泊松分布参数 的方法。,第二部分 离散型概率分布,第三节 泊松分布(Poisson distribution)二、泊松分布的性质例:设在填写居民证1000张卡片中共发现错字300个。问每张居民证出现错字数的概率分布如何?解:设X=“每张居民证出现错字数”,将参数 近似地认为是每张平均的错字数
9、,即代入泊松公布公式就可算出X=0,1,2,的概率分布,第二部分 离散型概率分布,第三节 泊松分布(Poisson distribution)二、泊松分布的性质(续)也可查泊松分布表(P477,附表3)P(X=0)=0.7408P(X=1)=0.2222P(X=2)=0.0333P(X=3)=0.0033P(X=4)=0.0002P(X=5)=0.0000,第二部分 离散型概率分布,第三节 泊松分布(Poisson distribution)二、泊松分布的性质3、泊松分布图形是非对称的,但随着 的增加,图形将变得接近对称。(详见P134,图4.5)4、虽然泊松分布是二项分布的极限分布,但当 ,
10、 时,泊松分布与二项分布的近似程度就很好,即,,第二部分 离散型概率分布,第三节 泊松分布(Poisson distribution)二、泊松分布的性质例,某地区,每年平均每2000所房子有1所毁于火灾,如果在这个地区有3600所房子,在一年时间内恰好有5所房子毁于火灾的概率是多少?解:,第二部分 离散型概率分布,第三节 泊松分布(Poisson distribution)二、泊松分布的性质5、在下列情况下,泊松分布也可近似替代超几何分布: 即:泊松分布有现成的附表可查,故比较方便。,第二部分 离散型概率分布,第三节 泊松分布(Poisson distribution)二、泊松分布的性质例,设
11、某校有1000名大学生,其中有外国留学生10名,现从该校大学生中任抽20人,求刚好抽到1名外国留学生的概率。解:,第二部分 离散型概率分布,第三节 泊松分布(Poisson distribution)二、泊松分布的性质6、泊松分布适合稀少事件的研究,也就是适合p值都是很小的情况。在社会研究中,包括像交通事故流、自杀流等都属于稀少事件。经典案例:P136,例16,第三部分 连续型概率分布,一、正态分布(Normal distribution) 如果说二项分布是离散型随机变量最具典型意义的概率分布,那么连续型随机变量最具典型意义的概率分布就是正态分布了。18世纪,正态分布(又称常态分布或高斯分布)
12、由德国数学家高斯在研究误差理论时发现。,第三部分 连续型概率分布,一、正态分布 在现实生活中,如人的身高、体重、一片森林的高度、学生成绩、人的智商、测量的误差、甚至公共入口门槛的磨损、海浪的高度等等随机变量,都服从正态分布。正态分布除了在现实生活中大量存在外,还由于任何变量,不管其原有分布如何,如果把它们n个加在一起,当n大于一定数之后,例如大于30,那么其和的分布必然接近正态分布。这就是有名的中心极限定理。,第三部分 连续型概率分布,一、正态分布 可以说,在各种分布中,正态分布居于首要的地位。这是因为:1,许多自然现象与社会现象,都可用正态分布加以叙述;2,不少离散型随机变量与连续型随机变量
13、的概率分布都以正态分布为其极限分布(即当样本相当大时,可用正态分布近似);3,许多统计量的抽样分布呈正态分布,故参数估计与假设检验经常都以正态分布为理论基础。,第三部分 连续型概率分布,一、正态分布例,以下是一百人初婚年龄的统计:,第三部分 连续型概率分布,一、正态分布,如果组越分越细,并且纵轴采用频率密度(频率/组距),直方图就转化为概率密度曲线,第三部分 连续型概率分布,一、正态分布(一)正态分布的特征1,一个高峰: 曲线是单峰,有一个最高点;2,一个对称轴:曲线在高峰处有一个对称轴,在轴的左右两边是对称的。对称轴是3,一个渐近线。曲线无论向左或向右延伸,都愈来愈接近横轴,但不会与横轴相交
14、,以横轴为渐近线。4,由于正态曲线是单峰对称的,因此它的众值、中位值和均值三者必然是重叠的。,第三部分 连续型概率分布,一、正态分布(二)正态分布的概率密度表达式 从正态分布的数学表达式可看出, 和 是正态分布曲线的两个参数。,第三部分 连续型概率分布,一、正态分布(二)正态分布的概率密度表达式两个参数对正态分布曲线的影响:1, 在 处达到峰值,在处有拐点,且以直线 为对称。在 一定情况下,若 增大,图形右移, 减小,则图形左移。2,当 不变的情况下, 越小,则对应的图形越尖瘦。事实上, 即为正态分布曲线的数学期望或总体均值,而 是其标准差。,第三部分 连续型概率分布,一、正态分布(三)正态曲
15、线下的面积 为了形象的理解正态曲线下面积所代表的涵义。我们可以把正态曲线看做是一种极限的直方图,而正态曲线下的面积实际就是无数个小直方形拼接而成的,即:,第三部分 连续型概率分布,一、正态分布(三)正态曲线下的面积(P144,图5.9)1,变量取值在区间 之间的概率:2,变量取值在区间 之间的概率:3,变量取值在区间 之间的概率:,第三部分 连续型概率分布,一、正态分布(三)正态曲线下的面积,第三部分 连续型概率分布,一、正态分布(四)标准正态分布 在已知正态分布的两个参数的前提下,可通过积分计算两点间的概率(面积),太麻烦,为此须计算出现成的表供使用者查找。但由于正态分布随两个参数的变化而变
16、化,故先将变量值标准化: Z称作x的标准分,第三部分 连续型概率分布,一、正态分布(四)标准正态分布 根据Z值所得的分布称为标准正态分布,它的概率密度为:而如果用 代入,第三部分 连续型概率分布,一、正态分布(四)标准正态分布 所以标准正态分布 可看作一般正态分布的一个特例,即 的正态分布,记作 ,而一般正态分布记作 标准正态分布(附表4)的对应式:,第三部分 连续型概率分布,一、正态分布(四)标准正态分布例,如果 服从标准正态分布N(0,1),求答:,第三部分 连续型概率分布,一、正态分布(四)标准正态分布例,已知 ,1)求 答:2)求 答:3)求 答:4)求 答:,第三部分 连续型概率分布,一、正态分布(四)标准正态分布例,如果 ,求满足解:,第三部分 连续型概率分布,一、正态分布(四)标准正态分布例,设随机变量服从正态分布 ,试求解:,第三部分 连续型概率分布,一、正态分布(四)标准正态分布例,根据统计,北京市初婚年龄服从正态分布。其均值为25岁,标准差为5岁,问25岁到30岁之间结婚的人,其百分数是多少?解:,第三部分 连续型概率分布,习题:1、答案:0.0139,0.72622、答案:1.65;1.96;2.58,