《概率论及数理统计大数定律与中心极限定.ppt》由会员分享,可在线阅读,更多相关《概率论及数理统计大数定律与中心极限定.ppt(51页珍藏版)》请在三一办公上搜索。
1、第五章极 限 定 理 初 步,概率论与数理统计是研究随机现象统计规律性的学科.随机现象的规律性只有在相同的条件下进行大量重复试验时才会呈现出来.也就是说,要从随机现象中去寻求必然的法则,应该研究大量随机现象.,研究大量的随机现象,常常采用极限形式,由此导致对极限定理进行研究.极限定理的内容很广泛,其中最重要的有两种:,下面我们先介绍大数定律,大 数 定 律,第一节,大量的随机现象中平均结果的稳定性,大数定律的客观背景,大量抛掷硬币正面出现频率,字母使用频率,生产过程中的废品率,设X1,X2,是独立同分布的随机变量序列,且E(Xi)=,D(Xi)=,i=1,2,其中方差有共同的上界,则对任给 0
2、,作为切比雪夫大数定律的特殊情况,有下面的定理.,定理(独立同分布下的大数定律),切比雪夫,设Xn为随机变量序列,X为随机变量,若任给0,使得,则称Xn依概率收敛于X.可记为,依概率收敛,a,证明:由切比雪夫不等式,这里,故,切比雪夫大数定律给出了平均值稳定性的科学描述,下面给出的贝努里大数定律,是上述定理的一种特例.,贝努里,设Sn是n重贝努里试验中事件A发生的次数,p是事件A发生的概率,,引入,i=1,2,n,则,是事件A发生的频率,于是有下面的定理:,设Sn是n重贝努里试验中事件A发生的 次数,p是事件A发生的概率,则对任给的 0,,定理5.1.1(贝努里大数定律),或,贝努里,贝努里大
3、数定律提供了通过试验来确定事件概率的方法.,任给0,,贝努利大数定律表明:当重复试验次数n充分大时,事件A发生的频率Sn/n几乎等于事件A的概率p。因此可用事件发生的频率作为相应概率的估计。,蒲丰投针问题中解法的理论依据就是大数定律,当投针次数n很大时,用针与线相交的频率m/n近似针与线相交的概率p,从而求得的近似值.,针长L,线距a,下面给出的独立同分布下的大数定律,不要求随机变量的方差存在.,设随机变量序列X1,X2,独立同分布,具有有限的数学期望E(Xi)=,i=1,2,,则对任给 0,,定理5.1.2(辛钦大数定律),辛钦,辛钦大数定律为寻找随机变量的期望值提供了一条实际可行的途径.,
4、例如要估计某地区的平均亩产量,只要收割某些有代表性的地块,例如n 块.计算其平均亩产量,则当n 较大时,可用它作为整个地区平均亩产量的一个估计.,大数定律以严格的数学形式表达了随机现象最根本的性质之一:,它是随机现象统计规律的具体表现.,大数定律在理论和实际中都有广泛的应用.,平均结果的稳定性,第 二 节,中 心 极 限 定 理,中心极限定理的客观背景,在实际问题中,常常需要考虑许多随机因素所产生总影响.,例如:炮弹射击的落点与目标的偏差,就受着许多随机因素的影响.,空气阻力所产生的误差,,对我们来说重要的是这些随机因素的总影响.,如瞄准时的误差,,炮弹或炮身结构所引起的误差等等.,观察表明,
5、如果一个量是由大量相互独立的随机因素的影响所造成,而每一个别因素在总影响中所起的作用不大.则这种量一般都服从或近似服从正态分布.,自从高斯指出测量误差服从正态分布之后,人们发现,正态分布在自然界中极为常见.,现在我们就来研究独立随机变量之和所特有的规律性问题.,当n无限增大时,这个和的极限分布是什么呢?,在什么条件下极限分布会是正态的呢?,由于无穷个随机变量之和可能趋于,故我们不研究n个随机变量之和本身而考虑它的标准化的随机变量,的分布函数的极限.,可见n越大越接近正态分布。,在概率论中,习惯于把和的分布收敛于正态分布这一类定理都叫做中心极限定理.,我们只讨论几种简单情形.,下面给出的独立同分
6、布随机变量序列的中心极限定理,也称列维一林德伯格(LevyLindberg)定理.,定理5.2.1(独立同分布下的中心极限定理),它表明,当n充分大时,n个具有期望和方差的独立同分布的r.v之和近似服从正态分布.,设X1,X2,是独立同分布的随机变量序列,且E(Xi)=,D(Xi)=,i=1,2,,则,N(0,1),例1 根据以往经验,某种电器元件的寿命服从均值为100小时的指数分布.现随机地取16只,设它们的寿命是相互独立的.求这16只元件的寿命的总和大于1920小时的概率.,由题给条件知,诸Xi独立,,16只元件的寿命的总和为,分析:设第i只元件的寿命为Xi,i=1,2,16,E(Xi)=
7、100,D(Xi)=10000,依题意,所求为P(Y1920),由题给条件知,诸Xi独立,16只元件的寿命的总和为,解:设第i只元件的寿命为Xi,i=1,2,16,E(Xi)=100,D(Xi)=10000,依题意,所求为P(Y1920),由于E(Y)=1600,D(Y)=160000,=1-(0.8),=1-0.7881=0.2119,=1-,P(Y1920)=1-P(Y1920),虽然在一般情况下,我们很难求出X1+X2+Xn 的分布的确切形式,但当n很大时,可以求出近似分布.,德莫佛拉普拉斯定理(二项分布的正态近似)是上述定理的特殊 情况.,(德莫佛拉普拉斯定理),设随机变量 服从参数n
8、,p(0p1)的二项分布,则对任意x,有,定理表明,当n很大,0p1是一个定值时(或者说,np(1-p)也不太小时),二项变量 的分布近似正态分布 N(np,np(1-p).,例2.(供电问题)某车间有200台车床,在生产期间由于需要检修、调换刀具、变换位置及调换工件等常需停车.设开工率为0.6,并设每台车床的工作是独立的,且在开工时需电力1千瓦.,问应供应多少瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产?,用X表示在某时刻工作着的车床数,,依题意,,XB(200,0.6),求满足,设需N台车床工作,,(由于每台车床在开工时需电力1千瓦,N台工作所需电力即N千瓦.),解:,由
9、德莫佛-拉普拉斯极限定理,近似N(0,1),于是 P(XN)=P(0XN),这里 np=120,np(1-p)=48,由3准则,此项为0。,查正态分布函数表得,由 0.999,,从中解得N141.5,即所求N=142.,也就是说,应供应142 千瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产.,3.1,故,例3 在一个罐子中,装有10个编号为0-9的同样的球,从罐中有放回地抽取若干次,每次抽一个,并记下号码.,问对序列Xk,能否应用大数定律?,诸Xk 独立同分布,且期望存在,故能使用大数定律.,解:,(1)设,,k=1,2,即对任意的0,(2)至少应取球多少次才能使“0”出现的
10、频率在0.09-0.11之间的概率至少是0.95?,解:设应取球n次,0出现频率为,由中心极限定理,近似N(0,1),近似N(0,1),欲使,即,查表得,从中解得,即至少应取球3458次才能使“0”出现的频率在0.09-0.11之间的概率至少是0.95.,若用切比雪夫不等式估计呢?,即至少应取球18000次才能使“0”出现的频率在0.09-0.11之间的概率至少是0.95.,(3)用中心极限定理计算在100次抽取中,数码“0”出现次数在7和13之间的概率.,解:在100次抽取中,数码“0”出现次数为,由中心极限定理,近似N(0,1),E(Xk)=0.1,D(Xk)=0.09,即在100次抽取中
11、,数码“0”出现次数在7和13之间的概率为0.6826.,=0.6826,近似N(0,1),不知大家是否还记得街头赌博的演示?,现在我们用中心极限定理来揭穿这个赌博中的奥秘.,街头赌博,再看演示请点击,如图,钉板有n=16层,可以求出标准差,n次碰钉后小球的位置Yn近似服从正态分布N(0,n).E(Yn)=0,D(Yn)=n.,根据正态分布的查表计算知道,落在2 以内即中线,左右8颗钉子以内的概率近似为95.6%,如图钉板有n=16层,可以求出标准差,根据正态分布的查表计算知道,落在2 以内即中线左右8颗钉子以内的概率近似为95.6%,即是说,落在这以外的概率只有4%左右.,现在你知道为什么摆
12、摊的人敢于在上面放那么值钱的东西了吧!,在后面的课程中,我们还将经常用到中心极限定理.,中心极限定理是概率论中最著名的结果之一,它不仅提供了计算独立随机变量之和的近似概率的简单方法,而且有助于解释为什么很多自然群体的经验频率呈现出钟形曲线这一值得注意的事实.,练习1.将一颗骰子连掷100次,则点数之和不少于500的概率是多少?,练习2 在一家保险公司里有10000个人参加寿命保险,每人每年付12元保险费。在一年内一个人死亡的概率为0.6%,死亡时其家属可向保险公司领得1000元,问:(1)保险公司亏本的概率有多大?(2)其他条件不变,为使保险公司一年的利润不少于60000元,赔偿金至多可设为多少?,解 设X表示一年内死亡的人数,则XB(n,p),其中n=10000,p=0.6%,设Y表示保险公司一年的利润,Y=1000012-1000X于是由中心极限定理(1)PY0=P1000012-1000X0=1PX1201(7.75)=0;,PY60000=P1000012-aX60000=PX60000/a0.9;,(2)设赔偿金为a元,则令,由中心极限定理,上式等价于,