中心极限定理毕业论文.doc

上传人:仙人指路1688 文档编号:4019859 上传时间:2023-04-01 格式:DOC 页数:44 大小:2.18MB
返回 下载 相关 举报
中心极限定理毕业论文.doc_第1页
第1页 / 共44页
中心极限定理毕业论文.doc_第2页
第2页 / 共44页
中心极限定理毕业论文.doc_第3页
第3页 / 共44页
中心极限定理毕业论文.doc_第4页
第4页 / 共44页
中心极限定理毕业论文.doc_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《中心极限定理毕业论文.doc》由会员分享,可在线阅读,更多相关《中心极限定理毕业论文.doc(44页珍藏版)》请在三一办公上搜索。

1、摘 要本文主要介绍了三种不同场合下的中心极限定理的内容及其详细证明,进而探讨了各定理的适用范围及其在数学分析、概率统计和现实生活中的主要应用,另外讨论了这三种不同场合下的中心极限定理之间的关系.在定理的解释证明及应用方面,给出了三大定理较为详细的解释,并利用MATLAB来实现对中心极限定理的证明;在应用方面,举例说明了中心极限定理在近似计算、抽样推断以及如何利用正态分布近似产生正态随机数等方面的应用.其中,在近似计算中的应用中,主要包括在保险业、商场管理、统计推断及现代科学计算等领域中的应用.关键词: 中心极限定理,正态分布,特征函数,正态随机数,抽样推断,MATLABAbstractIn t

2、he paper, Central limit theorem and its proof in three different aspects are discussed. Whats more, the De Moivre - Laplace theorem, the Lindebery - Levy theorem and the Lyapounov theor opic include five chapters: the first chapter introduces tem and their detailed proofs. Then the topic gives the l

3、imits of every central limit theorem and the applications of mathematical analysis, probability and real life. In addition, it also discussestherelationship betweenthecentral limit theoremunderthree differentoccasions. In the interpretation of these theorems and their applications, it gives the deta

4、iled explanation of 3 big theorems, which makes a full of MATLAB to prove center limit theorem; in application, it gives the central limit theorem in approximate calculation, which mainly includes the insurance business, market management, statistical inference and modern scientific computing applic

5、ations, sampling inference and how to use the normal distribution approximately to produce normal random number.Key words: central limit theorem; normal distribution;Characteristic function;normal random variable;sample infer;MATLAB毕业论文(设计)诚信声明本人声明:所呈交的毕业论文(设计)是在导师指导下进行的研究工作及取得的研究成果,论文中引用他人的文献、数据、图表

6、、资料均已作明确标注,论文中的结论和成果为本人独立完成,真实可靠,不包含他人成果及已获得青岛农业大学或其他教育机构的学位或证书使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。论文(设计)作者签名: 日期: 2013 年 3月 10 日 毕业论文(设计)版权使用授权书本毕业论文(设计)作者同意学校保留并向国家有关部门或机构送交论文(设计)的复印件和电子版,允许论文(设计)被查阅和借阅。本人授权青岛农业大学可以将本毕业论文(设计)全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本毕业论文(设计)。本人离校后发表或使用该

7、毕业论文(设计)或与该论文(设计)直接相关的学术论文或成果时,单位署名为青岛农业大学。论文(设计)作者签名: 日期: 2013 年 3 月 10 日指 导 教 师 签 名: 日期: 年 月 日目 录第1章 引言1第2章 预备知识5第3章 三种不同场合下的中心极限定理53.1 伯努利试验场合及棣莫弗拉普拉斯定理53.2 独立同分布场合及林德贝格勒维定理73.3 独立和的分布函数向正态分布函数收敛92.3.1 林德贝格定理92.3.2 李雅普诺夫定理143.4 三种场合下的中心极限定理的关系15第4章 用MATLAB实现对中心极限定理的模拟证明164.1 数学模型164.2 设计过程174.3 仿

8、真结果17第5章 中心极限定理的应用205.1 用中心极限定理证明较复杂的极限等式215.2 中心极限定理在近似计算中的应用215.2.1中心极限定理在保险业中的应用225.2.2中心极限定理在商场管理中的应用235.2.3中心极限定理在统计推断中的应用275.2.4中心极限定理在现代科学计算中的应用285.3 中心极限定理来近似产生正态随机数295.4 中心极限定理在抽样推断中的应用325.4.1 概率预测325.4.2 估计总体概率的样本容量推断335.4.3 总体容量的推断355.4.4用期望值作估计量的误差推断36第6章 结论37参考文献38第1章 引言 在实际生活中,有许多随机变量是

9、由大量相互独立的随机因素综合形成的,因而它们均可表现为大量的随机变量之和。例如:某城市一小时内的耗电量是由足够多的用户耗电量的总和;发生虫害的某一地区的害虫数是由许多块地区上的害虫数的总和。因此,人们常常将这类由大量独立的随机变量之和的随机变量及其分布规律进行研究。在许多的场合下,随机变量的极限分布均可归结为随机变量之和的极限分布。在随机变量的分布中,正态分布占有特殊重要的地位,人们常把它称为中心分布。诸如人的身高、体重、测量误差、产品的质量等等都是服从正态分布的随机变量。在某些条件下,也有很多不服从正态分布的独立的随机变量,当随机变量的个数达到一定的数量时,它们的和的分布趋于正态分布。例如学

10、生考试成绩的分布、射击命中点与靶心距离的偏差等。经观察表明,如果一个量是由大量相互独立的随机因素的影响所造成,而每一个个别因素在总影响中所起的作用不大,则这种量一般都服从或近似服从正态分布。在概率论中,习惯于把和的分布收敛于正态分布这一类定理都叫做中心极限定理。中心极限定理是大样本统计推断的理论基础,因而在现实生活中具有重要意义。有很多学者对中心极限定理及其应用方面得内容进行了探讨。如文献【1-3】对概率论与数理统计进行的研究,文献【4-6】则系统的对中心极限定理进行的阐述和证明,文献【7-17】则对中心极限定理的应用进行了列举,文献【18-22】是国外学者对中心极限定理的相关探讨,受上述文献

11、的启发,本文主要介绍了三种不同场合下的中心极限定理的内容及其详细证明,进而探讨了各定理的适用范围及其在数学分析、概率统计和现实生活中的主要应用,另外讨论了这三种不同场合下的中心极限定理之间的关系.在定理的解释证明及应用方面,给出了三大定理较为详细的解释,并利用MATLAB来实现对中心极限定理的证明;在应用方面,举例说明了中心极限定理在近似计算、抽样推断以及如何利用正态分布近似产生正态随机数等方面的应用.其中,在近似计算中的应用中,主要包括在保险业、商场管理、统计推断及现代科学计算等领域中的应用. 第2章 预备知识为了方便理解本文的知识,本文添加了相关概念和定理等。定义11 若随机变量的概率密度

12、为,为常数,则称服从参数为,的正态分布,记为。特别地,当,时,成服从标准正态分布。定义21 设是任一随机变量,称,是的特征函数。性质11 在上一致连续,且,。这里表示的共轭。性质21 是非负定的,即对任意的一组及复数,恒有,其中为任意正整数。性质31 设是的特征函数,则的特征函数为。性质 1 设,的特征函数分别为,又,相互独立,则的特征函数为。性质 1 若随机变量的阶阶矩存在,则的特征函数可微分次,且当时,。定理12(唯一性定理)若的特征函数为,则的分布函数在其连续点上的值为。当为连续型随机变量时,其特征函数绝对可积,即,的分布密度为。定理1 设为一随机变量序列,它们相应的分布函数列为,对应的

13、特征函数列为,若收敛于一连续函数,则存在一个分布函数,使其在的连续点上,有,而且就是分布函数的特征函数。第3章 三种不同场合下的中心极限定理定理3.11 设是相互独立的随机变量序列,它们有有限的数学期望和方差,且,令,若对于任意的,都有.则称服从中心极限定理.3.1 伯努利试验场合及棣莫弗拉普拉斯定理定理3.21 设随机变量服从参数为的二项分布,则。证:将看成是由n个相互独立且服从同一个分布的随机变量之和,即,其中的分布律为。由于,由中心极限定理知,。注:设在重伯努利试验中事件恰好发生的次数为,则,其中为事件在每次试验中出现的概率,为事件在每次试验中不出现的概率,则随机变量服从二项分布,记为。

14、这个定理表明,正态分布是二项分布的极限分布.如是次伯努利试验中事件出现的次数,即,当时,有。上式就是棣莫弗拉普拉斯的积分极限定理。定理3.31。由此可得一渐进算式:。证3: 。注:棣莫弗拉普拉斯定理直接用于二项分布的近似计算,它也用于频率与概率误差的计算,这主要体现在:。这类计算一般分为三种情况:(1)已知,求;(2)已知,求;(3)已知,求,在未知时,可利用可得的估计式。3.2 独立同分布场合及林德贝格勒维定理 定理3.41 设为相互独立、同分布的随机变量序列,且有有限的期望和方差,即,则随机变量 的分布函数,对任意的,都有。证1:先考虑标准化随机变量和。设的特征函数为,由特征函数的性质和性

15、质的推论知,的特征函数为:。由于,故由特征函数的性质知,因此的泰勒级数展开式为。从而对任意固定的,有,。显然,为连续函数,由定理知,存在分布函数,使,其中为的分布函数,而为的特征函数。由特征函数的唯一性知,为标准正态变量的分布函数,故的极限分布为标准正态分布,即。注:这个定理说明了,在定理所满足的条件下,当很大时,随机变量近似服从正态分布,或者说,当很大时,独立同分布的随机变量之和近似服从正态分布。当足够大以后,有近似式:。类似的有如下三种情况:(1)求;(2)求最小;(3)在一定概率下的取值范围。3.3 独立和的分布函数向正态分布函数收敛3.3.1 林德贝格定理 定理2.51 设为互相独立的

16、随机变量序列,且满足林德贝格条件,即对任意,有 。 (1)其中,为的分布函数,。则服从中心极限定理,即对任意的实数,有 。 (2)证1:为证此定理,先证下列三个不等式:对任意实数,有 (3) (4) (5)实际上,当时,上面三式明显成立。设,则,则,从而有。利用,可见(1)(2)(3)的两边都是的偶函数,故它们都对成立。令 (6)以、分别表示的特征函数与分布函数,因而, (7), (8)。 (9)在这些记法下,由(5)式知,。故(1)可化为:对任意,有。 (10)而(2)可化为:对一致地有。 (11)如果在条件(10)下,能够证明的特征函数。亦即。 (12)则有特征函数定理可得(11)式成立;

17、于是定理得证。为了证明(12),可分为两步:先证可展开为 。 (13)其中,函数在的任意有限区间上一致地趋于零。实际上,由(8)的前一式知, 。 (14)根据(4)有, 。 (15)其中。由(10),对于一切充分大的,有,从而关于及任何有限区间中的,一致地有,。因而对任意,一致地有 。 (16)特别地,当时,对一切充分大的,下式成立: 。 (17)因此,在中,有展开式 。 (18)其中。由(17)知, 。但由(15)式中的第一个不等式及(9)式有,。故。由(16)可见,当时,关于任意有限区间中的一致地有 。 (19)(2)令,由(14)式得, 。 (20)若能证明:对任意有限区间中一致地有 。

18、 (21)那么以(20)代入(13)并联合(1)中结论,即得证(12),从而定理得以完全证明。下证(21):由(9)知,。对任意的,有。由(4)(5)得, 。由(9)可见:对,有 。 (22)对任意,可选使。又有(10),存在正整数,使对此及有。 (23)于是当时,对一切,有。所以(21)式得证,综上所述,定理得证。3.3.2 李雅普诺夫定理定理2.61 设为互相独立的随机变量序列,记,若存在,使如下条件成立,则对任意的实数,有。证1: 只要验证林德贝格条件满足,由林德贝格定理即可得到结论。由知, 。所以,林德贝格条件满足,定理得证。注:这两个定理仅要求各独立,而不要求同分布,林德贝格条件成立

19、时,即对任意,有。这说明的每一个被加项,当充分大时,有。若记,则近似的认为当充分大时,成立。在上式中,若已知,三者中的两个,就可求出另一个。因此,常常有如下的三种情况:(1) 已知和,更准确地说是已知的取值范围,求概率.这类题目一般是直接使用中心极限定理。查正态分布表,求出概率的近似值。(2) 已知和,求中的。这时也是应用中心极限定理,反查正态分布表,从而得到一个方程,从中可解出。(3) 已知和(或的形式),求。往往是应用中心极限定理,反查正态分布表,从而得到一个方程,并从中解出。此时,可利用此,求出随机变量的取值范围。3.4 三种场合下的中心极限定理的关系棣莫弗拉普拉斯与林德贝格勒维定理的关

20、系,棣莫弗拉普拉斯定理实际上就是林德贝格勒维定理在随机变量序列独立同分布的情形。林德贝格勒维定理是林德贝格定理的推论,证明如下:证5: 设是独立同分布的随机变量序列,且有有限的期望和方差,则,对任意的,有 ,由于,所以当时,有。注:由林德贝格定理可知服从中心极限定理,即林德贝格勒维定理成立。各定理的适用范围有些不同:若随机变量序列式独立同分布的,则用林德贝格勒维定理;若随机变量序列不但是独立同分布的,而且服从伯努利分布,则用棣莫弗拉普拉斯定理;若随机变量序列独立而不同分布时,则用李雅普诺夫定理或林德贝格定理。第4章 用MATLAB实现对中心极限定理的模拟证明4.1 数学模型6设随机变量相互独立

21、,且服从同一分布,具有数学期望和方差:,则随机变量之和的标准化变量的分布函数对于任意满足。独立同分布函数表达式,正态分布函数表达式。4.2 设计过程为了验证当很大时,独立同分布近似地服从正态分布,分别构造独立同分布函数和正态分布函数,将独立同分布的随机点数目取得足够的大,然后绘图、观察这两种情况的分布拟合程度。绘制独立同分布的图形:s=sum(r);mu=mean(s); %求随机数的平均值sigma=std(s); %求均方差n,x=hist(s,mu-5*sigma:sigma:mu+5*sigma); %从其中取10个数的和bar(x,n/M/sigma,r) %绘制直方图绘制正态分布的

22、图形:h=mu-5*sigma:0.1*sigma:mu+5*sigma; %从其中取100个数a=-(h-mu).2/(2*sigma2);b=1/sqrt(2*pi)/sigma;t=b.*exp(a);plot(h,t,K) %绘制数值曲线4.3 仿真结果当时,图3-1 中心极限定理当时,图3-2 中心极限定理当时,图3-3 中心极限定理分析以上三幅图可知:从单独的一张图来看,正态分布曲线和独立同分布直方图总的来说是比较吻合的;比较这三张图形,可以看出第二张图形拟合的较好,第三张图形拟合的更好。而产生这种视觉效果,正是因为这三张图形所使用的源代码唯一的不同之处在于的取值,且。由此可以说明

23、,当的取值很大时,独立同分布可以近似地趋近于正态分布。第5章 中心极限定理的应用5.1 用中心极限定理证明较复杂的极限等式在求解一些较复杂的极限时,有时可采用概率论的方法进行求解,其中一部分需要利用中心极限定理,将所要求的极限式与已知的特殊概率分布相联系,从而解除一些用分析方法不易求解的极限值。例7 证明:。证: 设为一独立同分布随机变量序列,每个均服从参数为的泊松分布,则,服从参数为的泊松分布。故。由林德贝格勒维中心极限定理可知,。注:若的分布律为,则称服从参数为的泊松分布,记为。本例题是用概率论的方法来证明等式的一例,关键是根据中心极限定理知道,泊松分布时以正态分布为极限分布的。5.2 中

24、心极限定理在近似计算中的应用5.2.1中心极限定理在保险业中的应用例18 在一家保险公司里有人投保,每人每年付元保险费,在一年内投保者中,每个人死亡的概率为,死亡后家属可向保险公司领取元的补偿金,求:(1)保险公司一年的利润不少于万元的概率;(2)保险公司亏本的概率;(3)保险公司一年的利润在万元到万元之间的概率.解:令,.所有的相互独立,且都服从分布,因此,.设入保险的人中,一年内死亡的人数为,则.从而,.由中心极限定理知,.(1)保险公司一年的利润不少于万元,即,则其概率为 .即保险公司一年的利润不少于万元的概率为.(2)保险公司亏本,即,则其概率为 .即保险公司亏本的概率为.(3)保险公

25、司一年的利润在万元到万元之间,即,则其概率为 .注:该问题是棣莫弗拉普拉斯中心极限定理在经济问题中的一个应用.在此,我们可以发现:若随机变量序列不仅仅是独立同分布的,而且服从伯努利分布,则用棣莫弗拉普拉斯定理来近似计算相对方便简洁.通过对该问题的研究,我们发现,保险公司亏本的概率为不可能事件,这就是保险公司为什么那么乐于开展保险业务的原因.5.2.2中心极限定理在商场管理中的应用1 商品订购问题9例2 某商店负责供应某地人的日用商品,某种商品在一段时间内每人需用一件的概率为,假定在这段时间内,每个人购买与否彼此独立,问该商店应至少备多少件这种商品才能以的概率保证不脱销。解:令每个人购买这种商品

26、与否为,则,.于是随机变量序列相互独立,设商店应预备件商品,则服从参数,的二项分布。根据题意知,。所以,的数学期望和方差分别为:, 。由棣莫弗拉普拉斯中心极限定理得,。查正态分布表得,故。因此,该商店应至少预备件这种产品才能以的概率保证不脱销。2 电力供应问题10例3 商店的某部门有台同型号的电器,每台电器开动时所需用的电力为千瓦.每台电器的开停可视为处于随机状态,且相互不影响,而每台电器开着的概率为。问至少应供应这批电器多大的电力,才能以的把握保证这批电器都能正常工作。解:将一台电器工作与否可视为一次试验,则台电器中,工作着的电器总数服从。令应需供电千瓦才能以的把握保证这批电器都能正常工作,

27、即。而随机变量的数学期望和方差分别为:,。由棣莫弗拉普拉斯中心极限定理得, 。查正态分布表知,所以。这说明只要给该部门供电千瓦,那么由于供电因素而影响工作的概率即小于。3 抽样检验问题11例4 某公司在抽样检查一种产品质量时,如果发现这种产品中次品的个数多于个,则拒绝接受该产品,否则接受该产品.设该批产品的次品率为,问至少应从中抽取多少个产品进行检查,才能保证拒绝该产品的概率达到。解:设至少应从中抽取件产品,才能满足题目条件。为次品数,且,。则,且,从而,。由棣莫弗拉普拉斯中心极限定理得,。由于充分大时,所以,即。查标准正态分布表得,。解得,所以至少应从中抽取个产品进行检查,才能保证拒绝该产品

28、的概率达到。4 水房拥挤问题12例5 假设某学校新校区有学生人,只有一个开水房,由于每天晚上打水的人较多,经常会出现同学排队长的现象。为此,校学生会特向后勤部提议要增设水龙头。假设后勤部经调查发现,每个学生在晚上一般有的时间要占用一个水龙头,现有水龙头个,现在总务处所遇到的问题如下:(1)未装新龙头前,出现拥挤现象的概率;(2)至少需要装多少个新水龙头,才能以以上的概率保证不拥挤。解:(1)设在同一时刻,个学生中,占用水龙头的人数为,则。则出现拥挤现象的概率为:。因为,由棣莫弗拉普拉斯中心极限定理得,。故出现拥挤现象的概率为:。(2)欲求,使得,即。由于,即,查标准正态分布表知,。即。故需要安

29、装62个水龙头,才能以以上的概率保证不拥挤。5.2.3 中心极限定理在物理测量中的应用例6 独立的多次测量的一个物理量,每次测量所产生的随机误差,都服从内的均匀分布。(1)如果取次测量的算术平均值作为测量结果,求它与真值之间的差小于的概率。(2)计算当,时的概率近似值。(3)要使得上述概率不小于,应进行多少次测量。解:(1)设表示第次测量值,表示第次测量所产生的随机误差,表示所测物理量的真值,则。由于,因此有,。因为独立同分布,由林德贝格勒维中心极限定理可知, (2)当,时,。(3)要求,使得。所以有。查标准正态分布表得。解得。故要使得上述概率不小于,应至少进行次测量。5.3 中心极限定理来近

30、似产生正态随机数设随机变量服从分布,即的密度函数为,。其分布函数为。仅由上述表达式不能用显式解出。下面我们利用中心极限定理来近似产生正态随机数。中心极限定理告诉我们,若为独立同分布的随机变量序列,其分布函数为,均值为,方差为,则随机变量的数学期望为,方差。对任意的实数,有。因此,若是从总体中随机取出的一组随机样本,则。可以近似地看成是标准正态分布的随机数。我们可以取为上一组相互独立的均匀分布随机变量序列,这时,若取,则可近似产生如下的随机数:(1)产生个上独立的均匀分布随机数;(2)计算。则为近似的随机数,而近似地为的随机数。例 我们可以利用语言中的函数在之间随机地产生个相互独立的均匀分布,其

31、随机序列为,。这时,。由于。可以由计算机近似产生出的均匀分布的随机数如下:5,17,29,34,55,61,65,70,75,82,88,954,14,20,33,40,45,55,67,80,85,91,927,11,19,23,42,50,64,68,75,77,89,973,17,25,35,44,55,61,75,81,88,90,921,12,33,39,50,51,53,55,67,69,80,8811,14,24,37,39,59,62,66,79,83,85,945,15,28,35,47,55,58,62,64,77,86,903,14,19,39,44,53,56,65,7

32、4,77,81,967,19,33,38,48,51,53,61,69,71,87,939,22,27,40,41,48,61,64,68,74,83,988,13,18,33,40,44,49,57,64,78,79,842,17,22,29,45,56,60,67,73,80,87,944,15,26,30,47,53,55,70,79,85,91,938,11,23,31,48,58,64,67,80,82,84,911,18,22,37,39,45,49,54,59,66,78,8115,16,22,36,49,51,58,69,78,84,87,943,18,21,39,44,47,

33、51,57,66,74,80,906,14,29,31,47,50,58,62,68,70,77,968,13,22,34,43,48,51,59,64,76,80,923,22,28,32,48,57,65,71,83,84,91,99由这组均匀分布的随机数可以近似产生个随机数:0.0007 ,0.0271,0.0061,0,1126,0.0031,0.0070,0.0432,0.0617,0.1340,0.0432,0.09645,0.0802,0.0617,0.0030,0.01543,0.0077,0.0584,0.0075,0.0270,0.0964。做出它们的频率直方图如下:图4-

34、3 正态分布的频率直方图可以发现,它们近似地服从标准正态分布.可用以下两个程序来产生的平均随机数。程序如下:#include #include #include int main() int i; time_t t; srand(unsigned) time(&t); printf(Ten random numbers from 0 to 99:n); for(i=0;i 12;i+) printf(%dt,rand()%100); return 0; 注:此方法是通过现有的计算机函数在产生均匀分布的随机序列的基础上,利用中心极限定理的相关结论,由此得到近似正态分布随机序列的一种简单方法,也是

35、中心极限定理的一个重要应用.利用计算机辅助计算,我们在取均匀分布随机序列时,可令取相当大的数,如,甚至更大,使得到的随机序列能够更加趋于正态分布。5.4 中心极限定理在抽样推断中的应用中心极限定理是数理统计中大样本统计方法必不可少的理论基础。在统计推断理论中,一般是研究正态总体均值与方差的统计推断,它是依赖于正态分布的特殊性以及正态总体的样本统计量的一些分布性质,然而对于不服从正态分布的总体就不满足这些条件.我们知道,由简单的随机抽样得到的样本就是一个独立同分布的随机变量序列。因此,在实际生活中,如果能够获得样本容量较大的样本时,就可以把独立同分布的随机变量之和当作一个服从正态分布的随机变量来

36、处理。这种方法的理论依据就是中心极限定理。不论总体服从什么分布,在总体中随机抽取一个大样本,那么近似地服从正态分布,即近似地服从标准正态分布。即使方差未知,我们也可以用样本方差作为的无偏估计,用来代替,也近似地服从标准正态分布。因此在已知的条件下,总体均值的置信度的置信区间为;在未知的条件下,总体均值的置信度的置信区间为。在对总体均值进行检验时,可选这统计量(已知时)或选择统计量(未知时),当原假设成立时,对于显著性水平,的接受域均为13。同样,对于事件发生概率的估计和检验,我们只需要从总体中抽取容量较大的样本(样本容量),是事件在次试验中发生的次数,由中心极限定理知,近似地服从标准正态分布,

37、概率的置信度为的置信区间为14。5.4.1 概率预测服从二项分布的随机现象在科学试验及生产实践中是经常遇到的,且在有些问题中,总体概率往往可以凭以往的统计资料和经验是已知的或是大约可知的。因此,我们可以用已知的概率作为假设条件(无效假设),抽样计算某事件实际所发生的概率,用以推断或预测某事件是否已发生,如:例7 设某一个地区,鸡在传染病流行时的感染率为,为抓住防疫时机,某鸡场在这群鸡中随机抽取了只进行检疫,结果发现感染鸡不超过只,问该传染病是否已在这个鸡场中流行?这种问题,往往用实测值与期望值作比较或抽样频率与总体概率比较难以给出断言,因而需要用概率去预测。无效假设:疫情已在本鸡场流行,则取只

38、检疫,发现受感染的鸡数服从二项分布,即,而受感染的鸡不超过只的概率为:。由于较大,用二项分布直接计算这个概率较繁琐,我们可用De MoiveLaplace中心极限定理来近似处理。 。即在无效假设条件下,实际抽样出现感染鸡的概率为。这与相比较,小得多,故在这一鸡场该传染病还未流行,还来得及采取有效防疫措施。5.4.2 估计总体概率的样本容量推断在有些实际问题中,我们仅知总体是符合二项分布概率模型,但其概率未知,在这种情况下,往往要以抽样频率去估计总体概率。但此时有精确度上的优劣之分,且信度模糊。因此,用频率去推断概率时,应该有一个精度要求和可信度。一般的提法是:使其估计的绝对误差不超过一个小正数

39、,即,其可信度不小于值。那么为使估计值以可信度达到精度要求,应抽取多大的样本容量去估计比较合适?这就是关于估计总体概率的样本容量推断问题,这里我们应用De MoiveLaplace中心极限定理给出一种较简单的推断方法。 设从未知概率的二项分布总体中随机抽取容量为的样本,样本频率为(为所讨论总体中的某事件在抽样试验中出现的次数,。则应多大时,才能使,且可信度不小于,可归结为的取值应满足概率式 。 (24) 由De MoiveLaplace中心极限定理知,。则(24)式可表为。 (25)由正态分布表可查得,正态分布临界值满足。 (26)比较(25)与(26),则所推断的样本容量应满足,即。 (27

40、)由于,由一元函数极值法,知为的最大值点,于是对,都有。欲使(27)式成立,只须。 (28)满足上式的最小整数即为所求的样本容量。例8 某鸡场欲购一大批鸡蛋,为了解欲购鸡蛋的真实孵化率,事先要购一部分样品蛋来做孵化试验,问先购多少只样品蛋,才能使得试验孵化率与真实孵化率的绝对误差不超过,其推断可信度为。 显然,这是一个未知总体概率的二项分布概率模型,要以抽样频率去推断总体概率,样本容量应为多大的问题。已知,则由(3)式查正态分布表,得,再由(5)式得,故应先购只样品蛋,才能以的把握使试验孵化率与真实孵化率的误差不超过。假如该鸡场经样本容量推断后购了只鸡蛋做试验,结果孵出了只小鸡,此时可以大于的把握可以推断出该品种鸡蛋的真实孵化率的置信区间为。代入,得。则该鸡场可根据此置信区间去决策是大批购进该种鸡蛋还是不购进。5.4.3 总体容量的推断在有些实际问题中,也会遇到推断总体容量应多大才能满足实际需要。问题的一般提法:已知某二项分布总体概率为,要以可信度推断总体中具有概率性态的单元不少

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公文档 > 其他范文


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号