《概率统计全本》PPT课件.ppt

上传人:小飞机 文档编号:5584987 上传时间:2023-07-30 格式:PPT 页数:187 大小:1.90MB
返回 下载 相关 举报
《概率统计全本》PPT课件.ppt_第1页
第1页 / 共187页
《概率统计全本》PPT课件.ppt_第2页
第2页 / 共187页
《概率统计全本》PPT课件.ppt_第3页
第3页 / 共187页
《概率统计全本》PPT课件.ppt_第4页
第4页 / 共187页
《概率统计全本》PPT课件.ppt_第5页
第5页 / 共187页
点击查看更多>>
资源描述

《《概率统计全本》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《概率统计全本》PPT课件.ppt(187页珍藏版)》请在三一办公上搜索。

1、2023/7/30,1,概率统计,随机事件及其概率随机变量及其分布随机变量的数字特征数理统计的基本概念参数估计假设检验方差分析,2023/7/30,2,1.1 随机事件及其概率,随机事件及其运算概率的定义及其运算条件概率全概率公式与贝叶斯公式事件的独立性,2023/7/30,3,1.1.1 随机事件及其运算,随机试验(简称“试验”)随机试验的特点 1.可在相同条件下重复进行;2.试验可能结果不止一个,但能确定所有的可能结果;3.一次试验之前无法确定具体是哪种结果出现。随机试验可表为E,2023/7/30,4,例随机试验例:E1:抛一枚硬币,分别用“H”和“T”表示出正面和反面;E2:将一枚硬币

2、连抛三次,考虑正面出现的次数;E3:掷一颗骰子,考虑可能出现的点数;E4:记录某网站一分钟内受到的点击次数;E5:在一批灯泡中任取一只,测其寿命。,2023/7/30,5,1.1.1 随机事件及其运算,样本空间实验的所有可能结果所组成的集合称为样本空间,记为样本点 试验的每一个结果或样本空间的元素称为一个样本点,记为 基本事件由一个样本点组成的单点集,2023/7/30,6,1.1.1 随机事件及其运算,随机事件试验中可能出现或可能不出现的情况叫“随机事件”,简称“事件”.记作A、B、C等任何事件均可表示为样本空间的某个子集.称事件A发生当且仅当试验的结果是A中的元素两个特殊事件:必然事件、不

3、可能事件.,2023/7/30,7,例1.1.2 对于试验E2:将一枚硬币连抛三次,考虑正面出现的次数,以下随机事件:1=0,1,2,3-必然事件 A“至少出一个正面”1,2,3;而对试验E5:在一批灯泡中任取一只,测其寿命。2=x:0 x(小时)。B“灯泡寿命超过1000小时”x:1000 x(小时),1.1.1 随机事件及其运算,2023/7/30,8,1.1.1 随机事件及其运算,事件之间的关系1.包含关系“A发生必导致B发生”记为AB AB AB且BA.2.和事件:“事件A与B至少有一个发生”,记作AB n个事件A1,A2,An至少有一个发生,记作3.积事件:A与B同时发生,记作 AB

4、AB n个事件A1,A2,An同时发生,记作 A1A2An,2023/7/30,9,4.差事件:AB称为A与B的差事件,表示事件A发生而B不发生5.事件的互斥:AB 表示事件A、B不能同时发生6.事件的互逆 AB,且AB,1.1.1 随机事件及其运算,2023/7/30,10,1.1.1 随机事件及其运算,事件的运算规律1、交换律:ABBA,ABBA2、结合律:(AB)CA(BC),(AB)CA(BC)3、分配律:(AB)C(AC)(BC),(AB)C(AC)(BC)4、对偶(De Morgan)律:,2023/7/30,11,例甲、乙、丙三人各向目标射击一发子弹,以A、B、C分别表示甲、乙、

5、丙命中目标,试用A、B、C的运算关系表示下列事件:,1.1.1 随机事件及其运算,2023/7/30,12,1.1.2 概率的定义及其运算,从直观上来看,事件A的概率是指事件A发生的可能性。古典概型与概率若某实验E满足1.有限性:样本空间1,2,n;2.等可能性:P(1)=P(2)=P(n).则称E为古典概型也叫等可能概型。,2023/7/30,13,设事件A中所含样本点个数为N(A),以N()记样本空间中样本点总数,则有,P(A)具有如下性质:,(1)0 P(A)1;(2)P()1;P()=0(3)AB,则 P(A B)P(A)P(B),古典概型中的概率:,1.1.2 概率的定义及其运算,2

6、023/7/30,14,例甲有三个子女的家庭,设每个孩子是男是女的概率相等,则至少有一个男孩的概率是多少?解:设A-至少有一个男孩,以H表示某个孩子是男孩T是女孩,N()=HHH,HHT,HTH,THH,HTT,TTH,THT,TTT,N(A)=HHH,HHT,HTH,THH,HTT,TTH,THT,1.1.2 概率的定义及其运算,2023/7/30,15,例1.1.5:设盒中有3个白球,2个红球,现从盒中任抽2个球,求取到一红一白的概率。解:设A-取到一红一白,1.1.2 概率的定义及其运算,2023/7/30,16,一般地,设盒中有N个球,其中有M个白球,现从中任抽n个球,则这n个球中恰有

7、k个白球的概率是,1.1.2 概率的定义及其运算,2023/7/30,17,例1.1.6:将3个球随机的放入3个盒子中去,问:(1)每盒恰有一球的概率是多少?(2)空一盒的概率是多少?,解:设A:每盒恰有一球,B:空一盒,1.1.2 概率的定义及其运算,2023/7/30,18,一般地,把n个球随机地分配到m个盒子中去(nm),则每盒至多有一球的概率是:,某班级有n 个人(n365),问至少有两个人的生日在同一天的概率有多大?,?,1.1.2 概率的定义及其运算,2023/7/30,19,1.1.2 概率的定义及其运算,概率的统计定义事件A在n次重复试验中出现nA次,则比值nA/n称为事件A在

8、n次重复试验中出现的频率,记为fn(A).即:fn(A)nA/n.频率的性质(1)0fn(A)1;(2)fn()1;fn()=0(3)可加性:若AB,则 fn(A B)fn(A)fn(B).,2023/7/30,20,实践证明:当试验次数n增大时,fn(A)逐渐趋向一个稳定值。可将此稳定值记作P(A),作为事件A的概率历史上曾有人做过试验,试图证明抛掷匀质硬币时,出现正反面的机会均等。实验者 n nH fn(H)De Morgan 2048 1061 0.5181 Buffon 4040 2048 0.5069K.Pearson 12000 6019 0.5016K.Pearson 24000

9、 12012 0.5005,1.1.2 概率的定义及其运算,2023/7/30,21,1.1.2 概率的定义及其运算,概率的加法公式对任意两事件A、B,有 P(AUB)P(A)P(B)P(AB)该公式可推广到任意n个事件A1,A2,An的情形,以及:(1)互补性:P()1 P(A);(2)可分性:对任意两事件A、B,有 P(B)P(BA)P(B).,2023/7/30,22,例某市有甲,乙,丙三种报纸,订每种报纸的人数分别占全体市民人数的30%,其中有10%的人同时定甲,乙两种报纸.没有人同时订甲乙或乙丙报纸.求从该市任选一人,他至少订有一种报纸的概率.,解:设A,B,C分别表示选到的人订了甲

10、,乙,丙报,1.1.2 概率的定义及其运算,2023/7/30,23,1.1.2 概率的定义及其运算,几何概型设试验E的样本空间为某可度量的区域,且中任一区域出现的可能性大小与该区域的几何度量成正比,而与该区域的位置和形状无关,则称E为几何概型的试验。且定义事件A的概率为:,2023/7/30,24,例1.1.8:蒲丰(Buffon)投针问题:平面上画着一些平行线,他们之间的距离都是a,向此平面随意投一长度为L的针,试求此针与任一平行线相交的概率。,解:以x表示针的中点到最近一条平行线的距离,以表示针与平行线的夹角,如图所示:显然样本空间为:,1.1.2 概率的定义及其运算,2023/7/30

11、,25,以R表示边长为a/2与的长方形,针与平行线相交当且仅当:,设在R中满足该关系的区域为G,即图中阴影部分,则所求概率为:,1.1.2 概率的定义及其运算,2023/7/30,26,1.1.3 条件概率,思考:袋中有十只球,其中九只白球,一只红 球,十人依次从袋中各取一球(不放回),问:(1)第一个人取得红球的概率是多少?(2)第二 个人取得红球的概率是多少?(3)若已知第一个人取到的是白球,则第二个人取到红球的概率是多少?(4)若已知第一个人取到的是红球,则第二个人取到红球的概率又是多少?,?,2023/7/30,27,1.1.3 条件概率,条件概率的定义已知事件A发生的条件下,事件B发

12、生的概率称为A条件下B的条件概率,记作 P(B|A)显然,若事件A、B是古典概型的样本空间中的两个事件,其中A含有nA个样本点,AB含有nAB个样本点,则,2023/7/30,28,例1.1.9 设袋中有3个白球,2个红球,现从袋中任意抽取两次,每次取一个,取后不放回,(1)求两次均取到红球的概率(2)求第二次取到红球的概率(3)已知第一次取到红球,求第二次也取到红球的概率;,设A第一次取到红球,B第二次取到红球,1.1.3 条件概率,2023/7/30,29,=,A,B,A第一次取到红球,B第二次取到红球,1.1.3 条件概率,2023/7/30,30,1.1.3 条件概率,乘法公式设P(A

13、)0,则:P(AB)P(A)P(B|A)称为事件A、B的概率乘法公式推广到三个事件的情形:P(ABC)P(A)P(B|A)P(C|AB).一般地,有下列公式:P(A1A2An)P(A1)P(A2|A1).P(An|A1An-1).,2023/7/30,31,例1.1.10 有1张电影票需要给3个人分,每个人都想要,决定用抓阄的方式解决,问抓阄的先后对此方法的公平性是否有影响。,解:设Ai为第i次抓阄时取到电影票,i=1,2,3。则,由此可见,抓阄的方式是公平的!可推广到n中抓m的情况。P=m/n,2023/7/30,32,1.1.4 全概率公式与贝叶斯公式,完备事件组事件组A1,A2,An(n

14、可为),称为样本空间的一个完备事件组,若满足:,An,A2,A1,-,B,-,-,2023/7/30,33,1.1.4 全概率公式与贝叶斯公式,全概率公式事件组A1,A2,An 为样本空间的一个完备事件组,且P(Ai)0,(i1,n),则对任何事件B有:,An,A2,A1,-,B,-,-,2023/7/30,34,例市场上有甲、乙、丙三家工厂生产的同一品牌产品,已知三家工厂的市场占有率分别为1/4、1/4、1/2,且三家工厂的次品率分别为 2、1、3,试求市场上该品牌产品的次品率。,B,2023/7/30,35,解:设A1从甲袋放入乙袋的是白球;A2从甲袋放入乙袋的是红球;B从乙袋中任取一球是

15、红球;,甲,乙,例1.1.12 有甲乙两个袋子,甲袋中有两个白球,1个红球,乙袋中有两个红球,一个白球这六个球手感上不可区别今从甲袋中任取一球放入乙袋,搅匀后再从乙袋中任取一球,问此球是红球的概率?,2023/7/30,36,1.1.4 全概率公式与贝叶斯公式,贝叶斯公式 上例中,若已知取到一个红球,则从甲 袋放入乙袋的是白球的概率是多少?,?,事件组A1,A2,An 为样本空间的一个完备事件组,且P(Ai)0,(i1,n),则对任何事件B有:,2023/7/30,37,称为贝叶斯公式。,例用血清甲胎蛋白法诊断肝癌,试验反应有阴性和阳性两种结果。当被诊断者患肝癌时,其反应为阳性的概率为0.95

16、;当被诊断者未患肝癌时,其反应为阴性的概率为0.9。根据记录,某地人群中肝癌的患病率为0.0004,现有一人的试验反应为阳性,问此人确实患肝癌的概率?,2023/7/30,38,解:设A1患肝癌;A2未患肝癌;B反应为阳性;则:,根据贝叶斯公式,有所求概率为:,表明还需要通过综合考虑其他方面才能确诊!,2023/7/30,39,1.1.5 事件的独立性,两个事件独立的定义设A、B是两事件,P(A)0,若 P(B)P(B|A)P(AB)P(A)P(B)则称事件A与B相互独立(即A的发生与否对B毫无影响)。定理 以下四件事等价:(1)事件A、B相互独立;(2)事件A、B相互独立;(3)事件A、B相

17、互独立;(4)事件A、B相互独立。,2023/7/30,40,1.1.5 事件的独立性,多个事件独立的定义若三个事件A、B、C满足:(1)P(AB)=P(A)P(B),P(AC)=P(A)P(C),P(BC)=P(B)P(C),则称事件A、B、C两两相互独立(2)P(ABC)P(A)P(B)P(C),则称事件A、B、C相互独立。,2023/7/30,41,1.1.5 事件的独立性,推广:一般地,设A1,A2,An是n个事件,如果对任意k(1kn),任意的1i1i2 ikn,具有等式:P(A i1 A i2 A ik)P(A i1)P(A i2)P(A ik)则称n个事件A1,A2,An相互独立

18、。,2023/7/30,42,1.1.5 事件的独立性,事件独立性的应用1、加法公式的简化:若事件A1,A2,An相互独立,则:2、在可靠性理论上的应用,2023/7/30,43,1.2 随机变量,随机变量的概念离散型随机变量连续型随机变量正态分布,2023/7/30,44,随机变量的概念,随机变量 设=是试验的样本空间,如果量X是定义在上的一个单值实值函数即对于每一个,有一实数X=X()与之对应,则称X为随机变量。随机变量常用X、Y、Z 或、等表示。通俗地说,每一个样本点可以数量化,每次试验的结果在未结束前是个未知变量,而且取值具有随机性。随机变量的特点:(1)X的全部可能取值是互斥且完备的

19、(2)X的部分可能取值描述随机事件,2023/7/30,45,?,请举几个实际中随机变量的例子,例引入适当的随机变量描述下列事件:(1)将3个球随机放入三个格子中,记空格子数为X:事件A=有1个空格=X=1,B=全有球=X=0。(2)进行5次试验,记试验成功次数为Y:事件C=试验成功一次=Y=1,D=试验至少成功一次=Y1(3)掷1次硬币,观察正反面。记正面为1,反面为0,2023/7/30,46,随机变量的概念,随机变量的分类,随机变量的分布函数设X是随机变量,对任意实数x,事件Xx的概率PXx称为随机变量X的分布函数。记为F(x),即 F(x)P Xx.易知,对任意实数a,b(ab),P

20、aXbPXbPXa F(b)F(a).,2023/7/30,47,随机变量的概念,分布函数的性质(1)单调不减性:若x1x2,则F(x1)F(x2);(2)归一 性:对任意实数x,0F(x)1,且,(4)对任意实数a,b(ab),P aXbPXbPXa F(b)F(a).具有(13)性质的实函数,必是某个随机变量的分布函数。故该三个性质是分布函数的充分必要性质。,(3)右连续性:对任意实数x,,2023/7/30,48,当x1时,F(x)=1,当0 x1时,特别,F(1)=P0 x1=k=1,例向0,1区间随机抛一质点,以X表示质点坐标.假定质点落在0,1区间内任一子区间内的概率与区间长成正比

21、,求X的分布函数解:F(x)=PXx,随机变量的概念,2023/7/30,49,1.2.2 离散型随机变量,定义 若随机变量X取值x1,x2,xn,而且取这些值的概率依次为p1,p2,pn,则称X为离散型随机变量,而称 PX=xk=pk,(k=1,2,)为X的分布律(列)或概率分布。也可表为:,Xx1 x2xKPp1p2pk,2023/7/30,50,1.2.2 离散型随机变量,分布律的性质,(1)pk 0,k1,2,;(2),例1.2.3 设袋中有5只球,其中有2只白3只黑。现从中任取3只球(不放回),求抽得的白球数X为k的概率。解 k可取值0,1,2,2023/7/30,51,1.2.2

22、离散型随机变量,分布函数 一般地,对离散型随机变量 XPX=xkpk,k1,2,其分布函数为,用分布函数描述随机变量不如分布律直观!,2023/7/30,52,解,例1.2.4 设随机变量X具分布律如右表:试求出X的分布函数。,1.2.2 离散型随机变量,2023/7/30,53,两点(0-1)分布 若随机变量X的取值为0,1两个值,分布律为:PX0=q=1-p,PX1=p则称X服从(01)分布(两点分布),1.2.2 离散型随机变量,几个常用的离散型分布,2023/7/30,54,2.贝努里(Bernoulli)概型与二项分布 设将试验独立重复进行n次,每次试验中,事件A发生的概率均为p,则

23、称这n次试验为n重贝努里试验.若以X表示n重贝努里试验事件A发生的次数,则称X服从参数为n,p的二项分布。记作XB(n,p)其分布律为:,1.2.2 离散型随机变量,2023/7/30,55,解:(1)由题意,XB(6,1/3),于是,X的分布律为:,例从某大学到火车站途中有6个交通岗,假设在各个交通岗是否遇到红灯相互独立,并且遇到红灯的概率都是1/3.(1)设X为汽车行驶途中遇到的红灯数,求X的分布律.(2)求汽车行驶途中至少遇到5次红灯的概率.,2023/7/30,56,3.泊松(Poisson)分布P()若随机变量X的分布律为:,1.2.2 离散型随机变量,PXk,k0,1,2,(0),

24、则称X服从参数为的泊松分布。记作XP(),泊松定理 设随机变量XB(n,p),(n0,1,2,),且n很大,p很小,记=np,则,即可认为XP(),2023/7/30,57,泊松定理表明:泊松分布是二项分布的极限分布,当n很大,p很小时,二项分布就可近似地看成是参数=np的泊松分布,1.2.2 离散型随机变量,2023/7/30,58,解 设X表示400次独立射击中命中的次数,则XB(400,0.02),故PX21 PX0P X110.98400(400)(0.02)(0.98399)=取=np(400)(0.02)8,故近似地有:,例某人射击的命中率为0.02,他独立射击400次,试求其命中

25、次数不少于2的概率。,PX21 PX0P X11(18)e80.996981.,2023/7/30,59,解:由题意,例设某国每对夫妇的子女数X服从参数为的泊松分布,且知一对夫妇有不超过1个孩子的概率为3e-2.求任选一对夫妇,至少有3个孩子的概率。,2023/7/30,60,连续型随机变量,对于随机变量X,若存在(-,+)上的非负函数f(x),使对任意实数x,都有:,概率密度,则称X为连续型随机变量,f(x)为X的概率密度函数,简称概率密度或密度函数.,2023/7/30,61,密度函数的几何意义为,2023/7/30,62,(1)非负性 f(x)0,(-x);(2)归一性,性质(1)、(2

26、)是密度函数的充要性质;,连续型随机变量,密度函数的性质,(3)若x是f(x)的连续点,则,2023/7/30,63,连续型随机变量,(4)对任意实数b,若X f(x),(-x),则:PX=b0。(5),2023/7/30,64,连续型随机变量,几个常用的连续型分布,1.均匀分布,若X的分布密度为:,则称X在(a,b)内服从均匀分布。记作 XU(a,b),对任意实数c,d(acdb),都有,2023/7/30,65,15,45,解:设A乘客候车时间超过10分钟X乘客于某时X分钟到达,则XU(0,60),例1.2.8 长途汽车起点站于每时的10分、25分、55分发车,设乘客不知发车时间,于每小时

27、的任意时刻随机地到达车站,求乘客候车时间超过10分钟的概率,2023/7/30,66,2.指数分布 若 X的分布密度为:,则称X服从参数为0的指数分布,记为:Xexp()。其分布函数为,连续型随机变量,2023/7/30,67,解,例电子元件的寿命X(年)服从参数为3的指数分布(1)求该电子元件寿命超过2年的概率。(2)已知该电子元件已使用了1.5年,求它还能使用两年的概率为多少?,2023/7/30,68,正态分布是实践中应用最为广泛,在理论上研究最多的分布之一,故它在概率统计中占有特别重要的地位。,3.正态分布-高斯(Gauss)分布,连续型随机变量,若随机变量X的分布密度为:,其中 为实

28、数,0,则称X服从参数为,2的正态分布,记为:XN(,2).,2023/7/30,69,正态分布,正态分布的特性,(1)单峰对称 密度曲线关于直线x=对称;f()maxf(x).,(2)的大小直接影响概率分布越大,曲线越平坦;越小,曲线越陡峭。,2023/7/30,70,参数0,21的正态分布称为标准正态分布,记作:XN(0,1)。,正态分布,标准正态分布,2023/7/30,71,正态分布,性质,(1)密度函数,(2)分布函数,(3)(x)1(x);(4)若XN(,2),则,一般的概率统计教科书均附有标准正态分布表供读者查阅(x)的值。,2023/7/30,72,正态分布,性质,(1)密度函

29、数,(2)分布函数,(3)(x)1(x);(4)若XN(,2),则,2023/7/30,73,例(1)ZN(0,1):(0.5)=0.6915,P1.32Z2.43=(2.43)-(1.32)(2)XN(,2):P-3X-3=(3)-(-3)=2(3)-1=0.9973,正态分布,上式称为3 原则.在工程应用中,通常认为P|X|3 1,忽略P|X|3的值.如在质量控制中,常用标准指标值3作两条线,当生产过程的指标观察值落在两线之外时发出警报.表明生产出现异常.,2023/7/30,74,解:设Y为使用的最初90小时内损坏的元件数,故,则YB(3,p),其中,例一种电子元件的使用寿命(小时)服从

30、正态分布(100,225),某仪器上装有3个这种元件,三个元件损坏与否是相互独立的.求:使用的最初90小时内无一元件损坏的概率.,正态分布,2023/7/30,75,随机变量的数学期望与方差几个常见分布的期望与方差随机变量的协方差和相关系数大数定律中心极限定理,1.3 随机变量的数字特征,2023/7/30,76,引例:设某班40名学生的概率统计成绩及得分人数如下表所示:分数 40 60 70 80 90 100 总人数 人数 1 6 9 15 7 2 40则学生的平均成绩是总分总人数。即,数学期望描述随机变量取值的平均特征,1.3.1 随机变量的期望与方差,数学期望的定义,2023/7/30

31、,77,1.3.1 随机变量的期望与方差,数学期望的定义,若XPX=xk=pk,k=1,2,n,.则称,为随机变量X的数学期望,简称期望或均值。,函数Y=g(X)的期望E(g(X)为,2023/7/30,78,1.3.1 随机变量的期望与方差,数学期望的定义,为随机变量X的数学期望,若Xf(x),-x,则称,若Xf(x),-x,则Y=g(X)的期望,2023/7/30,79,例1.3.1 掷一颗均匀的骰子,以X表示掷得的点数,求X的数学期望。,1.3.1 随机变量的期望与方差,例设随机变量X服从标准正态分布,求随机变量Y=aX+b的数学期望(其中a0),2023/7/30,80,解:设乘客于某

32、时X分到达车站,候车时间为Y,则,=10分25秒,例长途汽车起点站于每时的10分、30分、55分发车,设乘客不知发车时间,于每小时的任意时刻随机地到达车站,求乘客的平均候车时间,2023/7/30,81,1.3.1 随机变量的期望与方差,数学期望的性质,1.E(c)=c,c为常数;2.E(cX)=cE(X),c为常数;,4.若X与Y独立,则E(XY)=E(X)E(Y).,3.E(X+Y)=E(X)+E(Y)推广:E(aX+b)=aE(X)+b,2023/7/30,82,例若XB(n,p),求E(X),1.3.1 随机变量的期望与方差,例设随机变量X1,X2,.,Xn服从N(,2)分布,求随机变

33、量:的数学期望,2023/7/30,83,方差是衡量随机变量取值波动 程度的一个数字特征。,1.3.1 随机变量的期望与方差,方差的定义,若E(X),E(X2)存在,则称EX-E(X)2=E(X)2 E(X)2 为随机变量X的方差,记为D(X)或Var(X).,称 为随机变量X的标准差,方差的性质,(1)D(c)=0,(2)D(aX)=a2D(X),a为常数;,(3)若 X,Y 独立,则 D(X+Y)=D(X)+D(Y);,2023/7/30,84,1.3.1 随机变量的期望与方差,推广:若 X,Y 独立,则 D(X-Y)=D(X)+D(Y)D(aX+bY+c)=a2D(X)+b2D(Y),2

34、023/7/30,85,求D(X),1.3.1 随机变量的期望与方差,例设随机变量X的概率密度为,2023/7/30,86,几个常见分布的期望与方差,0-1分布,EX=p,E(X2)=p,DX=pq,二项分布B(n,p),2023/7/30,87,几个常见分布的期望与方差,二项分布B(n,p),2023/7/30,88,几个常见分布的期望与方差,泊松分布XP(),2023/7/30,89,几个常见分布的期望与方差,均匀分布U(a,b),2023/7/30,90,几个常见分布的期望与方差,指数分布Xexp(),2023/7/30,91,几个常见分布的期望与方差,正态分布N(,2),2023/7/

35、30,92,1.3.3 协方差和相关系数,协方差定义,若随机变量X和Y的期望E(X)、E(Y)存在,则称:COV(X,Y)=EXE(X)YE(Y)为X与Y的协方差,易见:COV(X,Y)=E(XY)-E(X)E(Y),当COV(X,Y)=0时,称X与Y不相关。X与Y不相关是X与Y独立的必要条件。,2023/7/30,93,1.3.3 协方差和相关系数,协方差性质,(1)COV(X,Y)=COV(Y,X);(2)COV(X,X)=D(X);COV(X,c)=0(3)COV(aX,bY)=abCOV(X,Y),其中a,b为 常数(4)COV(X+Y,Z)=COV(X,Z)+COV(Y,Z);(5)

36、D(X Y)=D(X)+D(Y)2COV(X,Y).,2023/7/30,94,1.3.3 协方差和相关系数,相关系数定义,若X,Y的方差和协方差均存在,且DX0,DY0,则,称为X与Y的相关系数.注:若记,称为X的标准化,易知EX*=0,DX*=1.且,2023/7/30,95,1.3.3 协方差和相关系数,相关系数性质,(1)|XY|1;(2)|XY|=1存在常数a,b 使PY=aX+b=1;(3)X与Y不相关 XY=0;,矩,1.K阶原点矩 Ak=E(Xk),k=1,2,而E(|X|k)称为X的K阶绝对原点矩;2.K阶中心矩 Bk=EX-E(X)k,k=1,2,而E|X-E(X)|k称为

37、X的K阶绝对中心矩;,2023/7/30,96,1.3.3 协方差和相关系数,相关系数性质,(1)|XY|1;(2)|XY|=1存在常数a,b 使PY=aX+b=1;(3)X与Y不相关 XY=0;,矩,1.K阶原点矩 Ak=E(Xk),k=1,2,而E(|X|k)称为X的K阶绝对原点矩;2.K阶中心矩 Bk=EX-E(X)k,k=1,2,而E|X-E(X)|k称为X的K阶绝对中心矩;,2023/7/30,97,设X1,,Xn为n个随机变量,记cij=cov(Xi,Xj),i,j=1,2,n.则称由cij组成的矩阵为随机变量 X1,,Xn的协方差矩阵C。即,1.3.3 协方差和相关系数,协方差矩

38、阵,2023/7/30,98,若随机变量X的期望和方差存在,则对任意0,有,这就是著名的切比雪夫(Chebyshev)不等式。它有以下等价的形式:,切比雪夫不等式,1.3.4 大数定律,2023/7/30,99,1.3.4 大数定律,2023/7/30,100,解:由切比雪夫不等式,令,1.3.4 大数定律,例已知某种股票每股价格X的平均值为1元,标准差为0.1元,求a,使股价超过1+a元或低于1-a元的概率小于10%。,2023/7/30,101,依概率收敛,1.3.4 大数定律,设Xn为随机变量序列,X为随机变量,若任给0,使得:,则称Xn依概率收敛于X.可记为,2023/7/30,102

39、,如,意思是:当,a,而,意思是:,时,Xn落在,内的概率越来越大.,当,1.3.4 大数定律,2023/7/30,103,依概率收敛,1.3.4 大数定律,设Xn为随机变量序列,X为随机变量,若任给0,使得:,则称Xn依概率收敛于X.可记为,2023/7/30,104,设Xk,k=1,2,.为独立的随机变量序列,且有相同的数学期望,及方差20,则,即若任给0,使得,1.3.4 大数定律,切比雪夫大数定律,2023/7/30,105,证明:由切比雪夫不等式,这里,故,2023/7/30,106,设进行n次独立重复试验,每次试验中事件A发生的概率为p,记fn为n次试验中事件A发生的频率,则,证明

40、:设,第i次试验事件A发生,第i次试验事件A不发生,则,由切比雪夫大数定理,1.3.4 大数定律,伯努里大数定律,2023/7/30,107,若Xk,k=1.2,.为独立同分布随机变量序列,EXk=,k=1,2,则,推论:若Xi,i=1.2,.为独立同分布随机变量序列,E(X1k)=,则,1.3.4 大数定律,辛钦大数定律,2023/7/30,108,设Xn为随机变量序列,X为随机变量,其对应的分布函数分别为Fn(x),F(x).若在F(x)的连续点,有,则称Xn依分布收敛于X.可记为,1.3.5 中心极限定理,依分布收敛,2023/7/30,109,设Xn为独立同分布随机变量序列,若EXk=

41、,DXk=2 0,k=1,2,则Xn满足:,1.3.5 中心极限定理,独立同分布中心极限定理(Levy-Lindeberg),根据上述定理,当n充分大时,实际上,当n充分大时,Xi对总和的影响既均匀又微小,2023/7/30,110,解:设Xk为第k 次掷出的点数,k=1,2,100,则X1,X100独立同分布.,由中心极限定理,例1.3.7 将一颗骰子连掷100次,则点数之和不少于500的概率是多少?,1.3.5 中心极限定理,2023/7/30,111,设Xn为独立同分布随机变量序列,若EXk=,DXk=2 0,k=1,2,则Xn满足:,1.3.5 中心极限定理,独立同分布中心极限定理(L

42、evy-Lindeberg),根据上述定理,当n充分大时,实际上,当n充分大时,Xi对总和的影响既均匀又微小,2023/7/30,112,设随机变量n(n=1,2,.)服从参数为n,p(0p1)的二项分布,则,证明:设,第i次试验事件A发生,第i次试验事件A不发生,则,由中心极限定理,结论得证,1.3.5 中心极限定理,德莫佛-拉普拉斯中心极限定理,2023/7/30,113,1.3.5 中心极限定理,例1.3.8 在一家保险公司里有10000个人参加寿命保险,每人每年付12元保险费。在一年内一个人死亡的概率为0.6%,死亡时其家属可向保险公司领得1000元,问:(1)保险公司亏本的概率有多大

43、?(2)其他条件不变,为使保险公司一年的利润不少于60000元,赔偿金至多可设为多少?,2023/7/30,114,解:设X表示一年内死亡的人数,则XB(n,p),其中:n=10000,p=0.6%,np=60,npq=59.64设Y表示保险公司一年的利润,Y=10000*12-1000X于是由中心极限定理(1)PY0=P10000*12-1000X0=1PX120 1(7.75)=0;,1.3.5 中心极限定理,2023/7/30,115,PY60000=P10000*12-aX60000=PX60000/a0.9;,(2)设赔偿金为a元,则令,由中心极限定理,上式等价于,1.3.5 中心极

44、限定理,2023/7/30,116,随机样本抽样分布,1.4 数理统计的基本概念,2023/7/30,117,1.总体-研究对象的全体。通常指研究对象的某项数量指标全体。组成总体的元素称为个体。,从本质上讲,总体就是所研究的随机变量或随机变量的分布。,1.4.1 随机样本,总体与样本,2.样本:来自总体的部分个体X1,Xn 如果满足:,(1)同分布性:Xi,i=1,n与总体X同分布.,2023/7/30,118,1.4.1 随机样本,(2)独立性:X1,Xn 相互独立;则称为容量为n 的简单随机样本,简称样本。而称X1,Xn 的一次实现为样本观察值,记为x1,xn,简单随机样本来自于简单随机抽

45、样试验,特点:(1)每次抽样中,各个个体被抽到的机会均等(2)每次抽样前,总体成分保持不变样本容量n相对于总体容量N而言是极小的,在试验中,不放回抽样可近似认为是有放回抽样。,2023/7/30,119,3.总体、样本、样本观察值的关系,总体,样本,样本观察值,?,理论分布,统计是从手中已有的资料样本观察值,去推断总体的情况总体分布。样本是联系两者的桥梁。总体分布决定了样本取值的概率规律,也就是样本取到样本观察值的规律,因而可以用样本观察值去推断总体,1.4.1 随机样本,2023/7/30,120,统计量的定义抽样分布常用统计量及其分布,1.4.2 抽样分布,2023/7/30,121,1.

46、4.2 抽样分布,统计量的定义,如果样本X1,Xn 的函数g(X1,Xn)不含未知参数,则称g(X1,Xn)是总体X的一个统计量.如:,2023/7/30,122,1.4.2 抽样分布,三大抽样分布,统计量的分布称为抽样分布。数理统计中常用到如下三个分布:2分布、t 分布和F分布。,1 2分布,2023/7/30,123,(2)2分布的密度函数f(x)曲线,1.4.2 抽样分布,2023/7/30,124,(3)临界点 设X 2(n),若对于:01,存在,满足,则称,为,分布的临界点。,1.4.2 抽样分布,2023/7/30,125,实际应用中,常常将满足:,的点,称为,分布的上侧临界点。,

47、1.4.2 抽样分布,而将满足:,的点,分布的下侧临界点。,称为,2023/7/30,126,使得:,对于不同的n和a,和,1.4.2 抽样分布,可查2分布表得到。,(4)性质:分布可加性:若X2(n1),Y2(n2),X与Y独立,则X+Y 2(n1+n2),期望与方差:若X 2(n),则E(X)=n,D(X)=2n,2023/7/30,127,1.4.2 抽样分布,三大抽样分布,2 t分布,(1)定理:若N(0,1),2(n),与独立,则,t(n)称为自由度为n的t分布。,(2)t(n)的概率密度为:,2023/7/30,128,1.4.2 抽样分布,(3)基本性质:f(t)关于t=0(纵轴

48、)对称。f(t)的极限为N(0,1)的密度函数,即,表明:当n比较大时(n30),可用标准正态分布代替t分布,2023/7/30,129,(4)临界点设Tt(n),若对:00,满足:P-t(n)Tt(n)=1-,则称t(n)为t(n)的临界点,1.4.2 抽样分布,2023/7/30,130,1.4.2 抽样分布,三大抽样分布,3 F分布,(1)定理:若X2(n1),Y2(n2),X与Y独立,则,称为第一自由度为n1,第二自由度为n2的F分布。其概率密度为,2023/7/30,131,(2)F-分布的临界点,1.4.2 抽样分布,对于:00,满足:PFF/2(n1,n2)=/2,则称F/2(n

49、1,n2)为F分布的上侧临界点;,对于:00,满足:PFF1-/2(n1,n2)=1-/2,则称F1-/2(n1,n2)为F分布的下侧临界点;,总之,使得:PF1-/2(n1,n2)FF/2(n1,n2)=1-,2023/7/30,132,(3)F-分布的性质,1.4.2 抽样分布,证明:设FF(n1,n2),则,2023/7/30,133,1.4.2 抽样分布,常用统计量及其分布,1 样本均值,证明:,由于n 个独立的正态随机变量的线性组合,仍然服从正态分布,2023/7/30,134,1.4.2 抽样分布,常用统计量及其分布,2 样本方差,定理4证明提示:,2023/7/30,135,1.

50、4.2 抽样分布,常用统计量及其分布,2 样本方差,2023/7/30,136,1.4.2 抽样分布,常用统计量及其分布,3 样本矩,2023/7/30,137,点估计 估计量的评选标准 区间估计正态总体参数的区间估计,1.5 参数估计,参数估计问题是一类统计推断问题,指的是在处理实际问题时,采用抽样的方法,从获取的样本数据中提取有用的信息,来对总体的情况进行推断,主要指的是对分布形式已知的总体中的某些未知参数的估计问题。主要内容:,2023/7/30,138,设X1,Xn是总体X的一个样本,其分布函数为F(x;),。其中为未知参数,为参数空间,若统计量g(X1,Xn)可作为的一个估计,则称其

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号