《概率论与数理统计复习大全.docx》由会员分享,可在线阅读,更多相关《概率论与数理统计复习大全.docx(33页珍藏版)》请在三一办公上搜索。
1、第1章随机事件及其概率(1)排列组合公式P:=加从m个人中挑出n个人进行排列的可能数。(tn-n)!C:=-从m个人中挑出n个人进行组合的可能数。n(m-n)(2)加法和乘法原理加法原理(两种方法均能完成此事):m+n某件事由两种方法来完成,第一种方法可由m种方法完成,第二种方法可由n种方法来完成,那么这件事可由m+n种方法来完成。乘法原理(两个步骤分别不能完成这件事):mn某件事由两个步骤来完成,第一个步骤可由Di种方法完成,第二个步骤可由n种方法来完成,那么这件事可由mXn种方法来完成。(3)一些常见排列重复排列和非重复排列(有序)对立事件(至少有一个)顺序问题(4)随机试验和随机事件如果
2、一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,那么称这种试验为随机试验。试验的可能结果称为随机事件。(5)根本领件、样本空间和事件在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质:每进行一次试验,必须发生且只能发生这一组中的一个事件;任何事件,都是由这一组中的局部事件组成的。这样一组事件中的每一个事件称为根本领件,用0来表示。根本领件的全体,称为试验的样本空间,用C表示。一个事件就是由中的局部点(根本领件)组成的集合。通常用大写字母/1,B,G表示事件,它们是C的子集。Q为必然事件,。为不可能事件。不可
3、能事件(0)的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件(Q)的概率为1,而概率为1的事件也不一定是必然事件。(6)事件的关系与运算关系:如果事件A的组成局部也是事件8的组成局部,(力发生必有事件H发生):AUB如果同时有AuB,BA,那么称事件力与事件8等价,或称力等于8A=B.A.8中至少有一个发生的事件:IU8或者小尻属于/1而不属于3的局部所构成的事件,称为/1与8的差,记为也可表示为或者A5,它表示力发生而占不发生的事件。A.4同时发生:Ji9,或者力尻AB=0,那么表示A与B不可能同时发生,称事件A与事件B互不相容或者互斥。根本领件是互不相容的。C-A称为事件A的
4、逆事件,或称A的对立事件,记为入。它表示A不发生的事件。互斥未必对立。运算:结合率:A(BC)=(AB)CAU(BUC)=(AUB)UC分配率:(AB)UC=(AUC)(BUC)(AUB)C=(AC)U(BC)A=A德摩根率:=i=AUB=AnB,AnB=AUB(7)概率的公理化定义设。为样本空间,A为事件,对每一个事件A都有一个实数p(八),假设满足以下三个条件:lo0P(八)l,2oP(Q)=13对于两两互不相容的事件A,A2,有彳0小丑P(八)V=I7/=I常称为可列(完全)可加性。那么称P(八)为事件A的概率。(8)古典概型loQ=M,g%,2oPgI)=PM)=P)=-on设任一事件
5、A,它是由。1,幻2组成的,那么有尸=)U(g)UU(%)=P)+P(g)+P(%)_m_A所包含的基本事件数一一基本事件总数(9)几何概型假设随机试验的结果为无限不可数并且每个结果出现的可能性均匀,同时样本空间中的每一个根本领件可以使用一个有界区域来描述,那么称此随机试验为几何概型。对任一事件A,P(八)=。其中L为几何度量(长度、面积、体积)。1.(C)(10)加法公式P(A+B)=P(八)+P(B)-P(AB)当P(AB)=O时,P(A+B)=P(八)+P(B)(11)减法公式P(A-B)=P(八)-P(AB)当BUA时,P(A-B)=P(八)-P(B)当A=C时,P()=l-P(B)(
6、12)条件概率定义设A、B是两个事件,且P(八)O,那么称C股为事件A发生条件下,P(八)事件B发生的条件概率,记为P(8A)=C殁P(八)条件概率是概率的一号,所有概率的性质都适合于条件概率。例如P(Q/B)=I=P(5)=I-P(B)(13)乘法公式乘法公式:P(AB)=P(八)P(BZA)更一般地,对事件A”A2,-An,假设P(A也AnT)0,那么有P(A1A2.A”)=P(八)P(A21A1)P(A31AiA2)P(A,lAiA2.An-1)(14)独立性两个事件的独立性设事件A、8满足P(AB)=P(八)P(8),那么称事件A、B是相互独立的。假设事件A、8相互独立,且P(八),那
7、么有P(BIA)二还-P(八)P二P(八)P(八)假设事件A、8相互独立,那么可得到N与3、A与石、N与否也都相互独立。必然事件。和不可能事件0与任何事件都相互独立。0与任何事件都互斥。多个事件的独立性设ABC是三个事件,如果满足两两独立的条件,P(AB)=P(八)P(B)sP(BC)=P(B)P(C);P(CA)=P(C)P(八)并且同时满足P(ABC)=P(八)P(B)P(C)那么A、B、C相互独立。对于n个事件类似。(15)全概公式设事件8,氏,所满足lo,8”两两互不相容,P(Bi)0(/=1,2,w),AUOBi2o/=I,那么有P(八)=P(Bi)P(八)Bi)+P(2)P(A|&
8、)+P(8,)P(AB,.)。(16)贝叶斯公式设事件8,&,,&及4满足loBi,B2,后两两互不相容,P(Bi)o,i=lf2,,nAUUB2。Y,P()Of那么P(Bm=,P(B)P(AIBi),E2,NP(Bj)P(A/BQj=l此公式即为贝叶斯公式。P(Bi),(i=l,2,),通常叫先验概率。P(BiA)t(i=l,2,,),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。(17)伯努利概型我们作了次试验,且满足 每次试验只有两种可能结果,A发生或A不发生; 次试验是重复进行的,即A发生的概率每次均一样; 每次试验是独立的,即每次试验A发生与否与其
9、他次试验A发生与否是互不影响的。这种试验称为伯努利概型,或称为重伯努利试验。用P表示每次试验A发生的概率,那么.发生的概率为=4,用PMk)表示重伯努利试验中4出现以A)次的概率,PAQ=CpkqZ,4=o,2,第二章随机变量及其分布(1)离散型随机变量的分布律设离散型随机变量X的可能取值为Xk(k=l,2,)且取各个值的概率,即事件(X=Xk)的概率为P(X=Xk)=Pk,k=l,2,,那么称上式为离散型随机变量X的概率分布或分布律。有时也用分布列的形式给出:XIX,X2,XjI,P(X=Xk)pi,p2,,p%。显然分布律应满足以下条件:定Pk=I(1)Pk,k=12,念o(2)连续型随机
10、变量的分布密度设厂(X)是随机变量X的分布函数,假设存在非负函数f(x),对任意实数X,有尸(X)=IJ(X那么称X为连续型随机变量。/(幻称为X的概率密度函数或密度函数,简称概率密度。密度函数具有下面4个性质:1。oo2。3L离散与连续型随机变量的关系P(X=x)P(xXx+dx)f(x)dx积分元fxdx在连续型随机变量理论中所起的作用与P(X=Xk)=Pk在离散型随机变量理论中所起的作用相类似。(4)分布函数设X为随机变量,X是任意实数,那么函数F(x)=P(Xx)称为随机变量X的分布函数,本质上是一个累积函数。P(aXb)=F(b)-F(a)可以得到X落入区间(4切的概率。分布函数尸(
11、X)表示随机变量落入区间(-8,内的概率。分布函数具有如下性质:OF(x)1,x+;尸(X)是单调不减的函数,即X1+Q04oF(x+0)=F(x),即F(X)是右连续的;5oP(X=x)=F(x)-F(x-O)o对于离散型随机变量,F(x)=Zp;X对于连续型随机变量,F(x)=(x)d.八大分布0-1分布P(X=I)=P,P(X=O)=Q二项分布在重贝努里试验中,设事件4发生的概率为P。事件A发生的次数是随机变量,设为X,那么X可能取值为0,1,2,P(X=k)=P*k)=C)kqn,其中7=1-p,0p0,Z=OJ,2,女!那么称随机变量X服从参数为4的泊松分布,记为X(%)或者P(4)
12、。泊松分布为二项分布的极限分布(np=,n-*)o超几何分布CtCtL=O,1,2P(X=k)=3一上业,CJI=min(,n)随机变量X服从参数为n,N,M的超几何分布,记为H(n,N,M)。几何分布P(X=Z)二夕ip,%=1,2,3,,其中p20,q=l-po随机变量X服从参数为P的几何分布,记为G(p)。均匀分布设随机变量X的值只落在a,b内,其密度函数/*)在a,b上为常数一,即b-aaxbm,其他,那么称随机变量X在a,b上服从均匀分布,记为XU(a,b)o分布函数为0,xb当aWxx2Wb时,X落在区间(西,工2)内的概率为P(x1XX2)=ob-a指数分布”成弋x0,/()=n
13、I0,无。,其中丸那么称随机变量X服从参数为4的指数分布。X的分布函数为弋x0产(F0IU,0o记住积分公式:+00xnexdx=n.0正态分布设随机变量X的密度函数为/(x)=j-x0为常数,那么称随机变量X服从参数为、。的正态分布或高斯(Gauss)分布,记为XN(q2)。/()具有如下性质:1。 f(x)的图形是关于X=对称的;2当一时,f(/)=.为最大值;,y2假设XRyXUr嘛么X的分布函数为F(X)=Ie2dt2cJ-OO参数二、。=1时的正态分布称为标准正态分布,记为XN(叫其素度函数记为(x)=-r=e272,+,分布函数为1 XZ(X)=fe2dtO2r(幻是不可求积函数,
14、其函数值,已编制成表可供查用。(-)=1-(x)且(O)=o?如果XN(q2),那么壬LWN(OJ)。D/V/zx2一/为一、P(Xlfx)=a.(7)函数分布离散型X的分布列为XXI,X2,,Xn,9P(X=Xi)pi,P2,,P”,y=g(X)的分布列(匕=g(j)互不相等)如下:Yg(x),g(X2),,g(x),假!殳有蓝g扁相劈那藐磁f应而Pj相加作为g(i)的概率。连续型先利用X的概率密度f(x)写出Y的分布函数F(y)=PQ(X)Wy),再利用变上下限积分的求导公式求出fv(y)。第三章二维随机变量及其分布(1)联合分布离散型如果二维随机向量J(X,Y)的所有可能取值为至多可列个
15、有序对(,y),那么称J为离散型随机量。设4=(X,Y)的所有可能取值为(%X)(3=12),且事件=(i,yj)的概率为P-称P(X,Y)=(xi9yj)=pij(z,j=1,2,.)为J=(X,Y)的分布律或称为X和丫的联合分布律。联合分布有时也用下面的概率分布表来表示:工yY2YjXiPuPl2PiJX2P21P22P2jXiPiPo*这里RJ具有下面两个,(1)RJ20(i,j=l,2Pij=Lij性质:连续型对于二维随机向量g=(x,y),如果存在非负函数f(.y)(-+-y+),使对任意一个其邻边分别平行于坐标轴的矩形区域D,即D=(X,Y)axb,cyd有P(X,Y)三D=f(x
16、,y)dxdy,D那么称g为连续型随机向量;并称f(x,y)为J=(X,Y)的分布密度或称为X和Y的联合分布密度。分布密度f(x,y)具有下面两个性质:(1) f(x,y)20;(2) /O,y)dxdy=1.(2)二维随机变量的本质(X=,Y=y)=(X=Y=y)(3)联合分布函数设(X,Y)为二维随机变量,对于任意实数x,y,二元函数F(x,y)=PXxfYy称为二维随机向量(X,Y)的分布函数,或称为随机变量X和Y的联合分布函数。分布函数是一个以全平面为其定义域,以事件(i92)I-8X(例)x,yox时,有F(x2,y)2F(x,y);当y2y】时,有F(x,y?)2F(x,y);(3
17、) F(x,y)分别对X和y是右连续的,即尸ay)=/(X+O,y),F(x,y)=F(x,y+0);(4) F(-,-)=F(-,y)=F(x,-)=O,F(+,+)=1.(5)对于项,Jiy2,F(X2,必)一尸。2,J)-F(x1,y2)+(x1,yl)0.(4)离散型与连续型的关系P(X=fY=y)P(xXx+dfy0,%o,m是5个参数,那么称(X,Y)服从二维正态分布,记为(X,Y)N(x,2,1,p).由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,即XN(,er:),17N11).但是假设XN(M,b:),yN(2,&),(X,Y)未必是二维正态分布。(1
18、0)函数分布Z=X+Y根据定义计算:尸Z(Z)=P(Zz)=P(X+Yz)-W对于连续型,fz(z)=(x,z-x)一OO两个独立的正态分布的和仍为正态分布(从+2,12+j)0n个相互独立的正态分布的线性组合,仍服从正态分布。=CM,2=EC;a;Z=max,min(Xi,X2,-Xn)假设X,X2X”相互独立,其分布函数分别为Fx(x),F(x)F(x),那么Z=max,min(X1,X2,Xn)的分人I人2布函数为:FmaXa)=Aa)&(幻Fmina)=1-1-仁WK1厚(切1-F*(X)/分布设n个随机变量X1,X2,X,l相互独立,且服从标准正态分布,可以证明它们的平方和的分布密度
19、为W=1=1f()=,我们称随机变量W服从其:中(所谓自由度是指独分布中的一个重要参数/2分布满足日那么z=y,1=11 -I-u2e2M0,2调0,M0.自由度为nf2分布,记为W2(zl),、立正态随机变量的个数,它是随机变量O丁加性:设工-%2(4),(%+%+%)t分布设X,Y是两个可以证明函数的概率密度为=-f我们称随机变直J)=一。相互独二XC祁I:T服从*工的随机多N(0,l),IT=-F(f2Rn)自由度为缰,且XUn1+1(-8t+).n的t分布,记为Tt(n)。F分布设二F=-Y/r2(21),K-Z2(H2),且X与Y独立,可以证明的概率密度函数为I22、,卜、)2/(y
20、)=我们称随的F分布K-a(%.豆机变量F,记为Fn2)=-2F/rW2k、服从f(r1式场,、J11JJ-vni)n2)0,y2)n-2(5)二维随机变量的数字特征期望E(X)=N%Pi.=lE(Y)=5/;=130E(X)=IVX*)公-OO+00E(Y)=yf(y)dy-函数的期望EG(XfY)=XZG(如匕)P初ijEG(X,y)=-KO+00G(x9y)(x,y)dxdy-8-8方差O(X)=Z区-E(X)2pj.iD(Y)=jxj-E(Y)2P.jjO(X)=JX-E(X)FyX(X)公-QOD(Y)=y-E(X)Yfydy-QO协方差对于随机变量X与Y,称它们的二阶混合中心矩4”
21、为X与Y的协方差或相关矩,记为by或CoV(X,丫),即xr=An=E(X-E(X)(Y-E(Y).与记号by相对应,X与Y的方差D(X)与D(Y)也可分别记为b与YY0相关系数对于随机变量X与Y,如果D(X)0,D(Y)0,那么称gX)yD(Y)为X与Y的相关系数,记作PXy有时可简记为夕pWl,当IPUl时,称X与丫完全相关:P(X=4Y+)=l人相并正相关,当=1时(),兀负相关,郢=7时(。切比雪夫大数定律设随机变量Xl,X2,相互独立,均具有有限方差,且被同一常数C所界:D(%)C(i=l,2,),那么对于任意的正数,有lim4-YX.-y(X/-81汨白),=1特殊情形:假设X”X
22、2,具有相同的数学期望E(Xi)=IimdaXiT8I普m-pX2,Xn,(Xn)=P,那么对一Iim71-YXf-是相互独立同分布的随机变量序列,且E二任意的正数有Cd=L(2)中心极限定理2XN(,-)n列维一林德伯格定理设随机变量Xh相同的数E(Xk)=%D(Xk)Xz,相互独立,服从同一分布,且具有学期望和方差:=20(=l,2,),那么随机变量xx-fV_*=1n的分布函数Q(X)对任意的实数X,有汽X人-叩IimFw(X)=IimP11三=x8,2此定理也称为独立同分布的中心极限定理L棣莫弗一拉普拉斯定理设随机变量X.为具有参数n,p(Op0,那么Cpk(-p)n-k-eS8).k
23、其中k=0,L2,n,。二项分布的极限分布为泊松分布。第六章样本及抽样分布m数理统计的根本概念总体在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体)。我们总是把总体看成一个具有分布的随机变量(或随机向量)。个体总体中的每一个单元称为样品(或个体)。样本我们把从总体中抽取的局部样品用,,X称为样本。样本中所含的样品数称为样本容量,一般用n表示。在一般情况下,总是把样本看成是n个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,西,了2,,表示n个随机变量(样本);在具体的一次抽取之后,七,X表示n个具体的数值(样本值)。我们称之
24、为样本的两重性。样本函数和统计量设再,它,.为总体的一个样本,称=(x1,x2,xn)为样本函数,其中0为一个连续函数。如果伊中不包含任何未知参数,那么称0(x1,x2,xn)为一个统计量。常见统计量及其性质样本均值x=-Yxr样本方差1S?=-X)2.11Ti=I样本标准差S=JMS(七一1)2.样本k阶原点矩1”Mk=m=l,2,.,=1样本k阶中心矩1-M,k=-Y(xi-)a=2,3./=I(T2E(X)=tD(X)=,nE(52)=2,E(S*2)=2,n其中S*?豆(Xj-二)2,为二阶中心矩。/=I(2)正态总体下的四大分布正态分布设修,为来自正态总体N(q2)的一个样本,那么样
25、本函数defX-UU-%N(0,1)./ynt分布设再,斗,再,为来自正态总体N(q2)的一个样本,那么样本函数d“X-Uz1.广t(n-1),SZn其中t(n-l)表示自由度为nT的t分布。/分布设再,看,五为来自正态总体N(,2)的一个样本,那么样本函数(n-i)5221.2(1),4其中2(一1)表示自由度为n-1的:分布。F分布设修,修,为来自正态总体N(,b;)的一个样本,而凹,必,尤为来自正态总体的一个样本,那么样本函数尸一J/1,2IS21其中S:=x)2,S;=(乃y)2;%-L=In2-Ii=IF(n1-1,h2-1)表示第一自由度为-1,第二自由度为%-1的F分布。(3)正
26、态总体下分布的性质歹与S2独立。第七章参数估计点估计矩估计设总体X的分布中包含有未知数仇力2,仇”,那么其分布函数可以表成尸(耳仇岛,/),它的k阶原点矩匕=E(X,(无=12,中也包含了未知参数4,%,内,即)=)(4,/,/)。又设为,工2,,为总体X的11个样本值,其样本的k阶原点矩为,七斗(Z=I2,m)./=I这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原那么建立方程,即有匕(百点,Q)=Lt苍,ni=lv2(2m)=-lx,n1Ln/=IA由上面的m个方程中,解出的m个未知参数,4.)即为参数(4,内)的矩估计量。假设)为夕的矩估计,g(x)为连续函数,那么g(
27、J)为g(6)的矩估计。极大似然估计当总体X为连续型随机变量时,设其分布密度为/(*,仇,4),其中。,仇,4为未知参数。又设X,%2,X”为总体的一个样本,称3a4)=If(4,2,4)(4)=一00那么称“为。的一致估计量(或相合估计量)。假设)为夕的无偏估计,且-0(8),那么3为。的一致估计。只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。区间估计置信区间和置信度设总体X含有一个待估的未知参数。如果我们从样本再,X,2,,匕出发,找出两个统计量4=4*2,2,与)与62=62(x1,x,2,xzj)(6,2),使得区间i,2以l-(0l)的概率包
28、含这个待估参数。,即p*e4=-,那么称区间用,2为夕的置信区间,l-为该区间的置信度(或置信水平)。单正态总体的期望和方差的区间估计设x,x,2,x”为总体XN(4,2)的一个样本,在置信度为l-a下,我们来确定和a?的置信区间仇,。具体步骤如下:(i)选择样本函数;(ii)由置信度l-,查表找分位数;(iii)导出置信区间仇,。2。方差,估计均值(I)选择样本函数U=%7N(0J)Croyn(ii)查表找分位数P-=A=1-of.IOOg)(iii)导出置信区间_Nnn未知方差,估计均值(i)选择样本函数t=3t(n-V).S/411(ii)查表找分位数-=-a.SlJn(iii)导出置信
29、区间Hyn方差的区间估计(W(川(i)选择样本函数(n-)S22.n=2K(1).ii)查表找分位数1/-1斤V1N4)4jict.iii)导出。的置信区间符科第八章假设检验根本思想假设检验的统计思想是,概率很小的事件在一次试验中可以认为根本上是不会发生的,即小概率原理。为了检验一个假设“是否成立。我们先假定/%是成立的。如果根据这个假定导致了一个不合理的事件发生,那就说明原来的假定是不正确的,我们拒绝接受/%;如果由此没有导出不合理的现象,那么不能拒绝接受,我们称是相容的。与/%相对的假设称为备择假设,用/4表示。这里所说的小概率事件就是事件K,其概率就是检验水平,通常我们取a=0.05,有时也取0.01或0.10。根本步骤假设检验的根本步骤如下:(