概率与数理统计公式.docx

上传人:牧羊曲112 文档编号:3600555 上传时间:2023-03-14 格式:DOCX 页数:53 大小:50.30KB
返回 下载 相关 举报
概率与数理统计公式.docx_第1页
第1页 / 共53页
概率与数理统计公式.docx_第2页
第2页 / 共53页
概率与数理统计公式.docx_第3页
第3页 / 共53页
概率与数理统计公式.docx_第4页
第4页 / 共53页
概率与数理统计公式.docx_第5页
第5页 / 共53页
亲,该文档总共53页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《概率与数理统计公式.docx》由会员分享,可在线阅读,更多相关《概率与数理统计公式.docx(53页珍藏版)》请在三一办公上搜索。

1、概率与数理统计公式考研必备 第1章 随机事件及其概率 nPm=排列组合公式 nCm=m! 从m个人中挑出n个人进行排列的可能数。 (m-n)!m! 从m个人中挑出n个人进行组合的可能数。 n!(m-n)!加法和乘法原理 加法原理:m+n 某件事由两种方法来完成,第一种方法可由m种方法完成,第二种方法可由n种方法来完成,则这件事可由m+n 种方法来完成。 乘法原理:mn 某件事由两个步骤来完成,第一个步骤可由m种方法完成,第二个步骤可由n 种方法来完成,则这件事可由mn 种方法来完成。 重复排列和非重复排列 对立事件 顺序问题 如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,

2、但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。 试验的可能结果称为随机事件。 在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质: 每进行一次试验,必须发生且只能发生这一组中的一个事件; 任何事件,都是由这一组中的部分事件组成的。 这样一组事件中的每一个事件称为基本事件,用w来表示。 基本事件的全体,称为试验的样本空间,用W表示。 一个事件就是由W中的部分点组成的集合。通常用大写字母A,B,C,表示事件,它们是W的子集。 W为必然事件,为不可能事件。 不可能事件的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件的概率为1,而概率为1

3、的事件也不一定是必然事件。 关系: 如果事件A的组成部分也是事件B的组成部分,:一些常见排列 随机试验和随机事件 基本事件、样本空间和事件 AB 事件的关系与运算 如果同时有AB,BA,则称事件A与事件B等价,或称A等于B:A=B。 A、B中至少有一个发生的事件:AUB,或者A+B。 属于A而不属于B的部分所构成的事件,称为A与B的差,记为A-B,也可表示为A-AB或者AB,它表示A发生而B不发生的事件。 A、B同时发生:AIB,或者AB。AIB=,则表示A与B不可能同时发生,称事件A与事件B互不相容或者互斥。基本事件是互不相容的。 1 / 23 考研必备 W-A称为事件A的逆事件,或称A的对

4、立事件,记为A。它表示A不发生的事件。互斥未必对立。 运算: 结合率:A(BC)=(AB)C A(BC)=(AB)C 分配率:(AB)C=(AC)(BC) (AB)C=(AC)(BC) 德摩根率:i=1IA=UAii=1iAUB=AIB,AIB=AUB 概率的公理化定义 设W为样本空间,A为事件,对每一个事件A都有一个实数P(A),若满足下列三个条件: 1 0P(A)1, 2 P() =1 3 对于两两互不相容的事件A1,A2,有 PUAi=P(Ai)i=1i=1 常称为可列可加性。 则称P(A)为事件A的概率。 1 W=w1,w2Lwn, 2 P(w1)=P(w2)=LP(wn)=1。 n古

5、典概型 设任一事件A,它是由w1,w2Lwm组成的,则有 P(A)=(w1)U(w2)ULU(wm) =P(w1)+P(w2)+L+P(wm) =mA所包含的基本事件数= n基本事件总数几何概型 若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,同时样本空间中的每一个基本事件可以使用一个有界区域来描述,则称此随机试验为几何概型。对任一事件A, P(A)=加法公式 减法公式 L(A)。其中L为几何度量。 L(W)P(A+B)=P(A)+P(B)-P(AB) 当P(AB)0时,P(A+B)=P(A)+P(B) P(A-B)=P(A)-P(AB) 当BA时,P(A-B)=P(A)-P(B)

6、当A=时,P(B)=1- P(B) 定义 设A、B是两个事件,且P(A)0,则称P(AB)为事件A发生条件下,事P(A)条件P(AB)概率 件B发生的条件概率,记为P(B/A)=。 P(A)条件概率是概率的一种,所有概率的性质都适合于条件概率。 2 / 23 考研必备 乘法公式 例如P(/B)=1P(B/A)=1-P(B/A) 乘法公式:P(AB)=P(A)P(B/A) 更一般地,对事件A1,A2,An,若P(A1A2An-1)0,则有 P(A1A2An)=P(A1)P(A2|A1)P(A3|A1A2)P(An|A1A2An-1)。 两个事件的独立性 设事件A、B满足P(AB)=P(A)P(B

7、),则称事件A、B是相互独立的。 若事件A、B相互独立,且P(A)0,则有 P(B|A)=P(AB)P(A)P(B)=P(B)P(A)P(A) 独立性 若事件A、B相互独立,则可得到A与B、A与B、A与B也都相互独立。 必然事件W和不可能事件与任何事件都相互独立。 与任何事件都互斥。 多个事件的独立性 设ABC是三个事件,如果满足两两独立的条件, P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A) 并且同时满足P(ABC)=P(A)P(B)P(C) 那么A、B、C相互独立。 对于n个事件类似。 设事件B1,B2,L,Bn满足 1B1,B2,L,Bn两两互不

8、相容,P(Bi)0(i=1,2,L,n), 全概公式 2则有 AUBii=1n, P(A)=P(B1)P(A|B1)+P(B2)P(A|B2)+L+P(Bn)P(A|Bn)。 设事件B1,B2,Bn及A满足 1 B1,B2,Bn两两互不相容,P(Bi)0,i=1,2,n, 2 则 贝叶斯公式 nAUBii=1,P(A)0, P(Bi/A)=P(Bi)P(A/Bi)P(B)P(A/B)jjj=1n,i=1,2,n。 此公式即为贝叶斯公式。 n),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了伯努利概型 “由果朔因”的推断。 我们作了n次试验,且满足 u 每次试验只有两种可能结果,

9、A发生或A不发生; u n次试验是重复进行的,即A发生的概率每次均一样; 3 / 23 ,通常叫先验概率。P(Bi/A),离散型随机变量的分布律 设离散型随机变量X的可能取值为Xk(k=1,2,)且取各个值的概率,即事件(X=Xk)的概率为 P(X=xk)=pk,k=1,2,,kn 则称上式为离散型随机变量X的概率分布或分布律。有时也用分布列的形式给出: Xx1,x2,L,xk,L|P(X=xk)p1,p2,L,pk,L。 显然分布律应满足下列条件: pk0,k=1,2,L, k=1连续型随机变量的分布密度 pk=1。 设F(x)是随机变量X的分布函数,若存在非负函数f(x),对任意实数x,有

10、 F(x)=f(x)dx-x, 则称X为连续型随机变量。f(x)称为X的概率密度函数或密度函数,简称概率密度。 密度函数具有下面4个性质: 1 f(x)0。 2 +-f(x)dx=1。 离散与连续型随机变量的关系 P(X=x)P(xXx+dx)f(x)dx 积分元f(x)dx在连续型随机变量理论中所起的作用与P(X=xk)=pk在离散型随机变量理论中所起的作用相类似。 4 / 23 考研必备 分布函数 设X为随机变量,x是任意实数,则函数 F(x)=P(Xx) 称为随机变量X的分布函数,本质上是一个累积函数。 P(aXb)=F(b)-F(a) 可以得到X落入区间(a,b的概率。分布函数F(x)

11、表示随机变量落入区间八大分布 0-1分布 二项分布 -f(x)dx 。 P(X=1)=p, P(X=0)=q 在n重贝努里试验中,设事件A发生的概率为p。事件A发生的次数是随机变量,设为X,则X可能取值为0,1,2,L,n。 kkn-kP(X=k)=Pn(k)=Cnpq, 其中q=1-p,0p0,k=0,1,2L, 则称随机变量X服从参数为l的泊松分布,记为Xp(l)或者P(l)。 泊松分布为二项分布的极限分布。 超几何分布 kn-kk=0,1,2L,lCMCN-M P(X=k)=,nl=min(M,n)CN随机变量X服从参数为n,N,M的超几何分布,记为H(n,N,M)。 几何分布 P(X=

12、k)=qk-1p,k=1,2,3,L,其中p0,q=1-p。 随机变量X服从参数为p的几何分布,记为G(p)。 设随机变量X的值只落在a,b内,其密度函数f(x)在a,b上为常数 均匀分布 1,即 b-a1axb ,f(x)=b-a 其他, 0,则称随机变量X在a,b上服从均匀分布,记为XU(a,b)。 分布函数为 0, xb。 当ax1x2b时,X落在区间内的概率为 P(x1Xx2)=x2-x1。 b-a 6 / 23 考研必备 指数分布 f(x)= le-lx, x0, 0, x0,则称随机变量X服从参数为l的指数分布。 X的分布函数为 -lx1-e, x0, F(x)=0, x0。 正态

13、分布 设随机变量X的密度函数为 (x-m)22s2f(x)=12pse-, -x0为常数,s其中m、则称随机变量X服从参数为m、2XN(m,s)。 的正态分布或高斯分布,记为f(x)具有如下性质: 1 f(x)的图形是关于x=m对称的; 2 当x=m时,f(m)=12ps2XN(m,s)若,则X的分布函数为 。 F(x)=12psx-为最大值; (t-m)22s2-edt参数m=0、s=1时的正态分布称为标准正态分布,记为XN(0,1),其密度函数记为x2 1-2j(x)=e2p,-x+, 分布函数为 2p-F(x)是不可求积函数,其函数值,已编制成表可供查用。 1。 2X-m2如果XN(m,

14、s),则N(0,1)。 sx2-mx1-mP(x1ma)a。 离散型 已知X的分布列为 x1,x2,L,xn,LX , P(X=xi)p1,p2,L,pn,LY=g(X)的分布列如下: g(x1),g(x2),L,g(xn),LY, P(Y=yi)p1,p2,L,pn,L若有某些g(xi)相等,则应将对应的pi相加作为g(xi)的概率。 连续型 先利用X的概率密度fX(x)写出Y的分布函数FY(y)P(g(X)y),再利用变上下限积分的求导公式求出fY(y)。 第三章 二维随机变量及其分布 联合分布 离散型 如果二维随机向量x的所有可能取值为至多可列个有序对,则称x为离散型随机量。 设x=的所

15、有可能取值为(xi,yj)(i,j=1,2,L),且事件x=(xi,yj)的概率为pij,称 P(X,Y)=(xi,yj)=pij(i,j=1,2,L) 为x=的分布律或称为X和Y的联合分布律。联合分布有时也用下面的概率分布表来表示: Y X y1 p11 p21 y2 p12 p22 yj p1j p2j x1 x2 M xi M pi1 M M M pij M M M M M 这里pij具有下面两个性质: pij0; 8 / 23 ijpij=1. 考研必备 二维随机变量的本质 边缘分布 x(X=x,Y=y)=x(X=xIY=y) 离散型 X的边缘分布为 Pi=P(X=xi)=pij(i,

16、j=1,2,L); jY的边缘分布为 Pj=P(Y=yj)=pij(i,j=1,2,L)。 i连续型 X的边缘分布密度为 fX(x)=fY(y)=条件分布 离散型 +- f(x,y)dy;Y的边缘分布密度为 +-f(x,y)dx. 在已知X=xi的条件下,Y取值的条件分布为 P(Y=yj|X=xi)=pijpi ;在已知Y=yj的条件下,X取值的条件分布为 P(X=xi|Y=yj)=连续型 独立性 一般型 离散型 pijpj, 连续型条件分布不要求 F(X,Y)=FX(x)FY(y) pij=pipj 有零不独立 若X1,X2,Xm,Xm+1,Xn相互独立, h,g为连续函数,则: h和g相互

17、独立。 特例:若X与Y独立,则:h和g独立。 例如:若X与Y独立,则:3X+1和5Y-2独立。 22两个独立的正态分布的和仍为正态分布。 +s2随机变量的函数 函数分布 Z=X+Y n个相互独立的正态分布的线性组合,仍服从正态分布。 m=Cimi, s2=Ci2si2 ii 9 / 23 考研必备 c2分布 设n个随机变量X1,X2,L,Xn相互独立,且服从标准正态分布,可以证明它们的平方和 W=Xi2 i=1n的分布密度为 nu-1-1u2e2nnf(u)=22G20,u0,u0.我们称随机变量W服从自由度为n的c2分布,记为Wc2(n),其中 n+2-1-xG=xedx. 20所谓自由度是

18、指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。 nc2分布满足可加性:设 Yi-c2(ni), 则 Z=Yic2(n1+n2+L+nk). i=1kt分布 设X,Y是两个相互独立的随机变量,且 XN(0,1),Yc2(n), 可以证明函数 T=的概率密度为 XY/nn+1Gt22f(t)=1+nnnpG2-n+12(-t+). 我们称随机变量T服从自由度为n的t分布,记为Tt(n)。 t1-a(n)=-ta(n) 10 / 23 考研必备 F分布 设Xc2(n1),Yc2(n2),且X与Y独立,可以证明F=X/n1的概率密度函数为 Y/n2n12n1-12-n1+n22n1+n2

19、Gn12f(y)=n1n2n2GG22yn11+yn2,y00,y2) n-2+E(X)=xipi i=1E(X)=-+xfX(x)dx E(Y)=yjpj j=1nE(Y)=-yfY(y)dy 函数的期望 EG(X,Y) EG(X,Y) G(x,yiijj)pij +G(x,y)f(x,y)dxdy +方差 D(X)=xi-E(X)pi 2iD(X)=x-E(X)2fX(x)dx -+D(Y)=xj-E(Y)2pj jD(Y)=y-E(Y)2fY(y)dy -协方差 对于随机变量X与Y,称它们的二阶混合中心矩m11为X与Y的协方差或相关矩,记为sXY或cov(X,Y),即 sXY=E(X-E

20、(X)(Y-E(Y).=EXY-EXEY 与记号sXY相对应,X与Y的方差D与D也可分别记为sXX与sYY。 13 / 23 考研必备 相关系数 对于随机变量X与Y,如果D0, D(Y)0,则称 sXYD(X)D(Y)为X与Y的相关系数,记作rXY。 |r|1,当|r|=1时,称X与Y完全相关:P(X=aY+b)=1 完全相关正相关,当r=1时(a0),负相关,当r=-1时(a0),而当r=0时,称X与Y不相关。 以下五个命题是等价的: rXY=0; cov(X,Y)=0; E(XY)=E(X)E(Y); D(X+Y)=D(X)+D(Y); D(X-Y)=D(X)+D(Y). 协方差的性质 独

21、立和不相关 (i) (ii) (iii) (iv) cov (X, Y)=cov (Y, X); cov(aX,bY)=ab cov(X,Y); cov(X1+X2, Y)=cov(X1,Y)+cov(X2,Y); cov(X,Y)=E(XY)-E(X)E(Y). 若随机变量X与Y相互独立,则rXY=0;反之不真。 第五章 大数定律和中心极限定理 大数定律 Xm 切比雪夫大数定律 设随机变量X1,X2,相互独立,均具有有限方差,且被同一常数C所界:DC(i=1,2,),则对于任意的正数,有 1n1nlimPXi-E(Xi)e=1. nnni=1i=1 特殊情形:若X1,X2,具有相同的数学期望

22、E=,则上式成为 1nlimPX-mei=1. nni=1 14 / 23 考研必备 伯努利大数定律 设是n次独立试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意的正数,有 mlimP-pe=1. nn 伯努利大数定律说明,当试验次数n很大时,事件A发生的频率与概率有较大判别的可能性很小,即 mlimP-pe=0. nn这就以严格的数学形式描述了频率的稳定性。 辛钦大设X1,X2,Xn,是相互独立同分布的随机变量序列,且E数定律 =,则对于任意的正数有 1nlimPX-mei=1. nni=1中心极限定理 列维设随机变量X1,X2,相互独立,服从同一分布,且具有林德伯相同的

23、数学期望和方差:格定理 E(Xk)=m,D(Xk)=s20(k=1,2,L),则随机变量 XN(m,s2n) Yn=Xk=1nk-nmns的分布函数Fn(x)对任意的实数x,有 nX-nmk1k=1limFn(x)=limPx=nnns2p此定理也称为独立同分布的中心极限定理。 棣莫弗拉普拉斯定理 x-e-t22dt. 设随机变量Xn为具有参数n, p(0p0,则 Cp(1-p)knkn-klkk!e-l (n). 其中k=0,1,2,n,。 二项分布的极限分布为泊松分布。 第六章 样本及抽样分布 数理统计的基本概念 总体 在数理统计中,常把被考察对象的某一个指标的全体称为总体。我们总是把总体

24、看成一个具有分布的随机变量。 总体中的每一个单元称为样品。 我们把从总体中抽取的部分样品x1,x2,L,xn称为样本。样本中所含的样品数称为样本容量,一般用n表示。在一般情况下,总是把样本看成是n个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,x1,x2,L,xn表示n个随机变量;在具体的一次抽取之后,x1,x2,L,xn表示n个具体的数值。我们称之为样本的两重性。 样本函数和统计量 设x1,x2,L,xn为总体的一个样本,称 个体 样本 g=g 为样本函数,其中g为一个连续函数。如果g中不包含任何未知参数,则称g为一个统计量。 16 / 23

25、考研必备 常见统计量及其性质 样本均值 1nx=xi. ni=1样本方差 1nS=(xi-x)2. n-1i=12样本标准差 1nS=(xi-x)2. n-1i=1E(X)=m,D(X)=s2n, E(S2)=s2,E(S*2)=2n-12s, n1n2其中S*=(Xi-X),为二阶中心矩。 ni=1正态总体下的四大分布 正态分布 设x1,x2,L,xn为来自正态总体N(m,s2)的一个样本,则样本函数 ut分布 defx-ms/nN(0,1). 2设x1,x2,L,xn为来自正态总体N(m,s)的一个样本,则样本函数 tdefx-ms/nt(n-1), 其中t(n-1)表示自由度为n-1的t

26、分布。 c2分布 设x1,x2,L,xn为来自正态总体N(m,s)的一个样本,则样本函数 2w2def(n-1)S2s2c2(n-1), 2其中c(n-1)表示自由度为n-1的c分布。 17 / 23 考研必备 F分布 设x1,x2,L,xn为来自正态总体N(m,s12)的一个样本,而2y1,y2,L,yn为来自正态总体N(m,s2)的一个样本,则样本函数 F其中 defS12/s12S/s2222F(n1-1,n2-1), 1n1S=(xi-x)2, n1-1i=1211n2S=(yi-y)2; n2-1i=122F(n1-1,n2-1)表示第一自由度为n1-1,第二自由度为n2-1的F分布

27、。 正态总体下分布的性质 X与S2独立。 第七章 参数估计 点估计 矩估计 不要求 18 / 23 考研必备 极大似然估计 当总体X为连续型随机变量时,设其分布密度为f(x;q1,q2,L,qm),其中q1,q2,L,qm为未知参数。又设x1,x2,L,xn为总体的一个样本,称 L(q1,q2,L,qm)=f(xi;q1,q2,L,qm) i=1n为样本的似然函数,简记为Ln. 当总体X为离型随机变量时,设其分布律为PX=x=p(x;q1,q2,L,qm),则称 L(x1,x2,L,xn;q1,q2,L,qm)=p(xi;q1,q2,L,qm) i=1n为样本的似然函数。 若似然函数L(x1,

28、x2,L,xn;q1,q2,L,qm)在q1,q,L,qm处取2到最大值,则称q1,q,L,qm分别为q1,q2,L,qm的最大似然估计值,2相应的统计量称为最大似然估计量。 lnLnqi=0,i=1,2,L,m qi=qi)为g(q)的极大若q为q的极大似然估计,g(x)为单调函数,则g(q似然估计。 估计量的评选标准 无偏性 设q=q(x1,x2,L,xn)为未知参数q的估计量。若E =q,则称 q为q的无偏估计量。 E=E, E=D 有效性 设q1=q1(x1,x,2,L,xn)和q2=q2(x1,x,2,L,xn)是未知参数q的两个无偏估计量。若D(q1)e)=0, 则称qn为q的一致

29、估计量。 )0(n),则q为q的一致估计。 若q为q的无偏估计,且D(q只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。 区置信区间估计 间和置信度 设总体X含有一个待估的未知参数q。如果我们从样本x1,x,2,L,xn出发,找出两个统计量q1=q1(x1,x,2,L,xn)与q2=q2(x1,x,2,L,xn)(q1q2),使得区间q1,q2以1-a(0al(或Kl)时否定H0,否则认为H0相容。 两类错误 第一类错误 当H0为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定H0。这时,我们把客观上H0成立判为H0为不成立,称这种错误为“

30、以真当假”的错误或第一类错误,记a为犯此类错误的概率,即 P否定H0|H0为真=a; 此处的恰好为检验水平。 当H1为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受H0。这时,我们把客观上H0。不成立判为H0成立,称这种错误为“以假当真”的错误或第二类错误,记b为犯此类错误的概率,即 P接受H0|H1为真=b。 两类错误的关系 人们当然希望犯两类错误的概率同时都很小。但是,当容量n一定时,a变小,则b变大;相反地,b变小,则a变大。取定a要想使b变小,则必须增加样本容量。 在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平。大小的选取应根据实际情况而定。当我们宁

31、可“以假为真”、而不愿“以真当假”时,则应把取得很小,如0.01,甚至0.001。反之,则应把取得大些。 单正态总体均值和方差的假设检验 22 / 23 第二类错误 考研必备 条件 零假设 统计量 对应样本 函数分布 否定域 H0:m=m0 已知s 2|u|uU=x-m01-a2H0:mm0 H0:mm0 H0:m=m0 s0/nN uu1-a utT=x-m0S/n1-a2(n-1) 未知s 2H0:mm0 H0:mm0 t(n-1) tt1-a(n-1) t-t1-a(n-1) 2wk21-a2(n-1)k2(n-1) H0:ss220 wk12-a(n-1) 2wka(n-1) 2 H0:s2s0 23 / 23

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号