《概率论与数理统计公式整理.docx》由会员分享,可在线阅读,更多相关《概率论与数理统计公式整理.docx(21页珍藏版)》请在三一办公上搜索。
1、概率论与数理统计公式整理第1章 随机事件及其概率 排列组合公式 从m个人中挑出n个人进行排列的可能数。 从m个人中挑出n个人进行组合的可能数。 加法和乘法原理 加法原理:m+n 某件事由两种方法来完成,第一种方法可由m种方法完成,第二种方法可由n种方法来完成,则这件事可由m+n 种方法来完成。 乘法原理:mn 某件事由两个步骤来完成,第一个步骤可由m种方法完成,第二个步骤可由n 种方法来完成,则这件事可由mn 种方法来完成。 一些常见排列 重复排列和非重复排列 对立事件 顺序问题 随机试验和随机事件 如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能
2、断言它出现哪个结果,则称这种试验为随机试验。 试验的可能结果称为随机事件。 基本事件、样本空间和事件 在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质: 每进行一次试验,必须发生且只能发生这一组中的一个事件; 任何事件,都是由这一组中的部分事件组成的。 这样一组事件中的每一个事件称为基本事件,用来表示。 基本事件的全体,称为试验的样本空间,用表示。 一个事件就是由中的部分点组成的集合。通常用大写字母A,B,C,.表示事件,它们是的子集。 为必然事件,?为不可能事件。 不可能事件的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件的概率为1,而概率为1的事件
3、也不一定是必然事件。 事件的关系与运算 关系: 如果事件A的组成部分也是事件B的组成部分,: 如果同时有,则称事件A与事件B等价,或称A等于B:A=B。 A、B中至少有一个发生的事件:AB,或者A+B。 属于A而不属于B的部分所构成的事件,称为A与B的差,记为A-B,也可表示为A-AB或者,它表示A发生而B不发生的事件。 A、B同时发生:AB,或者AB。AB=?,则表示A与B不可能同时发生,称事件A与事件B互不相容或者互斥。基本事件是互不相容的。 -A称为事件A的逆事件,或称A的对立事件,记为。它表示A不发生的事件。互斥未必对立。 运算: 结合率:A(BC)=(AB)C A(BC)=(AB)C
4、 分配率:(AB)C=(AC)(BC) (AB)C=(AC)(BC) 德摩根率: , 概率的公理化定义 设为样本空间,为事件,对每一个事件都有一个实数P(A),若满足下列三个条件: 1 0P(A)1, 2 P() =1 3 对于两两互不相容的事件,.有 常称为可列可加性。 则称P(A)为事件的概率。 古典概型 1 , 2 。 设任一事件,它是由组成的,则有 P(A)= = 几何概型 若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,同时样本空间中的每一个基本事件可以使用一个有界区域来描述,则称此随机试验为几何概型。对任一事件A, 。其中L为几何度量。 加法公式 P(A+B)=P(A)+
5、P(B)-P(AB) 当P(AB)0时,P(A+B)=P(A)+P(B) 减法公式 P(A-B)=P(A)-P(AB) 当BA时,P(A-B)=P(A)-P(B) 当A=时,P=1- P(B) 条件概率 定义 设A、B是两个事件,且P(A)0,则称为事件A发生条件下,事件B发生的条件概率,记为。 条件概率是概率的一种,所有概率的性质都适合于条件概率。 例如P(/B)=1P(/A)=1-P(B/A) 乘法公式 乘法公式: 更一般地,对事件A1,A2,.An,若P(A1A2.An-1)0,则有 .。 独立性 两个事件的独立性 设事件、满足,则称事件、是相互独立的。 若事件、相互独立,且,则有 若事
6、件、相互独立,则可得到与、与、与也都相互独立。 必然事件和不可能事件?与任何事件都相互独立。 ?与任何事件都互斥。 多个事件的独立性 设ABC是三个事件,如果满足两两独立的条件, P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A) 并且同时满足P(ABC)=P(A)P(B)P(C) 那么A、B、C相互独立。 对于n个事件类似。 全概公式 设事件满足 1两两互不相容, 2, 则有 。 贝叶斯公式 设事件,.,及满足 1 ,.,两两互不相容,0,1,2,., 2 , 则 ,i=1,2,.n。 此公式即为贝叶斯公式。 ,通常叫先验概率。,通常称为后验概率。贝叶斯
7、公式反映了因果的概率规律,并作出了由果朔因的推断。 伯努利概型 我们作了次试验,且满足 * 每次试验只有两种可能结果,发生或不发生; * 次试验是重复进行的,即发生的概率每次均一样; * 每次试验是独立的,即每次试验发生与否与其他次试验发生与否是互不影响的。 这种试验称为伯努利概型,或称为重伯努利试验。 用表示每次试验发生的概率,则发生的概率为,用表示重伯努利试验中出现次的概率, ,。 第二章 随机变量及其分布 离散型随机变量的分布律 设离散型随机变量的可能取值为Xk(k=1,2,.)且取各个值的概率,即事件(X=Xk)的概率为 P(X=xk)=pk,k=1,2,., 则称上式为离散型随机变量
8、的概率分布或分布律。有时也用分布列的形式给出: 。 显然分布律应满足下列条件: , 。 连续型随机变量的分布密度 设是随机变量的分布函数,若存在非负函数,对任意实数,有 , 则称为连续型随机变量。称为的概率密度函数或密度函数,简称概率密度。 密度函数具有下面4个性质: 1 。 2 。 离散与连续型随机变量的关系 积分元在连续型随机变量理论中所起的作用与在离散型随机变量理论中所起的作用相类似。 分布函数 设为随机变量,是任意实数,则函数 称为随机变量X的分布函数,本质上是一个累积函数。 可以得到X落入区间的概率。分布函数表示随机变量落入区间八大分布 0-1分布 P(X=1)=p, P(X=0)=
9、q 二项分布 在重贝努里试验中,设事件发生的概率为。事件发生的次数是随机变量,设为,则可能取值为。 , 其中, 则称随机变量服从参数为,的二项分布。记为。 当时,这就是分布,所以分布是二项分布的特例。 泊松分布 设随机变量的分布律为 , 则称随机变量服从参数为的泊松分布,记为或者P。 泊松分布为二项分布的极限分布。 超几何分布 随机变量X服从参数为n,N,M的超几何分布,记为H(n,N,M)。 几何分布 ,其中p0,q=1-p。 随机变量X服从参数为p的几何分布,记为G(p)。 均匀分布 设随机变量的值只落在a,b内,其密度函数在a,b上为常数,即 其他, 则称随机变量在a,b上服从均匀分布,
10、记为XU(a,b)。 分布函数为 当ax1x2b时,X落在区间内的概率为 。 指数分布 其中,则称随机变量X服从参数为的指数分布。 X的分布函数为 记住积分公式: 正态分布 设随机变量的密度函数为 , , 其中、为常数,则称随机变量服从参数为、的正态分布或高斯分布,记为。 具有如下性质: 1 的图形是关于对称的; 2 当时,为最大值; 若,则的分布函数为 。 参数、时的正态分布称为标准正态分布,记为,其密度函数记为 , 分布函数为 。 是不可求积函数,其函数值,已编制成表可供查用。 (-x)1-(x)且(0)。 如果,则。 。 分位数 下分位表:; 上分位表:。 函数分布 离散型 已知的分布列
11、为 , 的分布列如下: , 若有某些相等,则应将对应的相加作为的概率。 连续型 先利用X的概率密度fX(x)写出Y的分布函数FY(y)P(g(X)y),再利用变上下限积分的求导公式求出fY(y)。 第三章 二维随机变量及其分布 联合分布 离散型 如果二维随机向量的所有可能取值为至多可列个有序对,则称为离散型随机量。 设=的所有可能取值为,且事件=的概率为pij,称 为=的分布律或称为X和Y的联合分布律。联合分布有时也用下面的概率分布表来表示: Y X y1 y2 . yj . x1 p11 p12 . p1j . x2 p21 p22 . p2j . xi pi1 . . 这里pij具有下面两
12、个性质: pij0; 连续型 对于二维随机向量,如果存在非负函数,使对任意一个其邻边分别平行于坐标轴的矩形区域D,即D=(X,Y)|axb,cyx1时,有FF(x1,y);当y2y1时,有F(x,y2) F(x,y1); F分别对x和y是右连续的,即 对于 . 离散型与连续型的关系 边缘分布 离散型 X的边缘分布为 ; Y的边缘分布为 。 连续型 X的边缘分布密度为 Y的边缘分布密度为 条件分布 离散型 在已知X=xi的条件下,Y取值的条件分布为 在已知Y=yj的条件下,X取值的条件分布为 连续型 在已知Y=y的条件下,X的条件分布密度为 ; 在已知X=x的条件下,Y的条件分布密度为 独立性
13、一般型 F(X,Y)=FX(x)FY(y) 离散型 有零不独立 连续型 f(x,y)=fX(x)fY(y) 直接判断,充要条件: 可分离变量 正概率密度区间为矩形 二维正态分布 0 随机变量的函数 若X1,X2,.Xm,Xm+1,.Xn相互独立, h,g为连续函数,则: h和g相互独立。 特例:若X与Y独立,则:h和g独立。 例如:若X与Y独立,则:3X+1和5Y-2独立。 二维均匀分布 设随机向量的分布密度函数为 其中SD为区域D的面积,则称服从D上的均匀分布,记为U。 例如图3.1、图3.2和图3.3。 y 1 D1 O 1 x 图3.1 y 1 O 2 x 图3.2 y d c O a
14、b x 图3.3 二维正态分布 设随机向量的分布密度函数为 其中是5个参数,则称服从二维正态分布, 记为N函数分布 Z=X+Y 根据定义计算: 对于连续型,fZ(z) 两个独立的正态分布的和仍为正态分布。 n个相互独立的正态分布的线性组合,仍服从正态分布。 , Z=max,min(X1,X2,.Xn) 若相互独立,其分布函数分别为,则Z=max,min(X1,X2,.Xn)的分布函数为: 分布 设n个随机变量相互独立,且服从标准正态分布,可以证明它们的平方和 的分布密度为 我们称随机变量W服从自由度为n的分布,记为W,其中 所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数
15、。 分布满足可加性:设 则 t分布 设X,Y是两个相互独立的随机变量,且 可以证明函数 的概率密度为 我们称随机变量T服从自由度为n的t分布,记为Tt(n)。 F分布 设,且X与Y独立,可以证明的概率密度函数为 我们称随机变量F服从第一个自由度为n1,第二个自由度为n2的F分布,记为Ff(n1, n2). 第四章 随机变量的数字特征 一维随机变量的数字特征 离散型 连续型 期望 期望就是平均值 设X是离散型随机变量,其分布律为Ppk,k=1,2,.,n, 设X是连续型随机变量,其概率密度为f(x), 函数的期望 Y=g(X) Y=g(X) 方差 D(X)=EX-E(X)2, 标准差 , 矩 对
16、于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即 k=E(Xk)= , k=1,2, . 对于正整数k,称随机变量X与E差的k次幂的数学期望为X的k阶中心矩,记为,即 =, k=1,2, . 对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即 k=E(Xk)= k=1,2, . 对于正整数k,称随机变量X与E差的k次幂的数学期望为X的k阶中心矩,记为,即 = k=1,2, . 切比雪夫不等式 设随机变量X具有数学期望E=,方差D=2,则对于任意正数,有下列切比雪夫不等式 切比雪夫不等式给出了在未知X的分布的情况下,对概率 的一种估计,它在理论上有
17、重要意义。 期望的性质 E(C)=C E(CX)=CE(X) E(X+Y)=E(X)+E(Y), E(XY)=E(X) E(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。 方差的性质 D(C)=0;E(C)=C D(aX)=a2D(X); E(aX)=aE(X) D(aX+b)= a2D(X); E(aX+b)=aE(X)+b D(X)=E(X2)-E2(X) D(XY)=D(X)+D(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。 D(XY)=D(X)+D(Y) 2E(X-E(X)(Y-E(Y),无条件成立。 而E(X+Y)=E(X)+E(Y),无条件成立。 常见分布的期望和
18、方差 期望 方差 0-1分布 p 二项分布 np 泊松分布 几何分布 超几何分布 均匀分布 指数分布 正态分布 n 2n t分布 0 (n2) 二维随机变量的数字特征 期望 函数的期望 方差 协方差 对于随机变量X与Y,称它们的二阶混合中心矩为X与Y的协方差或相关矩,记为,即 与记号相对应,X与Y的方差D与D也可分别记为与。 相关系数 对于随机变量X与Y,如果D0, D(Y)0,则称 为X与Y的相关系数,记作。 |1,当|=1时,称X与Y完全相关: 完全相关 而当时,称X与Y不相关。 以下五个命题是等价的: ; cov(X,Y)=0; E(XY)=E(X)E(Y); D(X+Y)=D(X)+D
19、(Y); D(X-Y)=D(X)+D(Y). 协方差矩阵 混合矩 对于随机变量X与Y,如果有存在,则称之为X与Y的k+l阶混合原点矩,记为;k+l阶混合中心矩记为: 协方差的性质 (i) cov (X, Y)=cov (Y, X); (ii) cov(aX,bY)=ab cov(X,Y); (iii) cov(X1+X2, Y)=cov(X1,Y)+cov(X2,Y); (iv) cov(X,Y)=E(XY)-E(X)E(Y). 独立和不相关 若随机变量X与Y相互独立,则;反之不真。 若N, 则X与Y相互独立的充要条件是X和Y不相关。 第五章 大数定律和中心极限定理 大数定律 切比雪夫大数定律
20、 设随机变量X1,X2,.相互独立,均具有有限方差,且被同一常数C所界:DC(i=1,2,.),则对于任意的正数,有 特殊情形:若X1,X2,.具有相同的数学期望E=,则上式成为 伯努利大数定律 设是n次独立试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意的正数,有 伯努利大数定律说明,当试验次数n很大时,事件A发生的频率与概率有较大判别的可能性很小,即 这就以严格的数学形式描述了频率的稳定性。 辛钦大数定律 设X1,X2,.,Xn,.是相互独立同分布的随机变量序列,且E=,则对于任意的正数有 中心极限定理 列维林德伯格定理 设随机变量X1,X2,.相互独立,服从同一分布,
21、且具有相同的数学期望和方差:,则随机变量 的分布函数Fn(x)对任意的实数x,有 此定理也称为独立同分布的中心极限定理。 棣莫弗拉普拉斯定理 设随机变量为具有参数n, p(0p1)的二项分布,则对于任意实数x,有 二项定理 若当,则 超几何分布的极限分布为二项分布。 泊松定理 若当,则 其中k=0,1,2,.,n,.。 二项分布的极限分布为泊松分布。 第六章 样本及抽样分布 数理统计的基本概念 总体 在数理统计中,常把被考察对象的某一个指标的全体称为总体。我们总是把总体看成一个具有分布的随机变量。 个体 总体中的每一个单元称为样品。 样本 我们把从总体中抽取的部分样品称为样本。样本中所含的样品
22、数称为样本容量,一般用n表示。在一般情况下,总是把样本看成是n个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,表示n个随机变量;在具体的一次抽取之后,表示n个具体的数值。我们称之为样本的两重性。 样本函数和统计量 设为总体的一个样本,称 为样本函数,其中为一个连续函数。如果中不包含任何未知参数,则称为一个统计量。 常见统计量及其性质 样本均值 样本方差 样本标准差 样本k阶原点矩 样本k阶中心矩 , ,, 其中,为二阶中心矩。 正态总体下的四大分布 正态分布 设为来自正态总体的一个样本,则样本函数 t分布 设为来自正态总体的一个样本,则样本函数
23、其中t(n-1)表示自由度为n-1的t分布。 设为来自正态总体的一个样本,则样本函数 其中表示自由度为n-1的分布。 F分布 设为来自正态总体的一个样本,而为来自正态总体的一个样本,则样本函数 其中 表示第一自由度为,第二自由度为的F分布。 正态总体下分布的性质 与独立。 第七章 参数估计 点估计 矩估计 设总体X的分布中包含有未知数,则其分布函数可以表成它的k阶原点矩中也包含了未知参数,即。又设为总体X的n个样本值,其样本的k阶原点矩为 这样,我们按照当参数等于其估计量时,总体矩等于相应的样本矩的原则建立方程,即有 由上面的m个方程中,解出的m个未知参数即为参数的矩估计量。 若为的矩估计,为
24、连续函数,则为的矩估计。 极大似然估计 当总体X为连续型随机变量时,设其分布密度为,其中为未知参数。又设为总体的一个样本,称 为样本的似然函数,简记为Ln. 当总体X为离型随机变量时,设其分布律为,则称 为样本的似然函数。 若似然函数在处取到最大值,则称分别为的最大似然估计值,相应的统计量称为最大似然估计量。 若为的极大似然估计,为单调函数,则为的极大似然估计。 估计量的评选标准 无偏性 设为未知参数的估计量。若E =,则称 为的无偏估计量。 E=E, E=D 有效性 设和是未知参数的两个无偏估计量。若,则称有效。 一致性 设是的一串估计量,如果对于任意的正数,都有 则称为的一致估计量。 若为
25、的无偏估计,且则为的一致估计。 只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。 区间估计 置信区间和置信度 设总体X含有一个待估的未知参数。如果我们从样本出发,找出两个统计量与,使得区间以的概率包含这个待估参数,即 那么称区间为的置信区间,为该区间的置信度。 单正态总体的期望和方差的区间估计 设为总体的一个样本,在置信度为下,我们来确定的置信区间。具体步骤如下: 选择样本函数; 由置信度,查表找分位数; 导出置信区间。 已知方差,估计均值 选择样本函数 (ii) 查表找分位数 导出置信区间 未知方差,估计均值 选择样本函数 (ii)查表找分位数 导出置
26、信区间 方差的区间估计 选择样本函数 查表找分位数 导出的置信区间 第八章 假设检验 基本思想 假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。 为了检验一个假设H0是否成立。我们先假定H0是成立的。如果根据这个假定导致了一个不合理的事件发生,那就表明原来的假定H0是不正确的,我们拒绝接受H0;如果由此没有导出不合理的现象,则不能拒绝接受H0,我们称H0是相容的。与H0相对的假设称为备择假设,用H1表示。 这里所说的小概率事件就是事件,其概率就是检验水平,通常我们取=0.05,有时也取0.01或0.10。 基本步骤 假设检验的基本步骤如下: (i) 提
27、出零假设H0; (ii) 选择统计量K; (iii) 对于检验水平查表找分位数; (iv) 由样本值计算统计量之值K; 将进行比较,作出判断:当时否定H0,否则认为H0相容。 两类错误 第一类错误 当H0为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定H0。这时,我们把客观上H0成立判为H0为不成立,称这种错误为以真当假的错误或第一类错误,记为犯此类错误的概率,即 P否定H0|H0为真=; 此处的恰好为检验水平。 第二类错误 当H1为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受H0。这时,我们把客观上H0。不成立判为H0成立,称这种错误为以假当真的错误或第二类错误,记为犯此类错误的概率,即 P接受H0|H1为真=。 两类错误的关系 人们当然希望犯两类错误的概率同时都很小。但是,当容量n一定时,变小,则变大;相反地,变小,则变大。取定要想使变小,则必须增加样本容量。 在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平。大小的选取应根据实际情况而定。当我们宁可以假为真、而不愿以真当假时,则应把取得很小,如0.01,甚至0.001。反之,则应把取得大些。 单正态总体均值和方差的假设检验 条件 零假设 统计量 对应样本 函数分布 否定域 已知 N 未知 未知 ? ? ? ? 概率论与数理统计 公式 2011-1-1 1