《概率论与数理统计(柴中林)复习.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计(柴中林)复习.ppt(26页珍藏版)》请在三一办公上搜索。
1、课件在邮箱,密码518516,随机现象(偶然性现象):在一定条件下有多种可能结果。事先可以知道发生的所有结果,但发生什么结果事先无法预知。,随机现象广泛的存在于现实生活中。概率论与数理统计是研究和揭示随机现象统计规律性的一门科学。,相关概念和定义,对随机现象做一次观察或测量称为做一个试验,记为 E。,试验所有可能结果构成的集合称为样本空间,记为。样本空间中的元素,称为样本点。,的任意一个子集(或一些样本点的集合)称为一个随机事件,简称事件。,样本点(基本事件)在一次实验中或发生,或不发生。事件也一样(除了必然事件和不可能事件)。,事件间的关系,AB:事件A的发生会导致事件B的发生。,若AB,且
2、BA,则A=B。,AB:事件 A或事件 B发生的事件。,AB或AB:事件A与B同时发生的事件。,若AB=,称A与B为互斥事件(或互不相容事件)。,AB:A发生且B不发生的事件。,它也等价于不同事件虽在试验中都会发生,但发生的可能性(几率)不同,有的大有的小,称这个可能性为概率。它贯穿于概率论的始末。,随机现象具有偶然性:事件在一次试验中可能发生,也可能不发生(无法预测)。它也有必然性:在大量重复试验中任何事件都呈现统计规律性:频率的稳定性:频率总稳定在一个常值附近,即,基本特征(1).1 P(A)0;(2)P()=1;(3)P()=1。该值越大,事件在试验中越容易发生。,2.若AB,则:P(B
3、-A)=P(B)-P(A),P(B)P(A)。,1.,几个式子,3.,4.当 AB=时 P(AB)=P(A)+P(B),古典概型:试验结果只有有限个;各个结果出现的可能性相同,此时,若基本事件总数为n个,事件A 包含 k 个基本事件,则 P(A)=k/n,条件概率:事件B发生的条件下事件A发生的概率称为条件概率,记为P(A|B)。一般的,P(A|B)P(A)。计算公式,于是 P(AB)=P(B)P(A|B)。同理P(AB)=P(A)P(B|A),全概率公式与贝叶斯公式:设 A1,A2,An为一完备事件组,则对任一事件B有,P(A|B)=P(A),P(B|A)=P(B),P(AB)=P(A)P(
4、B).,事件的独立性:若事件A,B的发生不受对方发生与否的影响,则称A与B相互独立。判定式子,独立试验序列:事件A发生的概率是p,将试验重复独立进行n次。这样的n次重复试验称为n重独立试验序列,也称n重贝努利试验。,在n重贝努利试验中,A发生的次数的可能取值为0,1,2,n。记A发生k次的概率为Pn(k),则有,随机变量:为将随机现象数字化而引入的。方法:将每一个样本点与一个数X()相对应(本身有数字的就用这个数字),不同样本点对应不同的值。再引入一个变量X。当一个样本点发生了,说X取到了对应的值。显然,X可以取到不同的值,而仅当一个样本点发生了,才说X取到了X()。因为样本点的发生是随机的,
5、故称为随机变量。注意:一个随机变量表示一个随机现象。,通过引入随机变量,在随机现象中对事件及事件概率的研究转化为对随机变量取值规律和概率的研究。,离散型随机变量,分布律。设X的取值为则的分布律可描述为,分布函数,设 X是随机变量,称函数F(x)=PXx 为X 的分布函数(X小于等于x的全部概率,故有局限性。离散、连续均可)。,(1).ab,总有F(a)F(b);(2).F(x)是一个右连续函数;(3).0F(x)1,且F(-)=0,F(+)=1,离散型随机变量的分布函数,图形:台阶状阶梯线,每经过一个概率点,台阶向上跳跃,跃度为该点的概率。,当n=1时就是 两点分布,XB(1,p)P(X=k)
6、=p(1-p)1-k,k=0,1.,常见分布,1 二项分布(独立试验序列),XB(n,p),,2.超几何分布,X H(n;M,N),3泊松分布X P(),N很大时,超几何分布 H(n;M,N)近似于一个二项分布B(n;p),n很大时,二项分布B(n;p)近似于一个泊松分布P().此外,二项分布可看做若干独立同分布的两点分布之和.,连续型随机变量:对随机变量X,若存在非负可积函数 f(x),使得对任意a,b,有,称 X为连续型随机变量,f(x)为 X 的概率密度函数。性质,对任何常数a都有P(X=a)=0.因此,概率为0的事件未必为不可能事件。概率为1的事件也未必为必然事件。此外,,常见分布,1
7、,正态分布,X N(,2),2.均匀分布,X U(a,b),对它,总有P(X)=P(X)=0.5,标准正态分布,X N(0,1),联系,若X N(,2),则(X-)/N(0,1),指数分布,X e(),随机变量函数的分布:X的分布已知,Y=g(X)也已知,求Y的分布。,离散型,设X的分布律为P(X=xk)=pk,对每个xk,利用Y=g(X)求出所有的Y值,就得Y的所有取值。对每个Y的取值yi,将原来的xk的概率相加,就是P(Y=yi),从而得到Y的分布,连续型,利用分布函数,FY(y)=P(Yy)=P(g(X)y),根据g(X)y求解得到关于X的不等式,进而转化成X的分布函数,两边对y求导即可
8、,二维随机向量(变量),(X,Y),(联合)分布函数为F(x,y)=P(Xx,Y y),性质(1).x1 x2 时,F(x1,y)F(x2,y).当y1y2时,F(x,y1)F(x,y2).,(2).x,yR,有 0F(x,y)1;,(3).F(-,y)=0,F(x,-)=0,F(-,-)=0,F(,)=1.,离散型,(联合)分布律,或,连续型,设(X,Y)的分布函数为F(x,y),如果存在一个非负函数f(x,y),使得对任意实数 x,y,有,称(X,Y)为连续型随机向量,f(x,y)为(X,Y)的概率密度函数。.,边缘分布,在二维分布(X,Y)中分别考虑X,Y的分布时的分布,FX(x)=PX
9、x=PXx,Y=F(x,),FY(y)=PYy=PX,Yy=F(,y).,求法,离散型,设(X,Y)的概率分布为P(X=xi,Y=yj)=pij,则,连续型,(X,Y)的概率密度为 f(x,y),则,独立性,对(X,Y)来说,若X,Y相互不受对方的影响,称它们相互独立。判定方法,连续型,离散型,二维随机变量函数的分布Z=X+Y,离散(略)。连续,FZ(z)=P(Zz)=P(X+Y z),独立时,M=max(X,Y),N=min(X,Y)的分布,FX(x)FY(y),FM(z)=FX(z)FY(z).,FN(z)=1-1-FX(z)1-FY(z),随机变量的数字特征。期望:随机变量X平均取值的大
10、小。计算,离散,PX=xk=pk,连续,f(x),,若Y=g(X),则,若Z=g(X,Y),则,性质,(3).X,Y 相互独立,则 E(XY)=E(X)E(Y);,方差:反映随机变量X取值的分散程度,式子 D(X)=EX-E(X)2=E(X2)-E(X)2,计算,(1).Var(C)=0;,(2)Var(CX)=C2 Var(X);,(4).Var(X1X2)=Var(X1)+Var(X2);,对X,若,则E(Y)=0,D(Y)=1,常用随机变量的期望与方差,协方差,Cov(X,Y)=E X-E(X)Y-E(Y)=E(XY)-E(X)E(Y),相关系数,性质,若X,Y相互独立,两个都为0,但反
11、之不对。,矩,k 阶原点矩,E(Xk);k 阶中心矩,EX-E(X)k。,大数定律,中心极限定理(略),数理统计:研究以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出正确的推断。总体(X):(具有随机性的)研究对象(的相关数字)的全体。样本:从总体中抽取部分个体X1,X2,Xn进行观测(检测),已达到对总体的科学推断。简单样本,对总体做简单重复抽样得到的样本。各X1,X2,Xn 相互独立且与X具有相同的分布。,此外,引入3个新的分布,统计量,对获得的样本进行“加工”的各种规则(函数),称为统计量,如,F=(X/m)/(Y/n),当X为正态总体时,为样本时,参数估计,X 的分布函数为 F(x,),其中 未知,有样本,X1,X2,Xn.给出的一个估计值。矩估计,总体矩ak中含有,对一些正整数k,令两个矩相等,解出,就是的估计值。,极大似然估计,一切发生的都是应该发生的,从而是最大可能发生的,设总体 X 的分布(连续型时为密度函数,离散型时为分布律)为 f(x,),今有样本 X1,X2,Xn.从而认为的值应使得 取值最大,估计量的评价:无偏性,有效性,一致性,对它求导(一般用lnL()),并令导数为0,得到的就是的估计值。,