第7章-MATLAB在概率统计中的应用分解.doc

上传人:小飞机 文档编号:4295731 上传时间:2023-04-14 格式:DOC 页数:24 大小:409KB
返回 下载 相关 举报
第7章-MATLAB在概率统计中的应用分解.doc_第1页
第1页 / 共24页
第7章-MATLAB在概率统计中的应用分解.doc_第2页
第2页 / 共24页
第7章-MATLAB在概率统计中的应用分解.doc_第3页
第3页 / 共24页
第7章-MATLAB在概率统计中的应用分解.doc_第4页
第4页 / 共24页
第7章-MATLAB在概率统计中的应用分解.doc_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《第7章-MATLAB在概率统计中的应用分解.doc》由会员分享,可在线阅读,更多相关《第7章-MATLAB在概率统计中的应用分解.doc(24页珍藏版)》请在三一办公上搜索。

1、第7章 MATLAB在概率统计中的应用一、统计量的数字特征(一)简单的数学期望和几种均值l mean(x) 平均值函数当x 为向量时,得到它的元素平均值;当x 为矩阵时,得到一列向量,每一行值为矩阵行元素的平均值,举例1:求矩阵A的平均值。D=74.001 74.005 74.003 74.001 74.00 73.998 74.006 74.02Mean(d)举例2:设随机变量x的分布规律如下表,求E(x)和E(3x2+5)的值E(x)的值X-20pk0.40.3l E(x)的值:x=-2 0 2,pk=0.4 0.3 0.3sum(x*pk)l E(3x2+5)的值。x=-2 0 2,pk

2、=0.4 0.3 0.3z=3*x.2+5sum(z*pk)(二)数据比较n max 最大值n min 最小值n median 中值n sort 由小到大排序(三)求和与积n sum 求向量或矩阵的元素累和n prod: 求当前元素与所有前面元素的积举例:下面的程序用来求向量各元素的之和prod=1varx=2 3 4for x=varx prod=prod*xend(四)方差和标准差为了反映随机变量与其均值的偏离程度 方差表示为标准差表示为:样本方差为:样本标准差为:l 方差函数VarVar(x) x为向量,返回向量的样本方差;x为矩阵,则返回矩阵各列的方差。Var(x,1) 返回向量(矩阵

3、x)的简单方差(即置前因子为的方差)Var(x,w) 返回向量(矩阵)x即以w为权的方差。l Std 标准差函数Std(x) 返回向量或矩阵x的样本标准差(置前因子为)Std(x,1) 返回向量或矩阵x的标准差(置前因子为 )举例: d=74.001 74.005 74.003 74.001 74.00 73.998 74.006 74.02mean(d)var(d,1) %方差var(d) %样本方差std(d,1) %标准差std(d) %样本标准差 (五)协方差和相关系数n cov(x):x为向量,返回向量的方差,x为矩阵时返回矩阵的协方差矩阵,其中协方差矩阵的对角元素是x矩阵的列向量的

4、方差值。n cov(x,y):返回向量x.,y的协方差矩阵,且x,y的维数必须相同。n cov(x,1):返回向量x的协方差(矩阵),置前因子为 n corrcoef(x,y):返回列向量x,y的相关系数。n corrcoef(x): 返回矩阵x的列元的相关系数矩阵。举例:a=1 2 1 2 2 1x1=var(a) %向量的方差y1=cov(a) %向量的方差d=rand(2,6)cov1=cov(d) %矩阵D的样本协方差c=rand(3,3)x2=cov(c) %矩阵C的样本协方差y2=corrcoef(c) %矩阵C各列元的相关系数二、常用的统计分布量(一)期望和方差函数名调用方式参数

5、说明函数注释BetastatM,V=betastat(A,B)M为期望值V为方差值A、B为分布参数分布的期望方差BinostatM,V=binostat(N,P)N主实验次数P为二次分布概率二项式分布的期差和方差ChizstatM,v=Chi2stat(nu)nu为卡方分布参数卡方分分布的期望和方差ExpstatM,V=expstat(mu)mu为指数分布的特征参数指数分布的期望和方差FstatM1,V=fstat(v1,v2)V1和V2为F分布的两个自由度F分布的期望和方差GamstatM,v=gamstat(A1,B)A,B为分布的参数分布的期望和方差GeostatM,v=geostat(

6、P)P为几何分布的几何概率参数几何分布的期望和方差HygestatMN,V=hygestat(M1,K1,N)M,K,N为超几何概分布参数超几何分布的期望和方差LonstatM,V=logstat(mu,sigma)mu为对数分布的均值,sigma为标准差PoisstatM,V=Poisstat(LAMBDA)LAMBDN为泊松分布参数NormstatM1,V=normstat(mu,signa)Mu为正态分布的均值sinma为标准差正态分布的期望和方差TstatM,V=tstat(nu)Nu为T分布参数UnifstatM1,V=unifstat(A,B)A,B为均分布区间端点值举例1:求参数

7、为0.12 和0.34的分布的期望和方差m,v=betastat(0.12,0.34) m为期望,v为方差举例2:求参数为6的泊松分布参数的期望和方差m,v=poisstat(6) m为期望,v为方差(二)概率密度函数1 离散型随机变量的分布及其数字特征(1)基本概念如果随机变量X的所有可能取值为有限个或无穷可列个,则称X为离散型随机变量设X的所有可能值为X1,X2,并且X取这些值的概率为:PX=Xk=pk, k=1,2,则称其为随机变量X的概率分布它满足以下性质:(1) pk0,k=1,2,(2) .称为累积概率分布(2)常见类型l 二项式分布若随机变量X的所有可能取值为0,1,n,其概率分

8、布为其中q=1-p,则称X服从参数为n和p的二项分布,记作XB(n,p)显然,两点分布是二项分布的特例二项分布的数学期望为E(X)=np,方差为D(X)=npq在MATLAB中提供有二项分布的统计函数:binopdf()、binocdf()、binoinv()、binornd() 以及计算二项分布均值和方差的函数binostat(),其使用格式为:binopdf(X,N,P)二项分布的密度函数binocdf(X,N,P)二项分布的累积分布函数binoinv(Y,N,P)二项分布的逆累积分布函数binornd(N,P,m,n)产生服从二项分布的随机数binostat(N,P) 求二项分布的数学期

9、望与方差其中X为随机变量;N为独立试验的重复数;P为事件发生的概率;m和n分别是所产生随机矩阵的行数和列数若不指定m和n,则返回一个随机数,否则返回一个服从二项分布的mn阶随机矩阵 举例:不同试验重复数n和不同概率p下二项分布的函数分布图和累积分布函数图程序如下:x=0:70;y1=binopdf(x,30,0.67);z1=binocdf(x,30,0.67);y2=binopdf(x,50,0.67);z2=binocdf(x,50,0.67);y3=binopdf(x,80,0.67);z3=binocdf(x,80,0.67);subplot(2,2,1);plot(x,y1,k.,x

10、,y2,k.,x,y3,k.);subplot(2,2,2);sstep(x,z1,k); % sstep绘制累积函数分布图sstep(x,z2,k);sstep(x,z3,k);y1=binopdf(x,50,0.3);z1=binocdf(x,50,0.3);y2=binopdf(x,50,0.6);z2=binocdf(x,50,0.6);y3=binopdf(x,50,0.9);z3=binocdf(x,50,0.9);subplot(2,2,3);plot(x,y1,k.,x,y2,k.,x,y3,k.);subplot(2,2,4);sstep(x,z1,k);sstep(x,z2

11、,k);sstep(x,z3,k);运行结果如下:由于MATLAB不提供绘分段函数图象的命令,故可借助如下函数sstep()描绘累积函数分布图,其用法如下:sstep(Y)或sstep(X,Y)其中X用于指定画线位置,Y表示线相对坐标轴的高度,还可增加线的属性function xo,yo = sstep(varargin)error(nargchk(1,3,nargin);sym = ;if isstr(vararginnargin), sym = vararginnargin; msg,x,y = xychk(varargin1:nargin-1,plot); if isempty(msg)

12、, error(msg); endelse msg,x,y = xychk(varargin1:nargin,plot); if isempty(msg), error(msg); endendif min(size(x)=1, x = x(:); endif min(size(y)=1, y = y(:); endn,nc = size(y); ndx = 1:n;1:n;y2 = y(ndx(1:2*n-1),:);if size(x,2)=1, x2 = x(ndx(2:2*n),ones(1,nc);else x2 = x(ndx(2:2*n),:);endx2(2*n)=2*x2(2

13、*n-1)-x2(2*n-3);y2(2*n)=y2(2*n-1);if (nargout 0 为常数,则称X服从参数为的泊松分布,记作XP() ,泊松分布的数学期望E(X)=,方差D(X)=在MATLAB中,提供如下有关泊松分布的统计函数,使用格式为:poisspdf(X,LMD)泊松分布的密度函数poisscdf(X,LMD)泊松分布的累积分布函数poissinv(Y,LMD)泊松分布的逆累积分布函数poissrnd(LMD,M,N)产生服从泊松分布的随机数poissstat(LMD)求泊松分布的数学期望与方差其中X为随机变量;Y为显著概率值;LMD为参数,M和为产生随机矩阵的行数和列数例

14、如类似于二项分布可用下述程序绘出服从泊松分布的密度函数和累积分布函数图(见图2):024600.20.40.60.802460.40.60.81图2 泊松分布的概率密度与累积概率分布图举例:x=0:5;y1=poisspdf(x,0.3);z1=poisscdf(x,0.3);y2=poisspdf(x,0.6);z2=poisscdf(x,0.6);y3=poisspdf(x,0.9);z3=poisscdf(x,0.9);subplot(2,1,1);plot(x,y1,k.,x,y2,k.,x,y3,k.);subplot(2,1,2);sstep(x,z1,k);sstep(x,z2,

15、k);sstep(x,z3,k);利用逆累积概率分布函数求一定显著概率条件下,泊松分布假设检验临界值:x=0:0.1:1;x= 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0poissinv(x,5)ans = 1 2 3 4 4 5 5 6 7 8 Infpoissinv(x,10)ans = 1 6 7 8 9 10 11 12 13 14 Infpoissinv(x,100)ans = 1 87 92 95 97 100 102 105 108 113 Infpoissinv(x,1)ans = 1 1 1 1 1 1 1 1 2 2 Inf求服从

16、泊松分布的随机数及数学期望与方差如下:poissrnd(1)ans = 1poissrnd(5)ans = 5poissrnd(5,5,10)ans = 4 6 9 1 4 10 7 3 3 6 7 5 4 3 4 5 4 6 5 2 6 4 3 8 2 6 4 5 5 6 3 8 6 8 8 8 1 6 3 7 4 4 10 6 7 4 5 4 2 3e,d=poisstat(5)e = 5d = 5e,d=poisstat(10)e = 10d = 10l 超几何分布如果随机变量X的所有可能取值为,(L=minM,N), X的概率分布为其中整数M,N0,且nM-N ,则称X服从参数为N,M

17、,n的超几何分布,记作XH(N,M,n) MATLAB中有关超几何分布的统计函数为:hygepdf(M,n,k,N) 超几何分布的密度函数hygepcdf(M,n,k,N) 超几何分布的累积分布函数hygeinv(P,n,k,N) 超几何分布的逆累积分布函数hygestat(n,k,N) 超几何分布的数学期望与方差2 连续型随机变量的分布及其数字特征(1)基本概念设随机变量X的分布函数为F(x),若存在非负函数f (x),使对任意实数x,有则称X为连续型随机变量,并称 f (x)为X的概率密度,它满足以下性质: f (x)0,-x+; ; Pa0,则称X服从参数为和2 的正态分布,记作XN(,

18、2)当=0,=1时,称X服从标准正态分布,记作XN(0,1)MATLAB提供的有关正态分布的函数如下: normpdf(X,M,C) 正态分布的密度函数 normcdf(X,M,C) 正态分布的累积分布函数 norminv(P,M,C) 正态分布的逆累积分布函数 normrnd(M,C,m,n) 产生服从正态分布的随机数 normstat(M,C) 求正态分布的数学期望和方差其中X为随机变量,M为正态分布参数,C为参数,P为显著概率,m和n为随机矩阵的行数和列数绘制标准正态分布的密度函数及累积分布函数图(图5-7上)和一般正态分布的密度函数及累积分布函数图(图5-7下)的程序如下:-4-202

19、400.20.4-4-202400.5105101500.20.40.605101500.51x=-4:0.01:4;y=normpdf(x,0,1);z=normcdf(x,0,1);subplot(2,2,1);plot(x,y,k);axis(-4,4,-0.1,0.5);subplot(2,2,2);plot(x,z,k);axis(-4,4,-0.1,1.1);x=-4:0.01:16;y1=normpdf(x,6,1);z1=normcdf(x,6,1);y2=normpdf(x,6,4);z2=normcdf(x,6,4);y3=normpdf(x,6,0.6);z3=normc

20、df(x,6,0.6);subplot(2,2,3);plot(x,y1,k,x,y2,k,x,y3,k);axis(-4,16,-0.1,0.8);subplot(2,2,4);plot(x,z1,k,x,z2,k,x,z3,k);axis(-4,16,-0.1,1.1);图5-7 正态分布的密度函数及累积分布函数图(3)求解方法l 通用函数介绍.Pdf 计算已选函数的概率密度函数,调用格式为:Y=Pdf(name, X,A)Y=Pdf(name, X,A,B)Y=Pdf(name, X, A,B,C) Name为上表中取stat后的字符,如beta、 bino 、chiz、exp等。l 利

21、用专用函数.Betapdf(X1,A1,B)Binopaf(X,N,P)(4)举例举例1:计算正态分布N(0,1)下的在点0.7733的值pdf(morm,0.7733,0,1)举例2:绘制卡方分布密度函数在n分别等于1,5,15 时的值 x=0:0.2:30y1=chi2pdf(x,1)plot(x,y1,+)hold ony2=chi2pdf(x,5)plot(x,y2,+)y2=chi2pdf(x,15)plot(x,y2,o)axis(0,30,0,0.2)举例3:3概率值函数 求X点处概率值. Binocdf(X,N,P) Betacdf(X,A,B) Normcdf(X1,mu,s

22、igma).数值点函数(逆概率函数,ZNV)-已知概率值求概率分布点时. 函数名+inv(参数) betainv(P,A,B) binoinv(Y,N,P)chixinv(P,v)举例1:设xN(3,22)求p2x5, p-4x2, px3a1=normcdf(2,3,2)a2=normcdf(5,3,2)p1=a2-a1p2=normcdf(10,3,2)-normcdf(-4,3,2)p3=1-normcdf(2,3,2)+normcdf(-2,3,2)p4=1-normcdf(3,3,2)三、参数估计1参数估计函数表 函数名调用形式函数注解BetafitBetafit(x),PHAT,P

23、CI=betafit(X,ALPHA)返回分布的最大似然估计值和水平的置信区间BinofitBinofit(X)PHAT,PCI=binofit(x,AaLPHA)二项式分布最大似然估计,水平的参数估计和置数区间ExpfitExpfit(x)MUHAT,MUCI=expfit(x,ALPHA)指数分布的最大似然估计,水平的参数估计和水平的置信区间GaamfitGamfit(x)PHAT,PCI=gamfit(x,ACPHA)返回最大似然估计;水平的期望,方差值和区间的估计 NormfitNoormfit(x,ALPHA)MUHAT,SIGAHT,SIGMACI=normfit(x,ALPHA)

24、正态分布的最大似然估计,水平的期望、方差值和区间的估计PoissfitPoissfit(x)cAMBAHAT,LANBDACI=poissfit(x,ALPHA)泊松分布的最大估计;水平的参数和区间估计UnifitUnifit(x,ALPHA)AHAT,BHAT,ACT,BCI=unifit(x,ALPHA)均匀分布的最大估计,水平的参数及其区间估计举例1:假设某种清漆的9个样本,其干燥时间(以小时计)分别为5.7,5.8,6.5,7.0,6.3,5.6,6.1,5.0,设干燥时间总体服从正态分布N(,2),求,的置信度为0.95的置信区间。time=6.0 5.7 5.8 6.5 7.0 6

25、.3 5.6 6.1 5.0MUHAT,SIGMAHAT,MUCI,SIGMACI=normfit(time,0.05)其中:MUHAT为的估计值,此例为6,MUCI为估计区间5.5584,6.4416,SIGMAHAT为的估计值,此例为0.57456,此例为,SIGMACI的估计区间0.3880 1.1005。四、假设检验(一)单个总体(u,2)均值的检验。1巳知时的u检验(u检验法)ztest H、SIG=Ztest(X、M、sigma,ALPHA,TAIL)当标准差sigma巳知时,函数一正态检验来判断是否来自一正态公布的样本的期望值。M作为评判标分准估计,默认值ALPHA=005,TA

26、IL=0当原假设为“期望值等于M”当TAIL=0时,备择假设为“期望值不等于M”当TAIL=0时,备择假设为“期望值大于M”当TAIL=0时,备择假设为“期望值小于M”ALPHA为设生产的显若水平,(默认为005),sig为当原假设为真时,得到观察的概率样本,H=0,表示“在显著水平为alpha”情况下,不能拒绝原假设,H=1,表示“在显著水平为alpha”情况下,可以拒绝原假设。例1:x=0.497 0.506 .518 .524 .498 .511 .52 .515 .512h,sig=ztest(x,0.5,0.015,0.05,0)h =1,sig =0.0248结果h1,说明在0.0

27、5的水平下,拒绝假设,即认为这天包装机工作不正常。3 未知时的u检验(t检验法)Ttest假设检验,h,SIG=ttest( X、M、sigma,ALPHA,TAIL),函数执行检验来判断是否来自一正态分布的样本的期望值可用来估计,默认值M=0。ALPHA=005E,TAIL=0,原假设为“期望值等于M“当TAIL=0,备择假设“期望值不等于M”TAUL=0,备择假设“期望值大于M”TAIL=0,备择假设“期望值小于M”ALPHA为设空的显著水平(默认为005),SIG当为原假设真时得到观察值的概率,当SIG为小概率时,则对原假设提示质疑,H=0,表示显著水平为alpha的情况下,不能拒绝原假

28、设,H=1,表示显著水平为alpha的情况下,可以拒绝原假设。例:x=159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170h,sig=ttest(x,225,0.05,1)h =0,sig =0.2570结果表明:h=0,即在显著水平为0.05的情况下,不能拒绝原假设,即认为元件的平均寿命不大于255小时。(二)两个正态总体均值差的检验(T检验)ttest2,H,SIGFICANCE CI=ttest2(X,Y,ALPHA,TAIL), 函数执行T在验来判断是否来自两个总体的样本的期望值可用相同的值来估计,原假设为“期望

29、值相等”。当TAIL=0 ,备择假设为“X期望值不等于Y的期望” TAIL=1,备择假设为“X的期望大于Y的期望” TAIL=-1,备择假设为“X的期望小于Y的期望”默认TAIL=0ALPHA为设定的显著水平,(默认为005),SIGNIFCACE为原假设为真时,得到观察值的概率,当SIGNIFCACE不X概率时则对原假设提示质疑。 H=0,表示在显著水平为ALPHA的情况下,不能拒绝假设。 H=1,表示在显著水平为ALPHA的情况下,可以拒绝假设。例:3秩和检验P=ranksum(x,y,ALPHA) 返回两独立样本的总体是否相同的显著性概率。X 、y可为不等长向量, ALPHA为给定的显著

30、性水平,它必须为0和1之间的数量。P,H=ranksum(x,y,ALPHA) 返回假设检验的结果H,如果X和Y的总体差别不显著,则H为0;如果X和Y的总体差别显著,则H为1。如果原假设为真,则P为观察值等于或远大于原数据值的概率。如果p接近于0,则可对原假设提出质疑。例:a=7 3.5 9.6 8.1 6.2 5.1 10.4 4 2 10.5b=5.7 3.2 4.2 11 9.7 6.9 3.6 4.8 5.6 8.4 10.1 5.5 12.3p,h=ranksum(a,b,0.05)p =0.8041,h =04中值检验P=sightank(x,y,ALPHA)P,H= (x,y,A

31、LPHA)5Stigntest 检号检验五、方差分析(一)单因素方差分析单因素方差分析的基本问题是比较和估计多个等方差正态总体的均值,其基本模型为:其中yij 为数据观测值,是各正态总体的数学期望,为各数据的随机误差在MATLAB中提供了单因素方差分析函数anoval(), 其使用格式为:p= anoval(X)或p= anoval(X,g)该函数返回无效假设成立的概率,第一种格式中X为一矩阵,函数将矩阵的每一列当作一个总体,矩阵的行数即为样本重复数若函数返回的概率值接近于零,则无效假设值得怀疑,表明各列的均值事实上是不同的第二种格式中的X为一向量,g是与X同长度的向量,且g中的值为整数,最小

32、值为1,最大值为数据的组数,每一组至少有一个数,但并不要求每组中元素个数相同因此,第一种格式用于等重复的单因素方差分析,第二种格式用于重复数不等的单因素方差分析例1 考察四种不同药剂处理的水稻种子对苗高的影响,所得试验数据见矩阵X,各重复四次,X的每一列为一个处理,则有:x = 23 21 20 2219 24 18 2521 27 19 2713 20 15 22p=anova1(x)ANOVA TableSource SS df MS F Columns 104 3 34.67 3.525Error 118 12 9.833Total 222 15p = 0.0487box图见图5-11:

33、由于返回的概率值 p=0.04870.01, 故不同药剂对种子的处理的差异达到了显著水平,但并不是极显著12324681012图5-11 不同药剂处理的水稻种子对苗高影响的box图其特征为:盒子的上底与下底间为内四分位间距;盒子的上、下两条线分别为样本的25%和75%分位数盒子的中间线为样本的中位数,如果中位数不在盒子中间,表明样本存在一定偏度虚线贯穿盒子上下,显示了样本其余部分,如果没有奇异值,则样本的最大值为虚线顶点,最小值为虚线底端默认奇异值为距盒子底端和顶端超过1.5倍内四分位间距的点在图中,奇异值为超出虚线底端的点,用“+”表示一个奇异值切口是样本中位数的置信区间,可用box图对样本

34、进行多重比较例2将三种不同菌型的伤寒病毒分别接种于10只、9只和11只小白鼠上,观察存活天数,结果用下述x和g表示,x为存活天数,g为组标识,表明数据x属于哪一组的值结果如下(图5-12为方差分析的box图):x=2 4 3 2 4 7 7 2 5 4 5 6 8 5 10 7 12 6 6 7 11 6 6 7 9 5 10 6 3 10;123414161820222426g=1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3;p=anova1(x,g) 图5-12 不同菌型伤寒病毒对小白鼠存活天数的影响p = 0.003

35、8ANOVA TableSource SS df MS F Columns 70.43 2 35.21 6.903Error 137.7 27 5.101Total 208.2 29由方差分析结果p=0.003 81时,p中有三个元素,第三个元素为A与B交互作用无显著作用的概率该函数除返回概率值外,还显示一个方差分析表,该方差分析表与教科书上完全相同例3 三名学生对四个品种的稻米含氮量(mg) 各作了一次分析,数据如下述X,每行为一个学生,每列为一品种稻米,作方差分析有:x = 2.2000 2.3000 2.6000 2.7000 2.2000 2.0000 2.5000 2.7000 2.0000 2.3000 2.7000 2.8000p = anova2(x,1)ANOVA TableSource SS df MS F Columns 0.7833 3 0.2611 18.08Rows 0.02667 2 0.01333 0.9231Error

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号