matlab教程参数估计及假设检验解读课件.ppt

上传人:牧羊曲112 文档编号:1481145 上传时间:2022-11-30 格式:PPT 页数:57 大小:2.13MB
返回 下载 相关 举报
matlab教程参数估计及假设检验解读课件.ppt_第1页
第1页 / 共57页
matlab教程参数估计及假设检验解读课件.ppt_第2页
第2页 / 共57页
matlab教程参数估计及假设检验解读课件.ppt_第3页
第3页 / 共57页
matlab教程参数估计及假设检验解读课件.ppt_第4页
第4页 / 共57页
matlab教程参数估计及假设检验解读课件.ppt_第5页
第5页 / 共57页
点击查看更多>>
资源描述

《matlab教程参数估计及假设检验解读课件.ppt》由会员分享,可在线阅读,更多相关《matlab教程参数估计及假设检验解读课件.ppt(57页珍藏版)》请在三一办公上搜索。

1、概率论与数理统计实验,实验3 参数估计 假设检验,实验目的,实验内容,直观了解统计描述的基本内容。,2、假设检验,1、参数估计,3、实例,4、作业,一、参数估计,参数估计问题的一般提法,设有一个统计总体,总体分布函数为F(x, ), 其中是未知参数,现从该总体抽样,得样本,参数估计,点估计,区间估计,点估计 估计未知参数的值。,区间估计 根据样本构造出适当的区间,使它以一定的概率包含未知参数或未知参数的已知函数的真值。,(一)点估计的求法,1、矩估计法,基本思想是用样本矩估计总体矩 .,设总体分布含有个k未知参数 1 ,k,计算总体的前 k 阶矩,l=1,., k 阶矩,解此方程组得其根为,分

2、别估计参数i ,i=1,.,k,并称其为i 的矩估计。,由于样本的l 阶矩,依概率收敛到总体的l 阶矩 l 。所以令,2、最大似然估计法,设总体 X 有概率密度 f (x; )(或分布律 p(x; ), =(1,., k)。设 X1,.,Xn 是来自总体的简单随机样本, x1,.,xn是样本观测值。最大似然估计的想法是选取参数i, i=1,.,k,使样本X1,.,Xn在样本值x1,.,xn附近取值的概率达到最大。即构造似然函数,或,若有参数 =(1,., k)的取值,,使得似然函数L(1,.,k)达到最大,则称它为参数1,., k的最大似然估计。,(二)区间估计,置信区间的意义,枢轴量,1、数

3、学期望的置信区间,设样本,来自正态母体XN(, 2),(1) 方差 2已知, 的置信区间,(2) 方差 2 未知 , 的置信区间,2、方差的区间估计, 未知时, 方差 2 的置信区间为,(三)参数估计的命令,1、正态总体的参数估计,设总体服从正态分布,则其点估计和区间估计可同时由以下命令获得: muhat,sigmahat,muci,sigmaci = normfit(X,alpha),此命令以alpha为显著性水平,在数据X下,对参数进行估计。(alpha缺省时设定为0.05),返回值muhat是正态分布的均值的点估计值,sigmahat是标准差的点估计值, muci是均值的区间估计,sig

4、maci是标准差的区间估计.X为矩阵(列为变量)时,输出行变量。,例1.给出容量为50的正态分布 N (10, 22)的随机数,并以此为样本值,给出 和 的点估计和区间估计;给出容量为100的正态分布 N (10, 22)的随机数,并以此为样本值,给出 和 的点估计和区间估计;给出容量为1000的正态分布 N (10, 22)的随机数,并以此为样本值,给出 和 的点估计和区间估计.,命令:X1=normrnd(10,2,50,1);mu1,sigm1,muci1,sigmci1=normfit(X1)X2=normrnd(10,2,100,1);mu2,sigm2,muci2,sigmci2=

5、normfit(X2)X3=normrnd(10,2,1000,1);mu3,sigm3,muci3,sigmci3=normfit(X3),例2.中国改革开放30年来的经济发展使人民的生活得到了很大的提高,不少家长都觉得这一代孩子的身高比上一代有了明显变化。下面数据是近期在一个经济比较发达的城市中学收集的17岁的男生身高(单位:cm),若数据来自正态分布,计算学生身高的均值和标准差的点估计和置信水平为0.95的区间估计。,170.1,179,171.5,173.1,174.1,177.2,170.3,176.2,175.4,163.3,179.0,176.5,178.4,165.1,179.

6、4,176.3,179.0,173.9,173.7173.2,172.3,169.3,172.8,176.4,163.7,177.0,165.9,166.6,167.4174.0,174.3,184.5,171.9,181.4,164.6,176.4,172.4,180.3,160.5166.2,173.5,171.7,167.9,168.7,175.6,179.6,171.6,168.1,172.2,例3. 产生正态分布随机数作为样本值,计算区间估计的覆盖率。写出fugailv.m文件。,function fugailv(mu,sigm,n,m,alpha)X=normrnd(mu,sigm

7、,m,1);Mu,Sigm,Muci,Sigmci=normfit(X,alpha);muratio=0;sigmratio=0;for i=1:n X=normrnd(mu,sigm,m,1); Mu(i),Sigm(i),muci,sigmci=normfit(X,alpha);endfor j=1:n if (Mu(j)=Muci(1) endendmuratio=muratio/nsigmratio=sigmratio/n,muratio,sgmratio=fugailv(0,1,1000,200,0.05),muratio,sgmratio=fugailv(10,2,2000,500

8、,0.01),muratio,sgmratio=fugailv(4,6,5000,400,0.025),2、其它分布的参数估计,(1). 取容量充分大的样本(n50),按中心极限定理,它近似地服从正态分布;,(2).使用Matlab工具箱中具有特定分布总体的估计命令.,10muhat, muci = expfit(X,alpha)- 在显著性水平alpha下,求指数分布的数据X的均值的点估计及其区间估计.20 lambdahat, lambdaci = poissfit(X,alpha)- 在显著性水平alpha下,求泊松分布的数据X 的参数的点估计及其区间估计.30phat, pci = w

9、eibfit(X,alpha)- 在显著性水平alpha下,求Weibull分布的数据X 的参数的点估计及其区间估计.,函数名,参数估计对应的参数,调用格式,mle,极大似然估计,phat=mle(dist,data),phat,pci=mle(dist,data),phat,pci=mle(dist,data,alpha),phat,pci=mle(dist,data,alpha,pl),normlike,对数正态似然函数,L=normlike(params,data),normfit,正态分布,muhat,sigmahat,muci,sigmaci = normfit(X,alpha),函

10、数名,参数估计对应的参数,调用格式,poissfit,泊松分布,lambdahat=poissfit(X),lambdahat,lambdaci=poissfit(X),unifit,均匀分布,ahat,bhat=unifit(X)ahat,bhat,ACI,BCI=unifit(X)ahat,bhat,ACI,BCI=unifit(X, alpha),lambdahat,lambdaci=poissfit(X,alpha),函数名,参数估计对应的参数,调用格式,weibfit,威布尔分布,weiblike,威布尔对数似然函数,logL=weiblike(params,data)logL,in

11、fo=weiblike(params,data),phat=weibfit(X)phat,pci=weibfit(X)phat,pci=weibfit(X, alpha),说明:命令mle的调用格式中:phat,pci=mle(dist,data,alpha,p1)只用于二项分布,其中p1为试验次数,例4. rv=binornd(20,0.75,1,10) %产生10个二项分布随机数参数为20和0.75 p,pci=mle(binomial,rv,0.05,20),rv=12 14 18 13 12 14 16 15 18 16 p=0.7400pci=0.6734, 0.7993,例5. 生

12、成指数分布随机数100个,假设均值参数真值为0.5, 以此为样本值,给出参数的点估计和区间估计,命令:r=exprnd(0.5,100,1);lamta,lamtaci=expfit(r);lamta,lamtaci=expfit(r,0.01);,结果:lamta=0.4579lamtaci=0.3799, 0.5627lamta=0.4579lamtaci=0.3587,0.6015,3. 不常用分布的参数估计(极大似然估计),此类问题一般归结为无约束最优化问题。,无约束最优化问题的一般形式:,参数的极大似然估计就是取目标函数为,的无约束最优化问题。,方法:,最速下降法Newton(牛顿)

13、法及其修正的方法。共轭方向法和共轭梯度法变尺度法(拟牛顿法)等等,详见北京大学出版社 高惠璇编著统计计算P359-P379,二、假设检验,对总体X的分布律或分布参数作某种假设,根据抽取的样本观察值,运用数理统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设.,统计推断的另一类重要问题是假设检验问题。,在总体的分布函数完全未知或只知其形式,但不知其参数的情况,为了推断总体的某些未知特性,提出某些关于总体的假设。,1. 参数检验:如果总体的分布函数类型已知,这时构造出的统计量依赖于总体的分布函数,这种检验称为参数检验.,参数检验的目的往往是对总体的参数及其有关性质出明确的判断.,2.

14、 非参数检验:如果所检验的假设并非是对某个分布的参数作出明确的判断,检验统计量的分布函数不依赖于总体的分布类型,这种检验叫非参数检验. 如判断总体分布类型的检验就是非参数检验.,假设检验的一般步骤是:,根据实际问题提出原假设H0与备择假设H1, 即说明需要检验的假设的具体内容 。,选择适当的统计量,构造恰当的拒绝域.,根据样本观测值计算统计量的观测值,看其是否落 入拒绝域中,从而在检验水平条件下对拒绝或接受原假设H0作出判断 .,(一)参数检验,1、单个正态总体XN(, 2)均值检验,-方差 2已知时采用 z 检验,- 方差 2未知,采用t 检验,2、单个正态总体方差检验- 2,3、两个正态总

15、体N(1, 12)和N(2, 22)均值检验,(1)已知 选取统计量,(2)方差未知 ,检验,选取统计量,(2)方差未知 ,检验,选取统计量,当 |t|t 1/2(n1+n2-2)时拒绝原假设,否则接受原假设。,-t 1/2 (n1+n2-2)为 t 分布t (n1+n2-2)的下测1/2分位数,n1为来自总体N(1, 12) 的样本的容量,n2是来自总体N(2, 22)的样本的容量。,4、两个正态总体方差检验,5、参数检验的计算机命令,10 z检验,(1) 命令ztest函数,(2)功能:给定方差条件下进行正态总体均值得检验,(3)语法:h=ztest(x,m,sigm); h=ztest(

16、x,m,sigm,alpha); h,sig,ci=ztest(x,m,sigm,alpha,tail); h=1,则拒绝原假设,h=0, 则接收原假设,(4)描述:ztest(x,m,sigm)在0.05水平下进行Z检验,以确 定服从正态分布的样本均值是否为m,sigm为给定的标准差h=ztest(x,m,sigm,alpha)给出显著水平控制参数alpha, h,sig,ci=ztest(x,m,sigm,alpha,tail)允许指定是进行单侧检验还是双侧检验。,tail参数可以有下面几个取值:,tail=0(为默认设置)指定备择假设,tail=1指定备择假设,tail=-1指定备择假设

17、,sig为与Z 统计量相关的 p值。,ci为均值真值的1-alpha置信区间。,(5)应用实例,例6、生成100个标准正态分布的随机数,假设均值和标准差的观测值与真值之间没有差异,进行检验。,过程如下:x=normrnd(0,1,1,100);h,sig,ci=ztest(x,0,1),结果:h=0sig=0.6317ci=-0.1481 0.2439,例7、某批矿砂的5个样品中的镍含量,经测定为(%) 3.25 3.27 3.24 3.26 3.24设测定值总体服从正态分布,标准差为0.04,问在0.01水平上能否接受假设:这批镍含量的均值为3.25。,过程如下:x=3.25 3.27 3.

18、24 3.26 3.24;h,sig,ci=ztest(x,3.25,0.04,0.01),结果:h=0sig=0.9110ci=3.2059 3.298,例8、下面列出的是某工厂随机选取的20只部件的装配时间 9.8 10.4 10.6 9.6 9.7 9.9 10.9 11.1 9.6 10.2 10.3 9.6 9.9 11.2 10.6 9.8 10.5 10.1 10.5 9.7 设总体服从正态分布,标准差为0.4,问在0.05水平上能否认为装配时间的均值显著的大于10。 需检验H0: 10, H1: 10,过程如下:x=9.8 10.4 10.6 9.6 9.7 9.9 10.9

19、11.1 9.6 10.2 10.3 9.6 9.9 11.2 10.6 9.8 10.5 10.1 10.5 9.7;h,sig,ci=ztest(x,10,0.4,0.05,1),结果:h=1sig=0.0127ci=10.0529 inf,拒绝原假设,20 单个样本的 t 检验,(1) 命令 ttest 函数,(2)功能:未知方差条件下进行正态总体均值得检验,(3)语法:h=ttest(x,m); h=ttest(x,m,alpha); h,sig,ci=ttest(x,m,alpha,tail); h=1,则拒绝原假设,h=0, 则接收原假设,(4)格式的使用和参数的取值含义与ztes

20、t大致相同,(5)应用实例,例9、测得一批刚件20个样品的屈服点(单位:T/mm2)为: 4.98 5.11 5.20 5.11 5.00 5.61 4.88 5.27 5.38 5.20 5.46 5.27 5.23 4.96 5.35 5.15 5.35 4.77 5.33 5.54设屈服点服从正态分布,在0.05水平上,检验该样本的均值是否为5.20,的假设检验。 需检验H0: =5.20, H1: 5.20,过程如下:x=4.98 5.11 5.20 5.11 5.00 5.61 4.88 5.27 5.38 5.20 5.46 5.27 5.23 4.96 5.35 5.15 5.3

21、5 4.77 5.33 5.54;m=mean(x)h,sig,ci=ttest(x,5.20,0.05),结果:m=5.2075h=0sig=0.8796ci=5.1052 5.3098,30 两个样本的t检验,(1) 命令 ttest2 函数,(2)功能:两个样本均值差异的t检验,(3)语法: h,significance,ci=ttest2(x,y);h,significance,ci=ttest2(x,y,alpha);h,significance,ci=ttest2(x,y,alpha, tail); h=1,则拒绝原假设,h=0, 则接收原假设,(4)格式的使用和参数的取值含义与t

22、test大致相同,(5)应用实例,例10、对两种不同的水稻品种A,B分别统计了8个地区的单位面积产量(单位:kg) 品种A:86 87 56 93 84 93 75 79 品种B: 80 79 58 91 77 82 76 66 要求检验两个水稻品种的单位面积产量之间是否有显著差异?,过程如下:x=86 87 56 93 84 93 75 79;y=80 79 58 91 77 82 76 66 ;h,significance,ci=ttest2(x,y),结果:h=0significance=0.3393ci=-6.4236 17.4236,(二)非参数检验,1. Jarque-Bera检验

23、,(1) 数学原理: Jarque-Bera检验是评价X服从正态分布的假设是否成立。该检验基于样本偏度和峰度,样本偏度接近于0,样本峰度接近于3。基于此构造一个包含 2 统计量: JB=n(g12+(g2-3)2/4)/6 (n为样本容量)Jarque和Bera证明了在正态性假定下,JB渐进的服从自由度为2的2分布,若JB超过了12 (2),即2 (2)的下测1分位数,则拒绝正态分布零假设,反之,接受零假设。,(2)函数名称:jbtest,(3)语法:H=jbtest(x); H=jbtest(x, alpha); H,p,jbstat,cv=jbtest(x, alpha); H=1,则拒绝

24、服从正态,H=0, 则接收服从正态,(4) alpha为显著水平,p为p值,jbstat为检验统计量的值,cv为确定是否拒绝原假设的的临界值。,(5)应用实例,例11、对下列数据确定其是否服从正态分布。,459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 49 697 515 628 954 771 60

25、9 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851,2. 总体分布的2检验法,总体X的样本观测值为x1,x2,xn,考虑如下检验问题:H0:X的分布函数为F(x),这里F(x)为已知的分布函数,在实数轴上取k个分点t1,t2,tk,得到互不相交的区

26、间,设样本观测值为x1,x2,xn落入第i个区间的个数为vi,其频率为vi/n.,如果H0成立,由给定的分布函数F(x),可以计算X落在每个小区间的概率为:,其中,考虑统计量,Pearson在1900年证明了如下定理:,设F(x)是随机变量X的分布函数,当H0成立时,上述给出的2的极限分布为2 (k),k为分点个数,其中F(x)中不含有未知参数,vi称为实际频数,npi为理论频数。,由此定理可得:给定显著性水平,查2分布表可得临界值2 (k) ,当2 2 (k) 时,则拒绝H0 ,认为总体X的分布函数与F(x)有显著差异。若2 2 (k) ,不能拒绝H0 。,当总体F(x)中含有未知参数1,2

27、,r时,则需要先利用数据对未知参数进行估计(通常采用极大似然估计),此时有如下定理:,设F(x)是随机变量X的分布函数,且F(x)中含有r个未知参数当H0成立时,上述给出的2的极限分布为2 (k-r),r为参数个数.,此方法对离散型随机变量和连续型随机变量均适用。,由此定理可得:给定显著性水平,查2分布表可得临界值2 (k-r) ,当2 2 (k-r) 时,则拒绝H0 ,认为总体X的分布函数与F(x)有显著差异。若2 2 (k-r)不能拒绝H0 。,例12 :卢瑟福在2608个等时间间隔内观测一枚放射性物质放射出的粒子数X,下表是观测结果的汇总,其中ni表示2608次观测中放射粒子数为i的次数

28、。,i,ni,0 1 2 3 4 5 6 7 8 9 10 11,57 203 383 525 532 408 273 139 45 27 10 6,请用该组数据检验该放射性物质在单位时间内放射出的粒子数是否服从泊松分布?(取显著性水平为0.05),function H=poisstest(alpha)x=0 1 2 3 4 5 6 7 8 9 10 11;m=mean(x);v=57 203 383 525 532 408 273 139 45 27 10 6;p=poisspdf(13,m);y1=sum(v.2./p./2608)-2608;y2=chi2inv(alpha,10);if

29、 y1y2 H=1;else H=0;end,H=poisstest(0.05)H = 1,三、线性回归,一元线性回归,回归模型和参数确定,一元线性回归研究因变量于一个自变量之间的线性关系。模型为,y是因变量,x是自变量,b0, b1为待估参数。,2、函数名称: regress,(1)语法:b=regress(y,x);,(2)说明:b返回参数的估计值。y为列向量, x为自变量取值矩阵。,注意:在回归分析时,可先对数据划出散点图,看是否有线性关系,再进行回归分析,散点图的命令为:scatter,例13、为研究某一化学反应过程中,温度x(0C)对产品得率Y(%)的影响,测得数据如下:温度x 100 110 120 130 140 150 160 170 180 190得率y 45 51 54 61 66 70 74 78 85 89求y关于x 的线性回归方程。,过程如下:先画散点图,x=100;110;120;130;140;150;160;170;180;190;y= 45;51;54;61;66;70;74;78;85;89;scatter(x,y),a=ones(length(x),1);z=a,xb=regress(y,z);,b= -2.7394 0.4830,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号