MSA的数学补充修改.ppt

上传人:小飞机 文档编号:6512756 上传时间:2023-11-08 格式:PPT 页数:39 大小:341.50KB
返回 下载 相关 举报
MSA的数学补充修改.ppt_第1页
第1页 / 共39页
MSA的数学补充修改.ppt_第2页
第2页 / 共39页
MSA的数学补充修改.ppt_第3页
第3页 / 共39页
MSA的数学补充修改.ppt_第4页
第4页 / 共39页
MSA的数学补充修改.ppt_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《MSA的数学补充修改.ppt》由会员分享,可在线阅读,更多相关《MSA的数学补充修改.ppt(39页珍藏版)》请在三一办公上搜索。

1、在核心工具中经常直接引用一些统计学的知识,譬如,在SPC中提到了样本容量对过程指数的影响等知识;在MSA中提到了2假设检验(一致性Kappa值评估),事件运算中的逆概公式(Bayes formula),t分布表等概念。由于是直接引用而没有考虑统计学知识之间的联系,往往使学习或应用者感到费解。于是编者编此“统计学知识补充”讲义。力求把这些统计学之间的知识联系起来。,1,统计学知识补充,统计学知识补充,要注意逻辑和连贯一个章节,应仅或主要参考一本书思路:P1-15:事件概率略过:自学:二项分布/讲义:P34-39N,t 分布:参考一本书P1-22可以P22-内容如何在正文和补充资料间分配?,2,统

2、计学知识补充随机事件 和及其概率定理,随机事件和样本空间/考虑用图表示,V“在一定条件下可能发生,也可能不发生的事件”称为随机事件,常用大写A,B,C,表示。,V 符号专门表示必然事件和不可能事件一个试验E,如果事先不能准确预言它的结果,并且在相同条件下重复进行,E称为随机试验,简称“试验”.随机试验的每个可能称为样本(基本事件).全体样本的集合称为样本空间,用表示,w表示样本。,3,统计学知识补充,概率的初步定义对于一个随机事件A,我们可来以用一个数p来表示它在一次试验中出现的可能性大小我们把这个数称为事件A的概率记为P(A):P(A)=p设一批产品共100件,其中有5件次品。现从中任取50

3、件。问:无次品的概率是多少?自学P7/和随机变量题比较,4,统计学知识补充,古典概型:定义:样本空间有限,各样本出现机会均等地数学模型例一 见“习题部分”古典概型的解法可有多种,5,统计学知识补充,概率的加法定理:如图可直观地得到P(AB)=P(AB bar+A bar+AB)=P(AB bar)+P(A barB)=P(AB)当A.B=V例:甲,乙同时向敌机炮击,击中概率甲为0.6,乙为0.5,求敌机被击中的概率。自学P49,6,统计学知识补充,条件概率和概率乘法定理前例:如果已知第一个人抽得球票,该事件记为A,问第二个人抽得球票的概率多大?解:在A发生下,B发生概率因只剩9张票中1张球要P

4、(BA)=1/9,7,统计学知识补充,条件概率和概率乘法定理A,B两个事件,P(A)0,则称在A发生的前提下B发生的概率为B在假设A下的条件概率:记作P(BA)概率乘法公式:P(AB)=P(A)P(BA),8,统计学知识补充,全概率公式我们已知前例P(B)=2/10B=AbarB+A BP(B)=P(A bar B+AB)=P(AbarB)+P(AB)=P(A)P(BA bar)+P(A bar)P(BA bar)=2/10*1/9+8/10*2/9=2/10P(B)=P(Ai)P(BAi)=P(A)P(BA)+P(A)P(BA)=2/10*1/9+8/10*2/9=2/10,全概公式的思想是

5、当求P(B)有困难时,可观察其发生的原因如图 原因有两个:AB和 AbarB,求出P(AbarB)和P(A B),然后相加.,9,统计学知识补充,10,统计学知识补充,逆概公式:(Bayes 公式):与全概率公式的“由因导果”相反,它是“执果导因”求:P(AjB)P(AjB)=_P(Aj)P(BAj)_ P(Ai)P(BAi),11,统计学知识补充,假定用血清甲胎蛋白的方法诊断肝癌:令:C=“被检验者患有肝癌”A=“判断被检验者患有肝癌”设在人群中:P(C)=0.0004;又设用该法诊断时:P(AC)=0.95 P(AC)=0.90现在若有一个人被诊断为患有肝癌,求:此人真的患有肝癌的概率P(

6、CA),12,统计学知识补充,13,统计学知识补充随机变量及其分布,随机变量令试验的每一个可能的结果(样本点)w唯一地对应与一个实数(w),则称(w)为随机变量随机变量是样本点的函数设一批产品共100件,其中有5件次品。现从中任取50件。问:取到的次品件数是多少?讲义P40/和概论题比较离散型随机变量连续型随机变量,14,15,统计学知识补充,随机变量的两个参数均值:用来表示分布的中心位置,通常用E(X)或来表示.样本均值:x=(xi)/n 样本均值处于样本的中间位置,它可以反映总体分布的均值,是E(X)或的无偏点估计。方差:用来表示分布的散布大小,通常用D(X)或2来表示,方差大意味着分布较

7、宽较分散,方差小意味着分布窄较集中。样本方差:s2=(xi-x)2/(n-1)是2无偏点估计。样本标准差:s,统计学知识补充,分布函数设是一个随机变量,x是一个任意实数(x+),那么“x”是一个事件,它的概率P(x)是的x函数,我们记作Ft(x):Ft(x)=P(x)由分布函数的定义,知道了Ft(x),就知道了落在区间(,x的概率而且,Ft(x)P(x)=p(t)dt,(这里p(t)是概率密度函数,16,17,统计学知识补充,正态分布 N(,2)其中是正态分布的中心,质量特性X在附近取值的机会最大,2是正态分布的方差,越大,分布越分散,越小,分布越集中 N(0,1)为标准正态分布标准正态分布的

8、特殊地位,它的概率密度用符号,分布函数符号表示:,由于正态分布对称:(-x)=(x)可以证明(-x)=1-(x)例:设 N(0,1),求PI I3解:PI I3=P(-3 3)=(3)-(-3)=2(3)-1=1.9973-1=0.9973这个数字重要,应该记住!,正态概率的分布,18,19,统计学知识补充正态分布,正态分布的标准化变换 可改写 设XN(,2),则U=(X-)/N(0,1)即:任一正态变量经过标准化变换(X-)/后都可归一到标准正态分布 如:XN(10,22),通过标准变换 U=(X-10)/2 N(0,1),统计学知识补充中心极限定理和 t分布/加强,中心极限定理的一般描述:

9、某一个随机变量,只要是由大量的互相独立的因数综合影响而成,其中每个因数在总的影响下作用很小,那么这种随机变量近似地服从正态分布。设X,X,X,X,为独立同分布的随机变量列,而且其期望E(X1)和方差(D(X1)存在,则limPaSn-n E(X1)/b=(待续)这表明只要n充分大,随机变量-E(x)/Squ.D(x)/n服从正态分布。我们的n还不充分大,就用S2取代D(x),然后把它的分布列成表格,这就是t分布。,20,21,统计学知识补充中心极限定理和 t分布,t分布:正态样本均值X的标准化变换中用样本标准差s代替总体标准差后的分布是自由度为n-1的t分布,记为t(n-1),即n(X-)/s

10、t(n-1)t分位数 P(tta)=a,记为a的分位数为ta ta=-t1-at分布的查表练习 n=10 a取0.05 查表t1-a/2(n-1)当s趋向,s=;t分布就正态分布,22,统计学知识补充统计估计,参数估计:点估计、区间估计点估计 用样本均值Xbar去估计总体均值 用样本方差S2去估计总体方差2 正态标准差的无偏估计有两个:R=R/d2;SPC中(X-R)图 S=S/c4 SPC中(X-S)图,23,统计学知识补充,区间估计(针对MSA中偏移的估计)(对于参数x,如果估计x落在x1和x2之间的概率为1-a,即:P(x1xx2)=1-a,则称随机区间 x1,x2是x的置信水平为1-a

11、的置信区间)可删节?,为未知情形下,的置信区间,若 是未知参数,则以 的无偏估计 代替,这时由于枢轴变量(7-15)所以对给定的置信度,存在 使(7-16)这里 的是自由度为n-1的t分布的-上侧分位数,它的值可查附表4求得,将(7-15)中的T代入(7-16)可得,因此有(7-17)所以的置信度为 的置信区间是(7-18)其长度为 需要说明的是:置信区间公式中的,在实际问题中都是具体观测值,计算时应是,26,统计学知识补充,我们用有限样本对偏移置信区间进行统计推断,用的就是这方法。,27,统计学知识补充假设检验,其基本思想是根据所获样本,运用统计分析方法,对总体X的某种假设H0 作出接受或拒

12、绝的判断。具体方法(针对MSA中93页的线形案例)1,建立原假设 H0:0 H1:02,选择检验统计量,给出拒绝的形式3,给出显著性水平a,常取a=0.054,定出临界值c,写出拒绝域W5,判断,统计学知识补充,我们在生产中,有时会遇到以下类似的问题例:某厂有一批产品,200件,按规定,次品率不得超过1%,今在其中任抽5件,发现有次品,问这批产品能出厂吗?+内容假设检验的方法,能解决上述问题它的基本思想是:用反证法首先假设,例 P 0.01,成立而看由此会发生什么后果,如果导致不合格现象出现则假设不成立,否则,不能拒绝这个假设,28,统计学知识补充,应该指出 这里的反证法不是纯数的反证法 而是

13、基于在实践中广泛采用的原则:“小概率事件(几乎不可能的事件)在一次观察中基本不会发生”MSA 中对线性的研究,用的就是这方法,29,30,统计学知识补充假设检验/要简化,明确,正态总体均值的假设检验 已知时,用u检验未知时,用t 检验非参数时,用2检验,统计学知识补充假设检验,非参数的统计推断和一致性假设检验,即Kappa 检验(结合讨论 2检验)。建立2行2列表(22 contingency table):计算理论数(TRC),计算公式为:TRC=nR.nc/n 公式 式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC为与理论数同列的合计数,n为总例数。结果就产生MSA中

14、第128页的四个数:15.7R1C1,34.3R1C2,31.3R2C1,68.7R2C2.,31,统计学知识补充假设检验,计算kappa:o:P observed(判断一致性比率,即不同作业员之间、同作业员不同次数之间)=(Pass Pass+Fail Fail)/总的检验次数 Pc:P chance(预期偶然达成一致的比率)=(Pass Pass+Fail Pass)*(Pass Pass+Pass Fail/总检验次数之平方+(Pass Fail+Fail Fail)*(Fail Pass+Fail Fail)/总的检验次数之方kappa=(P observed-P chance)/(1

15、-P chance),32,统计学知识补充回归分析,经验公式和最小二乘法在计算MSA的线性时,用到了一元回归分析它的思想是:当我观察散点图上的散点很接近一条直线时我们就根据经验公式估计:=a+bx 我们用数量:Y t-(a+b t)2刻划(X t,Y t)到直线L远距离,L线(Xn,Yn)(X5,Y5)(X3,Y3)(X1,Y1)(X4,Y4)图(X2,Y2),33,统计学知识补充回归分析,令Q(a,b)=Y-(a t+b t)2使Q(a,b)最小:最小=乘原则 解得 a=y-b x b=.,34,统计学知识补充回归分析,平方和分解公式与线性相关关系经验公式 Y=a+bX即使是非线性关系也能求

16、得,所以要作线性相关判别方法:求U:回归平方和(线性影响)Q:残差平方和(非线性影响)比较U和Q 选取量 F=U/Q/(n-2),35,统计学知识补充回归分析(计算复杂,略去),预报与控制(在MSA中,被用来估计线性的置信区间,在SPC 附录A中被用来估计样本量对指数的影响):当经验公式Y=a+bX 计算出以后,我们可以通过数据(x1,y1),(x2,y2),(xn,yn)来预报Yhat=a+bX+的范围。也就是Yhat的置信区间。该区间为:Yhat s,Yhat+s 求S:见MSA第93页;求:按MSA线性中的例子,样本量较大(n=60),n-2的t 分布接近N(0,1)(中心极限定理)。所

17、以我们可以直接查标准正态分布表:0.05,=1.96.这里S是关键,S越小,置信区间越窄,预报越准确。,36,习题部分,概 率题例:10个人抽两张球票,(既10个签,8个写“无”,2个写“有”),一个一个依次抽取,求第k(k=1,2,.10)个人抽得球票概率 古典概型题例:盒中装有五个球(三个白球,两个黑球),从中任取一个。问:取到白球的概率是多少?条件概 率题例:盒中装有五个球(三个白球,两个黑球),每次从中任取一个,无放回地取两次,求:第一次取到白球的概率;第二次取到白球的概率;第一次取到白球的条件下第二次取到白球的概率?,37,习题部分,独立性题例:自P25盒中装有五个球(三个白球,两个黑球),每次从中任取一个,有放回地取两次。全概 公式题例:盒中装有五个球(三个白球,两个黑球),每次从中任取一个,无放回地取两次,求:第二次取到白球的概率,38,习题部分,逆概 公式题例:自讲义P34题2盒中有12个乒乓球,9个新的,第一次比赛时取3个,比赛后放回盒中。第二次比赛时再从盒中取3个。求第二次 从盒中取到新球的概率。又,已知第二次 从盒中取到的都是新球,求第一次 从盒中取到的都是新球的概率?,39,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号