03932统计基础简介.ppt

上传人:文库蛋蛋多 文档编号:2470017 上传时间:2023-02-19 格式:PPT 页数:56 大小:1,014.01KB
返回 下载 相关 举报
03932统计基础简介.ppt_第1页
第1页 / 共56页
03932统计基础简介.ppt_第2页
第2页 / 共56页
03932统计基础简介.ppt_第3页
第3页 / 共56页
03932统计基础简介.ppt_第4页
第4页 / 共56页
03932统计基础简介.ppt_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《03932统计基础简介.ppt》由会员分享,可在线阅读,更多相关《03932统计基础简介.ppt(56页珍藏版)》请在三一办公上搜索。

1、统计基础简介,吴政哲,本课程为研发部,品保部,联信人员必修 修毕课程并考核合格后具资格担任上述各部门主办职务 本课程约当统计学大专程度课程并适度结合实务操作,统计简介,统计名词介绍,母體(Population):研究者所考虑具有某种特性的全体集合.样本(Sample):由母体中所选出的一个部分集合.抽樣(Sampling):由母体选择样本的程序或方法.参數(Parameter):研究者想了解的母体特性值.统计量(Statistics):由样本所计算出来的量,可以用来对母体参数进行推论.统计推論(Statistical Inference):自样本统计量对母体参数进行评估的过程.,资料性质,连续

2、型资料:数据本身构成可以以连续性的数值表示,如长度,重量等.离散型资料:数据本身构成无法以连续性的数值表示,如对或錯,赞成或反對,已婚或未婚等.利用连续型数据进行统计一般称为计量型统計,利用离散型资料进行统计一般称为计数型统计.,统计方法分类,常用商用或工业用统计方法可以分为下列三种:叙述性统计.推论性统计.多变量分析.一般本公司研究或检测使用叙述性统计及推论性统计已经足夠,当研究变数涉及三个以上且有交互作用时才会用到多变量分析.多变量分析在一般统计课程归类上属于研究所课程,适用于主办及以上主管或是资深工程師,将与实验设计另外开课.,叙述性统计,叙述性统计,一般叙述性统计量分为下列四种:集中趋

3、势统计量.位置统计量.离散趋势统计量.形状统计量.其中以集中趋势统计量及离散趋势统计量最为重要,本课程主要介绍这两种统计量.,集中趋势统计量,集中趋势统计量是用来提供一群资料的中心点或是代表量.常用的有平均數,中位數,众數,加权平均数等,一般最常用户为平均數,以 代表,其公式为:=(X1+X2+X3+Xn)/n,离散趋势统计量,集中趋势统计量是用来表达一群资料的分散状況.常用的有全距,变异數,标准差等,都很常用.全距(Range):为一群数据最大值和最小值的差距,其代表式为:R=MaxXi MinXi变异數(Variance):为每一笔资料Xi与中心點差距(Bias)的平方和平均,其代表式为:

4、,离散趋势统计量续,标准差(Standard Deviation):变异数的开平方,可以将之视为数据标准化后的平均差距其代表式为:,常态分配,常态分配(Normal Distribution):又称为正态分配,钟形分配,高斯分配.在工业统计上,这个分配是连续型数据最重要的假定分配.下图为标准化后的常态分配图.,常态分配代表式为:,在常态分配下利用z值查不良率,z值:常态分配在标准化之后只有一个机率密度函數,以z值所代表位置一查常态分配表立刻就可以取的机率,相当方便,在应用上,该机率常用者为不良率,在统计上属于推论性统计的预測.z值代表式为:,叙述性统计综合应用范例,瑞贤电镀厂使用某一种药水进行

5、Top Coat,标准要求盐雾试验必须达到120小時,瑞贤准备使用两种浓度5%及10%来试验该药水以便于量產,经试验后盐雾试验结果如下,请问瑞贤使用哪种浓度效果较佳?,范例解答,使用5%浓度虽然平均值较高,但是标准偏差较大显示制程较不稳定,在此状况下加算z值,经查常态分配z值表后发现不良率以10%浓度制程不良率远低于5%制程,故使用10%浓度药水进行量产较佳.,抽样分配,决策通常必须面对不确定性,统计即提供度量不确定性以提供决策的参考.由少数样本信息对整个母体作决策的方法称为推论性统计.推论性统计分为估計,预测与检定,估计就是用样本的信息来猜母体的特性,检定就是检查到底猜的对不對,猜错的机会又

6、是多少.,推论性统计,母体,样本,样本,计算统计量,资料收集,统计推论估计与预测,统计推论检定,推论性统计,确认母体特性寻找管理意义,抽样,简单随机抽样法.系统抽样法.分层随机抽样法.部落抽样法.,估计与误差,估计总是存在有误差,估计值的误差式为:估计值=参数(真值)+方法偏差+抽样误差.在实际应用上,只要方法用對,方法偏差及抽样误差其实都不是太大,而抽样误差是可以算出而加以检定.,卡方分配,由自由度为k 的标准常态分配所构成的分配为卡方分配,其代表式写成:Y=X12+X22+X32+Xk2 其密度函数图为:,卡方分配,卡方分配最主要的功能是拿来作检定用途,通常是用来进行适合度检定(Goodn

7、ess of Fit Test)或是检定常态分配数据的变异数是否等于某數.也可以以无母数检定的方式用来检定母体是否为常态分配.由卡方分配的特性延伸出另外两种分配,分为t 分配及F 分配.,t 分配,进行统计量计算时常以样本标准偏差取代母体标准偏差进行计算,问题是样本的分配状况由于样本数通常不大造成以样本标准偏差取代母体标准偏差的偏誤,此时样本标准偏差可以t 分配计算后再取代母体标准偏差.,t 分配,自由度(Freedom):样本数减一即为自由度.自由度无限大时t 分配等于常态分配.在实际应用上,样本数(或组数)大于等于25时可以视为常态分配应用与计算.t 分配主要的用途是拿来检定母体平均数及计

8、算信赖区間(Confidence Interval).运用在t 检定時,可以用来检定2个不同母体的平均数是否相等.,F分配,F分配起源于两个不同母体变异数的比較,其主要用途也是拿来检定不同母体变异数的差异性,另外一个更加重要的用途是用于ANOVA分析中三组以上母体平均数是否相等的问題.其代表式过于复雜,此处不列,其密度函数则如下:,假设与检定,假設(Hypothesis):假设是一种说法,说法对不對,不经过验证不知道,验证就是检定.统计上一旦作出假設,就应该进行检定.虚无假設(Null Hypothesis):虚无假设通常是研究者所要证实的说法.通常写成H0.对立假設(Alternative

9、Hypothesis):虚无假设通常是研究者所怀疑的说法.通常写成H1.,假设与检定,假设经过检定後,就应该做出判定看要接受虚无假设或是对立假設.此时可能会判定错誤,该判定错误可以分为:Type I错误:虚无假设是对的,但判定接受对立假设.Type II错误:虚无假设是错的,但判定接受虚无假设.,假设与检定,显著水準(Significant Level):为了使Type I错误及Type II错误越少越好,实务上在作检定时会先控制Type I错误在一定的机率以下,该机率则称为显著水準,然后在通过这个显著水平的决策下载来寻找使Type II错误的决策,这种方法称为最佳检定法.显著水平是一个机率,

10、通常定为10%,5%或是1%,显著水平以 表示.,母体平均数检定,母体平均数检定一般分为三种:左尾检定:其假设为 H0:=0 H1:0双尾检定:其假设为 H0:=0 H1:0,母体平均数检定,例子:客戶,供货商及品保人员对电镀膜厚关心方向对检定的影响:客户担心膜厚不足造成保护功能不足,所以使用左尾检定确保膜厚达到要求.供货商担心膜厚太厚造成成本上升,所以使用右尾检定确保成本不致太高.品保人员为顾及客户与供货商双方利益,以便可以向双方交代,所以使用双尾检定同时确保质量及成本均在要求范围内.,母体平均数检定范例,友信生产某螺丝杆径要求为6.18mm 6.35mm,经试产后抽10支样本进行测试后测试

11、值如下:请问以光标卡尺所测试的资料与分厘卡所测试的资料其平均数是否均為6.20?又请以测试数据推论该制程制程参数设定在6.20是否适當?使用 哪种量具效果较佳,为什么?,母体平均数检定范例解答,由于数据属于小样本且母体标准偏差未知,因此应使用t 检定母体平均數,计算式为:t=(-0)/(s/n)游标卡尺=-1.96 分厘卡=-3.20 查t 值表t 9,0.025=2.2622(双尾检定)使用光标卡尺时,t t 9,0.025,因此拒绝虚无假設,即平均数不等于6.20.但使用单尾检定时状况就不一樣,单尾检定时t 9,0.05=1.8331,此时均拒绝虚无假設,即平均数不等于6.20.,母体平均

12、数检定范例解答,制程平均值设定于6.20还算适當,以单因子t 检定来看,游标卡尺平均值的95%信赖区间为6.19354-6.20046,分厘卡平均值的95%信赖区间为6.19539-6.19921,标准偏差分别为0.00483及0.00267,在最倒霉的状况下,游标卡尺及分厘卡的Ppk值分别为0.934及1.921,可以看出使用如果使用光标卡尺作为量测系统時,则参数定在6.20是不适当的,应该适度的调升参數,在此范例建议调到6.21或6.22.如果使用分厘卡的话则制程还算可以.由上述可以得知使用分厘卡比使用光标卡尺的效果要好,除了上述原因之外,也可以使用双因t 检定来比较两者之间的差异.,两组

13、样本的检定,一般运用在检定两组样本时通常我们会介意的是平均数是否相等?变异数是否相等?在实际运用上两者常常搭配使用,检定平均数让我们可以选择较好的参数设定,而在质量特性上,变异数较大代表变异大质量较差.平均数检定通常使用t检定,变异数检定通常使用F 检定.,两组样本的检定范例,瑞贤电镀厂使用某一种药水进行Top Coat,标准要求盐雾试验必须达到120小時,瑞贤准备使用两种浓度5%及10%来试验该药水以便于量產,经试验后盐雾试验结果如下,请问这两种制程参数做出来的产品其平均数是否相等?其变异数是否相等?,范例解答,以Minitab进行成对样本t 检定得到下列结果:Two-sample T fo

14、r C1 vs C2 N Mean StDev SE MeanC1 10 145.0 13.9 4.4C2 10 141.00 6.15 1.9Difference=mu C1-mu C2Estimate for difference:4.0095%CI for difference:(-6.50,14.50)T-Test of difference=0(vs not=):T-Value=0.83P Value=0.423 DF=12由于p Value 0.05,检定结果不显著,接受虚无假設,即两种制程的平均数相等.,范例解答,以Minitab进行成对样本F 检定得到下列结果:F-Test(n

15、ormal distribution)Test Statistic:5.147P-Value:0.023Levenes Test(any continuous distribution)Test Statistic:4.531P-Value:0.047由于p Value均小于0.05,检定结果显著,拒绝虚无假設,即两种制程的变异数存在有显著性差异.,卡方检定,卡方检定运用甚廣,通常用来进行适合度检定或独立性(一致性)检定,本公司一般会用到的是适合度检定,适合度检定一般是用来确定样本数据是否符合哪一种分配的检定法.,连续性资料一致性检定范例,瑞贤电镀厂使用某一种药水进行Top Coat,标准要求

16、盐雾试验必须达到120小時,瑞贤准备使用两种浓度5%及10%来试验该药水以便于量產,经试验后盐雾试验结果如下,请问这两种制程参数做出来的产品测试值是否符合常态分配?,范例解答,以SPSS进行样本适合性检定得到下列结果:由于显著性均大于0.05,检定结果不显著,即该两组数据均属于常态分配.,变异数分析ANOVA,变异数分析与假设,前文提及检定两组样本的平均数是否相等可以使用t 检定,那两组以上样本要用什么方法来进行检定各组样本的平均数是否相等?答案就是变异数分析(ANOVA,ANalysis Of VAriance).通常其检定假设写为:H0:1=2=3=k H1:不是所有的平均数都相等,变异数

17、分析方法,变异数分析主要是利用数据的组间平方和(Between Group Sum of Square)及组内平方和(Within Group Sum of Square)进行比較,如果组间平方和很小,表示说每组变异很小相当接近,自然我们就可以估计其平均数概略相等,但这个量要多小我们才能说H0显著接收虚无假設?自然要有一个比较的对象,所以就拿组内平方和(变异)来比較.而其比值即为F 分配,如此又可以使用F检定来作判断.,变异数分析的应用,变异数分析主要用来分析不同的状况(制程或检验)下,所产生的结果是否相同,如果有所不同,其差异又在哪裡,又如何进行改善?因此,变异数分析广泛的应用在制程设計,实

18、验设計,量测系统研究等方面,因此研发人員,品保人員,实验室人员均应对本方法有所了解,以往后的工作方法将有很大的帮助.,变异数分析范例,某SAE 2级螺栓为达成其功能性要求,其抗拉强度要求为76,000 psi,为此以四种材料进行试验,其实验数据如表列,研究人员欲寻求最佳材料,请问何种材料为最佳材料?单位:ksi,范例解答,以Excel进行运算后到下列结果:,范例解答,依照上表结果,p 值为0.000显示出极为显著的差異,因此,使用不同材料后其结果极为不同,因此,接下来我们判定哪些较好,哪些较差,首先看平均數,平均数中以C1018离规格界限最遠,接着再算出估计不良率,也是C1018估计不良率最低

19、,因此,本范例中最佳材料应为C1018.,回归分析Regression Analysis,回归分析与假设,统计再讨论两组(或以上)变数時,常会问两个问題,一个是这些变量间是否有什么关係?如果有,关系有多大?另一个问题是变量对另一个变量是否有影響?第一个问题可以用相关系数来表示,另外一个就是回归分析,可以用回归式来表示.,简单线性回归式,回归的目的就是要找出变量间的关系式,使应变数(或称准则变数Dependent Variable)y 与独立变量(或称预测变量Independent Variable)x 间有下列函数关系:y=f(x)=a+bx 其中b为回归系數(Regression Coeff

20、icient),a为截距.求出回归式,即可进行预測,解释及控制之用.,相关与因果关系,有相关时不一定有因果关係,第一,我们不一定清楚那个是因那个是果,第二,相关的来源可能是因为这些变量同时受到其他变量的影響,在研究上,回归常是用来建立模式的工具,建立模式時,因果关系非常重要,弄错了就牛头不对马嘴.,回归分析范例,某客户要求其采购螺栓之盐水喷雾试验须达72小时以上,电镀厂使用某种重铬酸后处理药水进行制程研究,其实验数据如下,请列出回归式并说明浸泡时间至少多久才可达成基本要求.,范例解答,以Excel进行回归分析后得到下列结果:,范例解答,R square=0.9931 0.1显示线性关系高.回归式 耐盐喷时数=52.4+1.344浸泡时间72=52.4+1.344基本浸泡时间 基本浸泡时间=14.583分钟,结论,结论,上述所列各项均属于基本统计部分,友信需要进行统计分析人员均应有所了解并知道如何应用,在进阶课程中,下列为不同部门所需要了解并应用的课程:实验设计:研发部.MSA:品保部文件課,实验室.品管工具箱:品保部.多变量分析:研发及品保主管.,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号