《基础统计》PPT课件.ppt

上传人:小飞机 文档编号:5487385 上传时间:2023-07-12 格式:PPT 页数:81 大小:3.18MB
返回 下载 相关 举报
《基础统计》PPT课件.ppt_第1页
第1页 / 共81页
《基础统计》PPT课件.ppt_第2页
第2页 / 共81页
《基础统计》PPT课件.ppt_第3页
第3页 / 共81页
《基础统计》PPT课件.ppt_第4页
第4页 / 共81页
《基础统计》PPT课件.ppt_第5页
第5页 / 共81页
点击查看更多>>
资源描述

《《基础统计》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《基础统计》PPT课件.ppt(81页珍藏版)》请在三一办公上搜索。

1、Page 1,基础统计,Page 2,产品的品质特性一定会有波动!所以我们预期的观测值就会有差异:如果我们研究面板的尺寸,每个面板的尺寸是不是一样的;如果我们测量10台冰箱的能耗,得到的结果也是不一样的;世界上没有两片一模一样的树叶!这种差异使我们的工作更具挑战性!一般来说,我们不能相信来自一个数据点的结果,通常收集多个数据点、并且非常注意如何选取这些样本,以减少偏差。,变异(变异)的产生是必然的、意料之中的,是统计学的基础。,变异,Page 3,变异来源,造成这种变异的原因在于产品或服务实现过程中的因素变异,普遍来源有:,关键是要分析哪种变异对响应变量的贡献最大-分析技术,Page 4,变异

2、分类,我们把变异分成两类:系统变异(原因变异、特殊变异)预期的(和可预测的)测量结果之间的差异;随机变异(偶然变异)不可预测的测量结果之间的差异;,举例:金型正常的磨损 造成IC冲切异常普通原因 金型非正常的磨损 造成IC冲切异常 特殊原因,Page 5,统计学作用,统计学应用以下方法分析&处理 变异:,Page 6,为了解原料、制程、产品的品质特性,经调查或实验而得到的数字或数量。,数 据,统计学的应用,根本要有“数据”,Page 7,数据分类,Page 8,连续数据(计量):可使用一种度量单位 来描述的数据,如温度、长度离散数据(属性):以类别 作描述的数据,如“合格”与“不合格”、等级,

3、数据分类,Page 9,数据分类,Page 10,数据分类(Exercise),请说出以下的数据属性:ACF拉力需大于 400gf/cm 组立制程预警界限为不良率2.0%17EA07 IDD电流需小于 900 mA 1线的Tact time为23.5 s 11/5 OQC批退率 2000 ppm,Page 11,群体与样本,群体大小-N平均数-标准差-,样本大小-n平均数-X bar标准差-S,代表性?,Page 12,抽样原则,我们通过研究样本来估计群体 X bar;S;并使估计变异尽量小。,随机性,群体层别取样方法:随机抽样法 系统抽样法 分层随机抽样法 集体抽样法,Page 13,数据收

4、集,收集数据的目的为何?收集的数据可靠性如何?是否有遗漏或重复?,数据整理:分类与列表1、分类项目确定;2、归类整理;3、列表;,简单化、系统化,OK,Page 14,图表分析,频率分析工具 频率表 直方图,了解数据在每类(范围、区间)内出现的频率。,查检收数据直方显分布 柏拉抓重点 散布找相关 层别找差异 特性找要因 管制防变异,Page 15,QC手法回顾,查检收数据,柏拉抓重点,散布找相关,特性找要因,Page 16,直方显分布,管制防变异,QC手法回顾,Page 17,QC手法回顾,Page 18,数据给你什么信息?,图表分析,Page 19,频率表,为了解数据分布,我们构造频率表:全

5、距:最大值-最小值=23-17.4=5.6公里组数:K=1+3.32lg n=1+3.32lg100=7.64(8组)组距:R/K=5.6/8=0.7公里列出各组次数(频率)计算各组比率:该组频率/样本总数*100%,图表分析,Page 20,频率表给你什么信息?,图表分析,Page 21,直方图,直方图是对频率表的图形显示,图形给您什么信息?,LSL,USL,图表分析,Page 22,测知制程能力 计算产品的不良率 检查样本是否混入两个以上不同群体 测知有无假数据(选别)探测异常值 与规格或标准值比较,直方图的主要应用,图表分析,Page 23,1.测知制程能力,图表分析,Minitab:B

6、asic StatisticsQuality ToolsCapability Analysis,Page 24,2.计算产品的不良率,图表分析,Page 25,3.检查样本是否混入两个以上不同群体,直方图成双峰多峰形态:数据可能为混合两个或多个不同群体.(来自于不同设备、材料、班别等),图表分析,Page 26,4.测知有无假数据(选别),LSL,USL,直方图成削壁形态:往往是因制程能力不够,但为求产品符合规格,而进行全数选别。,图表分析,Page 27,5.探测异常值,异常值:会严重影响统计量(平均数、变异数)的计算;往往是改进的机会;,异常是机会,图表分析,Page 28,6.与规格或标

7、准值比较,制程能力合宜,制程能力过剩,图表分析,Page 29,基本统计量,Page 30,数据集中趋势 的统计量,中位数Median将数据从小至大或大至小依次排列,位居正中的数或中间两个数的平均值,称为中位数。,例1:18,20,21,24,26 Me21例2:2,3,4,5,6,84+5位居中间的两个数据为4和5,Me=(4+5)/24.5,基本统计量,Page 31,全距(Range)一群数值中最大值与最小值之差,称为全距。全距(R)最大值最小值,数据离散程度 的统计量,变异数(Variance)各测定值与平均值之差之平方总和,称为偏差平方和(变异数),基本统计量,Page 32,标准差

8、(Standard Deviance)(s样本标准差;群体标准差;)方差之开方,即为标准偏差(简称标准差)。,(=R/d2 近似计算),数据离散程度 的统计量,基本统计量,Page 33,基本统计量,Page 34,置信区间,为何我们要计算置信区间?,Page 35,置信区间,Page 36,置信区间,置信区间,Page 37,通常,置信区间具有附加的不确定性:,估计值 变异幅度,置信区间,置信区间,Page 38,置信区间,区间估计又称为置信区间:是用来估计参数的取值范围的,给结论留一些余地。置信区间(1-)与显著性水平()0.95置信区间(1-)0.05显著性水平()的置信区间=0.01表

9、示反复抽样1000次,则得到的1000个区间中不包含真值的仅为10个左右。区间估计的原理:样本分布理论置信区间统计量标准误到统计量标准误,Page 39,置信区间,例如:所谓 90%信赖区间,就是反复信赖区间得的10个信赖区间中,9个包含母体平均的意思。,Page 40,置信区间,置信区间,Page 41,如前所述汽车汽油效率案例中:X=20.033 S=1.254 n=100 t.025,99=1.98所以母体平均值的置信区间是:,20.033-1.98*1.254/10 20.033+1.98*1.254/10即:群体平均值置信区间=19.78520.281,置信区间,置信区间,Page

10、42,现在用Minitab 来计算信心区间!,所研究的数据,信心水准95%,置信区间,置信区间,Page 43,样本平均值,样本标准差,样本最小值,样本最大值,样本中位数,群体平均值置信区间,群体标准差置信区间,置信区间,Page 44,概率分布,概率分布三种应用,Page 45,本案例中,群体中汽车每升汽油23公里的概率有多少?,属于哪种类型?,概率分布,Page 46,已知规格超出概率,概率分布,Page 47,重要几率分配离散(计数值)几率分配:二项分布 超几何分布 泊淞分布连续(计量值)几率分配:正态分布 指数分布 对数分布 平均分布来自常态群体的抽样分布:T分布 F分布中央极限定理,

11、概率分布,Page 48,二项分布,主要应用于归还法抽样,概率分布,Page 49,解答:,Example某材料的不良率为6000ppm,现抽检30PCS,问不良品小于2PCS的几率。,概率分布,Page 50,我们用MINITAB来计算!,MINITAB:CalcProbability Distributions?,概率分布,Page 51,样本数,不良率或成功几率,预期数量,Cumulative Distribution Function Binomial with n=30 and p=0.006x P(X=x)2 0.999223,NOTE:成功几率=1-不良率,概率分布,Page 5

12、2,超几何分布,二项分布用于描述结果可记为Yes&No、群体为有限个数,取出样本不归还。几率分配形式 N-群体大小 n-样本大小 P-群体不良率 x-不良品数,主要应用于不归还法抽样,概率分布,Page 53,Example在一批总量N为50的产品中,随机抽取10件作检验。该产品不良率为0.06,买卖双方约定不良数1允2退,问:该批产品允收概率多少?,群体数量,群体中不良数或成功数,样本数量,预期数量,NOTE:M=N*P,概率分布,Page 54,Cumulative Distribution Function Hypergeometric with N=50,M=3,and n=10 x

13、P(X=x)0.902041即:抽到1个以下不良品的概率是90.2%,概率分布,Page 55,泊淞分布,二项分布用于描述结果可记为Yes&No;当样本量相当大、不良率趋近于0时。(n16、N10 n、P0.1)几率分配形式,=2.71828=np,概率分布,Page 56,Example在一批总量N为1200的产品中,随机抽取100件作检验。该产品不良率为0.5%,买卖双方约定不良数1允2退,问:该批产品允收概率多少?,Mean=n*p=100*0.5%=0.5,预期数量,Cumulative Distribution Function Poisson with mean=0.5x P(X=

14、x)1 0.909796,概率分布,Page 57,Example:我们统计了90为女士的身高,请制作成直方图,概率分布(课堂练习),Page 58,正态分布,Page 59,正态分布特征图,正态分布,Page 60,正态分布,正态分布,Page 61,减少变异,Z值与DPMO,正态分布,Page 62,Example零件规格:1.0300.030,假设我们测量了30个部件,X bar=1.050,S=0.015 请计算不符合规格的比率和该过程Sigma水平,正态分布,Page 63,Z Bench的定义,PUSL是相对USL的缺陷率 PLSL是相对LSL的缺陷率 PTOT是总缺陷率 PTOT

15、=PUSL+PLSLZ Bench是总缺陷率对应的Z值,可查正态分布表或计算获得。,正态分布,Page 64,Z值与DPMO计算,MINITAB:CalcProbability DistributionsNormal,正态分布,Page 65,正态分布,Page 66,中心极限定理为什么我们得到的数据通常是正态分布,正态分布,Page 67,提高过程能力因变量Y(响应变量),取决于自变量X(独立变量),至关重要的少数变量也被称为“杠杆”变量,因为它们对因变量具有重大影响。,80%原因变异+20%偶然变异=100%总变异,Page 68,过程改进的焦点是平均值偏离、还是标准差过大、还是两者兼而有

16、之!,Page 69,知 识 关 口,变异:必然存在于所有过程。来源?分类?计量数据&离散数据:定义、举例?群体和样本:抽样原则?方法列举?图形分析:频率表?直方图?应用列举?统计量:集中趋势统计量列举?离散趋势统计量列举?置信区间:定义?计算?与信心水准的关系?,Page 70,分布:二项、泊淞、正态?正态分布:特征?概率计算:ZP?USL&LSLPrZ bench:定义?PZ中心极限定理:定义?关注点?Y=f(X):变量分类?改进重点逻辑?提高过程能力的重点?过程改进的焦点?,知 识 关 口,Page 71,功效与样本大小(Power and Sample Size),What is Po

17、wer?There are four possible outcomes for a hypothesis test.The outcomes depend on whether the null hypothesis(H0)is true or false and whether you decide to reject or fail to reject H0.The power of a test is the probability of correctly rejecting H0 when it is false.In other words,power is the likeli

18、hood that you will identify a significant difference(effect)when one exists.一种假设检定有四种可能结果。结果取决于原(零)假设(H0)是正确还是错误,取决于你决定是“拒绝”还是“不能拒绝”H0。功效就是当H0原假设是错误时正确的拒绝它的可能性。换句话,功效(power)就是你鉴定出重大差别的可能性。,Page 72,a风险与 风险,Power=1-,Page 73,a风险与 风险,When H0 is true and you reject it,you make a Type I error.The probabil

19、ity(p)of making a Type I error is called alpha(a)and is sometimes referred to as the level of significance for the test.当H0原假设是正确的而你拒绝它,你将犯第一类错误。即第一类错误的可能性P=a。也叫拒真风险或是生产方风险。When H0 is false and you fail to reject it,you make a type II error.The probability(p)of making a type II error is called beta(

20、).当H0原假设是错误而你没有拒绝,你就犯了第二类错误。即第二类错误的可能性P=。也叫取伪错误或是消费方风险。,Page 74,Factors that influence power影响功效的因素,a the probability of a Type I error(level of significance).As the probability of a Type I error(a)increases,the probability of a type II error()decreases.Hence,as a increases,power=1-also increases.当a

21、风险(生产方风险),风险(消费方风险),power=1-,the variability in the population.As s increases,power decreases.当总体,power the size of the population difference(effect).As the size of population difference effect)decreases,power decreases.总体差异,power sample size.As sample size increases,power increases.样本大小(n),power。,P

22、age 75,P-value概念,如果我们否定原假设H0,P-value即为我们判定错误的概率;换句话说,当我们否定原假设时,P-value即为拒真错误(风险)的出错概率;值是关键,当p,不能拒绝原假设H0,当p,拒绝原假设H0。,Page 76,Power and Sample Size 1-Sample t计量型数据,Suppose you are the production manager at a dairy plant.In order to meet state requirements,you must maintain strict control over the pack

23、aging of ice cream.The volume cannot vary more than 3 oz for a half-gallon(64-oz)container.The packaging machine tolerances are set so the process s is 1.How many samples must be taken to estimate the mean package volume at a confidence level of 99%(a=.01)for power values of 0.7,0.8,and 0.9?(需要样本量大小

24、?)Minitab操作:1Choose Stat Power and Sample Size 1-Sample t.2In Differences,enter 3.In Power values,enter 0.7 0.8 0.9.3In Standard deviation,enter 1.4Click Options.In Significance level,enter 0.01.Click OK in each dialog box,Page 77,Interpreting the results 结果分析,分析结果:PowerandSampleSize1-SampletTestTes

25、tingmean=null(versusnot=null)Calculatingpowerformean=null+differenceAlpha=0.01Assumedstandarddeviation=1SampleTargetDifferenceSizePowerActualPower350.70.894714350.80.894714360.90.982651 Interpreting the results(结果说明):Minitab displays the sample size required to obtain the requested power values.Beca

26、use the target power values would result in non-integer sample sizes,Minitab displays the power(Actual Power)that you would have to detect differences in volume greater than three ounces using the nearest integer value for sample size.If you take a sample of five cartons,power for your test is 0.895

27、;for a sample of six cartons,power is 0.983.,Page 78,Power and Sample Size 2 Proportions 计数型,As a political advisor,you want to determine whether there is a difference between the proportions of men and women who support a tax reform bill.Results of a previous survey suggest that 30%(p=0.30)of the v

28、oters in general support the bill.If you mail 1000 surveys to voters of each gender,what is the power to detect the difference if men and women in the general population differ in support for the bill by 5%(0.05)or more?Minitab操作:1Choose Stat Power and Sample Size 2 Proportions.2In Sample sizes,ente

29、r 1000.3In Proportion 1 values,enter 0.25 0.35.4In Proportion 2,enter 0.30.Click OK.,Page 79,结果分析,结果:Session window outputTestforTwoProportionsTestingproportion1=proportion2(versusnot=)Calculatingpowerforproportion2=0.3Alpha=0.05 SampleProportion1Size Power0.25 1000 0.7070600.35 1000 0.665570Thesamp

30、lesizeisforeachgroup.Interpreting the resultsIf 30%(0.30)of one gender support the bill and only 25%(0.25)of the other does,youll have a 71%chance of detecting a difference if you send out 1000 surveys to each.If the population proportions are actually 0.30 and 0.35,youll have a 67%chance of detecti

31、ng a difference.,Page 80,1-proportion,For a one-sample test of proportion,enter the expected proportion under the null hypothesis for Hypothesized p in the dialog box.Suppose you are testing whether the data are consistent with the following null hypothesis and would like to detect any differences w

32、here the true proportion is greater than 0.73.假设:H0:p=0.7H1:p 0.7(where p is the population proportion)例:In Minitab,enter 0.73 in Alternative values of p;enter 0.7 in Hypothesized p.(The alternative proportion is not the value of the alternative hypothesis,but the value at which you want to evaluate

33、 power.),Page 81,2-proportion,For a two-sample test of proportion,enter the expected proportions under the null hypothesis for Proportion 2 in the dialog box.Suppose a biologist wants to test for a difference in the proportion of fish affected by pollution in two lakes.The biologist would like to detect a difference of 0.03 and suspects that about one quarter(0.25)of fish in Lake A have been affected.假设:H0:p1=p2H1:p1 p2In Minitab,enter 0.22 and 0.28 in Proportion 1 values;enter 0.25 in Proportion 2.,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号