《统计技术应用操作规程.doc》由会员分享,可在线阅读,更多相关《统计技术应用操作规程.doc(28页珍藏版)》请在三一办公上搜索。
1、统计技术应用操作规程文件编码BPZK3-SOP.Q009版 本 号00代替文件代替文件编码部门职务签名日期起草人QA室文件管理员审核人QA室主管审核人质量部副经理审核人质量部经理批准人质量受权人颁发部门质量部生效日期分发份数Copy 分发部门质量部生产部研发部总经理办公室事务部市场部事业部财务部人事行政部QA室QC室采购部仓储组试剂盒车间细胞培养车间纯化车间工程设备组1目的对本公司质量管理体系内所有产品生命周期内要应用到的统计技术的使用方法进行规范,确保统计技术应用的正确性。2范围适用于对本公司质量管理体系内所有产品生命周期内的统计技术的应用。3职责3.1文件管理员:负责文件的编码工作。3.2
2、文件编制人、审批人:负责遵照执行。4内容4.1 基础知识4.1.1总体与个体:研究对象的全体,称为总体或母体;组成总体的每个单元称为个体。4.1.1.1研究对象的全体,指的是研究对象某 个数量 指 标 的 全部取值。4.1.1.2如果要研究的不是一个,而是几个数量指标,则要分为几个总体来研究。4.1.1.3总体的有限和无限类型随研究的问题而定。4.1.2样本与样品:从总体中随机抽取的若干个个体的总和称为样本或子样;组成样本的每个个体称为样品;样本中所有的样品的数目称为样本容量或子样大小,样本容量常用符号n代表。4.1.3统计量:描述样本数据统计性质的度量值称为统计特征量,简称统计量。统计量的数
3、值大小是由收集的样本数据决定的,统计量是样本数据的函数,但其中不包含未知的参数。常见统计量如下::子组大小,常用子组中观测值得个数。:子组数。:质量特性的观测值(可用表示单个观测值)。:子组平均值。:子组平均值得平均值。:过程平均值的真值。:子组中位数,对于一组升序或降序排列的个子组观测值,当为奇数时,为该组中间的那个数,当为偶数时,为该组中间2个数的平均值。:中位数的平均值。:子组极差,子组观测值中最大值与最小值之差(在单值图下,代表移动极差,即2个相邻的观测值差值的绝对值)。:极差平均值。:子组标准差4.2常用统计技术的使用4.2.1检查表,又叫调查表、统计分析表,是利用统计图表进行数据整
4、理和粗略的原因分析的一种工具。4.2.2排列图,又称帕累托图或主次因素分析图,排列图按下降的顺序显示出每个项目(例如不合格项目)在整个结果中的相应作用(发生次数、有关每个项目的成本或影响结果的其他指标)。用矩形的高度表示每个项目相应的作用大小,用累计频数表示各项目的累计作用。找出影响产品质量的主要因素,识别质量改进的机会。4.2.2.1排列图的绘制步骤4.2.2.1.1提出问题,制订收集数据的方案。4.2.2.1.2收集数据,对数据进行整理,列出分类统计表。 4.2.2.1.3将统计表输入Minitab(以下表数据为例),绘制出柏拉图,具体步骤如下:缺陷项目数量(个)虚焊500漏水焊300强度
5、不够200外观受损150其他160设置如下图:得到如下排列图:4.2.2.1.4在排列图上,常将曲线的累计百分数分三级,并相应的将因素分为三类。4.2.2.1.4.1A类因素:累积频率为080%,该区间的因素是主要影响因素。 4.2.2.1.4.2B类因素:累积频率为80%90%,该区间的因素是次要影响因素。 4.2.2.1.4.3C类因素:累积频率为90%100%,该区间的因素是一般因素。4.2.2.1.5注明数据收集的背景。 4.2.3因果图,又名鱼骨图、特性要因图、石川图,找出关键原因,作为制定质量改进措施的重点考虑对象的图。因果图采用收集各种信息,比较原因大小和主次,找出产生问题的主要
6、原因;也就是根据反映出来的主要问题(最终结果),找出影响它的大原因、中原因、小原因、更小原因等等。4.2.3.1因果图的绘制步骤4.2.3.1.1分析影响产品质量各种可能原因(可采用头脑风暴法)。4.2.3.1.2将原因(按5M1E)展开直至细到能采取措施为止。4.2.3.1.3将表输入Minitab中,输出因果图(以下表为例)。人机料法环测不够熟练设备没有保养原因没有检查没有设定标准化方法温度太高仪器偏差太大培训不够设备没有清洁原料含杂质量太高抽样方式不合理湿度太低仪器R&R太高监督不够没有进行点检设置如下:4.2.3.1.4画出因果图后,要针对主要原因列出对策表。4.2.3.2应用因果图的
7、注意事项4.2.3.2.1充分发扬民主,使所有参加人员充分发表意见、畅所欲言,防止技术权威“一言堂”。 4.2.3.2.2原因的表达具体、简练,并注意不要以对策代替原因。4.2.3.2.3原因分析要细到可以采取措施的程度。4.2.3.2.4对关键原因可再进一步进行因果分析,并进行重点考察,制定解决措施。4.2.3.2.5一张图只能用于分析一个质量问题。4.2.4直方图,是通过对随机收集的样本数据进行分组整理,并用图形描述总体分布状态的一种常用工具。适用于对大量计量值数据进行整理加工,找出其统计规律,即分析数据分布的形态,以便对其总体的分布特征进行推断,对工序或批量产品的质量水平及其均匀程度进行
8、分析的方法。4.2.4.1绘制步骤4.2.4.1.1收集数据, 输入Minitab(以下表数据为例),具体步骤如下:序号零件重量161.161.361.460.660.6626160.6260.660.860.961.36160.860.760.2361.360.660.360.761.260.661.162.146160.861.860.960.961.761.460.4560.960.260.661.561.759.862.162.366160.860.960.661.16161.160.9760.360.76161.760.561.661.660.7860.561.361.561.161
9、60.761.260.896161.46160.361.161.16161.11061.260.960.461.660.660.460.360.61160.460.561.361.261.960.96160.71260.860.859.760.86161.260.660.71362.361.261.2606160.161.461.11462.260.960.561.662.561.16161.41560.160.86161.160.861.561.760.54.2.4.1.2将数据堆叠到列(数据堆叠列),设置如下: 4.2.4.2直方图的原理:大部分计量指标服从正态分布,即在稳定正常生产状态下
10、得到的数据,其频数直方图的形状是“中间高、两边低、左右对称的山峰型”,我们称这种形状的直方图为正常型直方图。当存在“异常因素”时,质量特性的正态分布状态将被打破,频数直方图的形状将出现异常型。此时,应根据直方图形状迅速分析判断异常原因,采取措施,使工序恢复正常状态。4.2.4.3常见的几种异常直方图4.2.4.3.1孤岛型直方图:在主体直方图的左侧或右侧出现孤立的小块,像一个孤立的小岛(如下图),出现孤岛型直方图,说明有特殊事件发生。造成原因可能是一时原材料发生变化,或者一段时间内设备发生故障,或者短时间内由不熟练的工人替班等。4.2.4.3.2偏向型直方图(如下图):直方的高峰偏向一边。这常
11、常是由于某些加工习惯造成的。如加工孔时,有意识地使孔的尺寸偏下限,其直方图的峰则偏左;当加工孔时,有意识地使轴的尺寸偏上限,其直方图的峰则偏右。4.2.4.3.3平定型直方图(如下图):与双峰型类似,由于多个总体、多种分布混在一起。或由于生产过程中缓慢变化因素影响造成。4.2.4.3.4双峰型直方图(如下图):双峰型直方图是指在直方图中有左右两个峰,出现双峰型直方图,这是由于观测值来自两个总体、两种分布,数据混在一起。往往是由于将两个工人或两台机床等加工的相同规格的产品混在一起所造成的。4.2.4.3.5折齿型直方图(如下图):折齿型直方图形状凹凸相隔,象梳子折断齿一样。出现折齿型直方图,多数
12、是由于测量方法,或读数存在问题,或处理数据时分组不适当等原因造成。应重新收集和整理数据。4.2.4.3.5陡壁型直方图(如下图):绝壁型直方图左右不对称,并且其中一侧像高山绝壁的形状,当用剔除了不合格品的产品质量特性值数据作直方图时,往往会出现绝壁型直方图。此外,亦可能是操作者的工作习惯,习惯于偏标准下限,于是出现左边绝壁的直方图。4.2.4.4直方图与标准界限比较4.2.4.4.1理想直方图:散布范围B在标准界限T=Tl,Tu内,两边有余量(如下图)。此时,全部产品合格,工序处于正常管理状态。 4.2.4.4.2直方图的分布范围B位于标准范围T内,数据变化仍比较集中,但分布中心偏移标准中心,
13、并且直方图的一侧已达到标准界限(如下图), 此时状态稍有变化,产品就可能超出标准,出现不合格品。因此,需要采取措施,使得分布中心与标准中心重合。4.2.4.4.3直方图的分布范围B没有超出标准范围T,但没有余量(如下图)。此时分布中心稍有偏移便会出现不合格品,所以应及时采取措施,缩小产品质量特性值的分布范围。4.2.4.4.4产品质量特性值的分布太集中,致使直方图的分布范围B与标准范围T之间的余量过大。此时,可对原材料、设备、工艺等适当放宽要求,从而降低生产成本;或者加严标准,提高产品的性能,以利于组装等。4.2.4.4.5产品质量特性值的分布中心向左(或向右)偏离标准中心,致使直方图分布范围
14、B的下界限(上界限)超出标准范围T的下界限(或上界限),因而在下界限(或上界限)出现不合格品,此时,应设法提高(或降低)产品质量特性值的平均值,使直方图的分布中心向右(或向左)移动,从而使直方图的分布范围完全落在标准范围之内(如下图)。4.2.4.4.6直方图的分布范围B超出标准范围T,此时在标准上界限和下界限都出现不合格品。这种情况通常是由于产品质量特性值的标准差太大,应及时分析原因,采取技术措施,降低分布的标准差。如果属于标准定得不合理,可以放宽标准范围(如下图)。4.2.5线性回归4.2.5.1一元线性回归:一元线性回归是研究两个随机变量线性相关关系的方法。其目的是通过一系列的样本数 据
15、求得内在规律的数学表达式。从而由一个变量的取值去估计另一个变量的取值,达到预测和控制的目的。4.2.5.1.1对于一组样本值可求得其对应的回归方程系数如下(具体的推导过程可参考概率论与数理统计):,4.2.5.1.2Minitab的实现,以下表数据为例:X20303540507065807095Y10204050608070110110140先将此表数据在Excel转置,然后启动Minitab,按下图操作:从下图中t值的大小及P值0.0000.05,知回归系数是显著的。另由回归方程显著性检验的F值的大小及P值0.0000.05,知该回归方程式是显著的,由这两个检验我们接受该回归,若有任何一个检
16、验未通过,我们均不能接受给出的回归方程。4.2.5.2多元线性回归,多元线性回归是简单线性回归的推广,指的是多个因变量对多个自变量的回归,最常用的是一个因变量对多个自变量的回归。4.2.5.2.1多元线性回归方程对应的系数如下(具体推导过程见概率论与数理统计):其中,4.2.5.2.2 Minitab的实现,以下表数据为例:yx1x2x3212131.511521.31721.31821.50102.31.51172.521242.52.51252.420302.620312.541352.53036441424.13.504443.50454.33.50484.551504.45052470
17、554.1804.2.6假设检验4.2.6.1假设检验的原理4.2.6.1.1反证法:当一件事情的发生只有两种可能A和B,如果能否定B,则等同于间接的肯定了A。4.2.6.1.2小概率原理:发生概率很小的随机事件在一次实验中是几乎不可能发生的。4.2.6.2常用的几种假设检验4.2.6.2.1单个总体均值的检验,Z检验(详细见表*中编号1)4.2.6.2.1.1Minitab的实现一车床工人需要加工各种规格的工件,已知加工一工件所需的时间。现希望测定,是否由于对工作的厌烦影响了他的工作效率。今测得以下数据:t21.0119.3218.7622.4220.4925.8920.1118.9720.
18、9 先将数据在Excel中转置,然后输入Minitab中此处的备择应与表*中的备择相同,即应与相反。从上图中的及置信区间和的关系可知,应该拒绝原假设,即认为工作时间显著大于18min.4.2.6.2.2单个总体均值的检验,t检验(详细见表*中,编号2)4.2.6.2.2.1Minitab的实现,以下为例:某种元件的寿命,其中均未知,现测得16只元件的寿命如下:寿命159280101212224379179264222362168250149260485170是否有理由认为元件的平均寿命大于225.则:, 先将上表数据在Excel中转置后输入Minitab. 由上图中和与置信区间的关系可知,接受
19、.4.2.6.2.3两个正态总体均值差的检验,t检验4.2.6.2.3.1设是来自总体的样本,是来自总体的样本,且设两样本独立。又分别记他们的样本均值,记样本方差为.设,,均未知(详细见表*中,编号3)。4.2.6.2.3.2 Minitab的实现见下例。在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率,用标准方法和新方法各炼了10炉,其得率见下表,问新方法是否能提高得率?标准方法78.172.476.274.377.478.47675.576.777.3新方法79.18177.379.18079.179.177.380.282.1则: , 将上表数据输入Minitab.由上图中
20、的可知拒绝.4.2.6.2.4基于成对数据的检验(t检验) (详细见表*中,编号4)。4.2.6.2.4.1设有对相互独立的观察结果:, ,令,则相互独立,又由于是由于同一因素所引起的,可认为它们服从同一分布。假设.4.2.6.2.4.2 Minitab的实现,见下例:有两台光谱仪用来测量材料中某种金属的含量,为鉴定它们的测量结果有无显著差异,制备了9件试块,用这两台一起对每一试块测量一次,得到观察值如下表,问能否认为这两台仪器的测量结果有显著的差异?x0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 y0.10 0.21 0.52 0.32 0.78
21、0.59 0.68 0.77 0.89 d=x-y0.10 0.09 -0.12 0.18 -0.18 0.11 0.12 0.13 0.11 则:,将上表数据中的x-y值输入Minitab中: 由上图可知,接受,即两台仪器的测量结果并无显著差异。4.2.6.2.5正态总体方差的假设检验,单个总体的情况(详细见表*中,编号5)。4.2.6.2.5.1单个总体的情况,设总体,均未知,是来自的样本.要求检验假设(显著性水平,为已知常数):, 4.2.6.2.5.2 Minitab的实现,具体见下例:设某地水稻往年单位面积产量,先随机抽取10地,测得单位面积产量如下表:X54063067468069
22、4695708736780845问是否有理由认为该地区水稻单位面积产量的标准差有显著变化?则: , 将上表数据输入Minitab中从上边的图中及置信区间可知,接受.4.2.6.2.6正态总体方差的假设检验,2个总体的情况(详细见表*中,编号6)。4.2.6.2.6.1设是来自总体的样本,是来自总体的样本,且两样本独立。其样本方差分别为,且均为未知。(详细见表*中,编号6)。4.2.6.2.6.2 Minitab的实现,具体见下例:以4.2.6.2.3.2表中的数据为例,问是否有理由认为,则:, 将表中数据输入Minitab中 从上图中分布的可知接受.表*编号原假设检验统计量备择假设拒绝域1已知
23、2未知3已知4未知5未知或6未知或7成对数据4.2.7相关分析,相关分析是研究事物的相互关系,测定它们联系的紧密程度,揭示其变化的具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、预测和控制的重要工具。4.2.7.1相关系数 4.2.7.1.1二维随机变量的相关系数4.2.7.1.1.1若Y 是X 的线性函数,即 ,则有。 4.2.7.1.1.2 。4.2.7.1.1.3若无线性相关关系,则。但并不表示无其他关系,此时,也可能具有明显的非线性关系。4.2.7.2 Minitab的实现,详细见下例:某建筑公司想了解位于某街区内的住宅地产的销售价格Y与总评估价值X之间的相关程度到底有多大。从该街区去年售出的住宅房地产中随机抽选10所住宅的房地产作样本,分别的总评估价值和销售价格资料如下:总评估价值79760984801106559685910086110523094798139850170341155137销售价格95000116500156900111000110110100000130000170400211500185000将上表数据输入Minitab中,先绘出散点图 : 从上图可知相关系数为0.939。5相关/支持性文件5.1数据统计与分析控制程序6记录无。