《数据统计分析方法及应用.ppt》由会员分享,可在线阅读,更多相关《数据统计分析方法及应用.ppt(65页珍藏版)》请在三一办公上搜索。
1、数据统计分析方法及应用,品质管理部,数据化培训内容概要,01,PART ONE,数据统计,1、数据统计的重要性,美国杜邦公司的总经理理查德曾经指出“现代公司在许多方面是根据统计来行事的。我国著名经济学家、人口学家马寅初先生曾说过一句话“学者不能离开统计而研究,政治家不能离开统计而施政,事业家不能离开统计而执业。香港城市大学管理科学系介绍统计专业时用了四句话:1、各大国际机构和企业均设立完善的信息系统 2、统计是信息系统不可缺少的一项功能 3、所有具有规模的企业均视数据库为“金矿”4、统计分析便是开采这个“金矿”的最有效武器,1、数据统计整理的含义和内容,含义,将调查得到的统计数据根据分析的目的
2、进行审核、分类、汇总等加工处理,使之系统化、条理化,能够反映事物总体特征的综合资料的工作过程。,内容,包括数据处理和数据管理。数据处理包括分类、汇总、表现(制图、表);数据管理包括输入、贮存、更新、输出。,统计整理的步骤,编制统计表或统计图。通过日常的统计图,我们有时候可以直观地看出生产中的异常点。,数据处理,数据的处理环节至关重要,数据的处理是否科学合理,直接决定分析的结果是否科学有效。,数据的审核、筛选和排序,发现数据的基本特征,要发现数据中的错误,比如数据输入失误造成的数据错误,计算出现的错误等,这些数据必须规避,否则会对分析结果造成错误的影响。,制定系统的整理方案,主要包括指标体系的设
3、计,统计表、图的设计,具体工作计划的安排(人员、时间、培训)等。,4,3,2,1,常用的数据统计方法,一、EWMA指数加权移动平均值法,EWMA是一种在一系列数据中显示趋势变化的方法。该方法为一数据处理模型,当一段时间内数据较多,且较为分散,散点图和折线图无法准确的表现出该组数据的变化趋势,我们这时候采用EWMA指数加权移动平均值法来确定该组数据的变化趋势。根据实际的观测值(或量测值)我们可以求取 EWMA数值如下:1、En-1:前n个测量值的平均值,n=1/(1-);2、En=(1-)Mn+En-1;Mn为第n个测量值,一、EWMA指数加权移动平均值法,(0 1)表EWMA对于历史量测值之权
4、重系数其值越接近1,表对过去量测值的权重较高。从另一个角度看,决定了EWMA数值和跟踪实际数据突然发生变化的能力即时效性。显然随着增大,估计器的时效性就越弱,反之越强;另一方面,由于的存在,EWMA还表现出一定的吸收瞬时突发的能力,这种能力称为平稳性。显然随着减小,估计器的平稳性减弱,反之增强。,一、EWMA指数加权移动平均值法应用实例,EWMA趋势图,二、高斯正态分布法,高斯正态分布法的作用就是把同一指标两个时间段内的数据按正态分布处理,分别计算两组数据的平均值和标准偏差。通过做成的柱状图表示出两组数据的差别。方法是分别计算两组数据的平均值和标准偏差做成柱状图,柱状图中心越高,表明该组数据平
5、均值越大,柱状图越长,表明该组数据标准偏差越大,数据波动较大,控制能力较差。对于数据的比较非常有用,可以对比不同时期指标的控制和波动情况。,二、高斯正态分布法应用实例,高斯分布图,三、SPC趋势图,SPC趋势图,三、SPC趋势图应用实例,四、VLOOKUP函数,VLOOKUP函数是Excel中的一个纵向查找函数,按列查找,最终返回该列所需查询列序所对应的值。该函数的语法规则如下:VLOOKUP(lookup_value,table_array,col_index_num,range_lookup),四、VLOOKUP函数语法重点,VLOOKUP函数,四、VLOOKUP函数应用实例,02,PAR
6、T TWO,数据分析,一、方差分析,方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量对观测变量有显著影响的变量。通过分析不同来源的变量对指标变异的贡献大小,从而确定可控因素对产品变异指标影响的有效性。可以通过对比同一因素不同影响的两组数据,确定在同样的范围内波动或是有明显的差别,确定该变量是否为指标变异的有效变量。,一、方差分析,数值小于0.05,说明该因素差异比较显著,对产品变异的影响是有效的。,一、方差分析,数值大于0.05,说明该因素差异不显著,对产品变异的影响是无效的。,方差分析数据处理方差分析,一、方差分析应用实例,因果图就是当一个问题的特性受到一些要因的影响时,我们将这些
7、要因进行整理,成为有相互关系且有系统的图形。简言之它是一种将造成某项结果的诸多原因,以系统的方式(图表)来表达结果与原因之间的关系,又称为“特性要因图”。由于因果图其形状与鱼骨相似,故又常被称为“鱼骨图”。,二、因果图,二、因果图,将问题及造成问题的原因按父项及子项分类罗列后,选择“分析”-“质量和过程”-“关系图”-“确定”-“为选定列指定角色”-“确定”。具体步骤如下图:,二、因果图,二、因果图,因果图,二、因果图应用实例,三、相关性分析,线性拟合根据变量的个数可分为两个变量、三个连续变量以及多个变量的拟合。首先介绍2元变量拟合图的做法:将两个相关变量的数据输入JMP后,选择“分析”-“以
8、X拟合Y”-“为选定列指定角色”-“确定”。具体步骤如下图:,三、相关性分析二元拟合,三、相关性分析二元拟合,多元拟合图(油条大饼图)的做法:将多个变量的数据输入JMP后,选择“分析”-“多元方法”-“多元”-“为选定列指定角色”-“确定”。具体步骤如下图:,三、相关性分析多元拟合,三、相关性分析多元拟合,二元线性拟合多元拟合,三、相关性分析应用实例,目前,各生产单位物料周期均根据日常生产经验判断,在判断过程中存在不可预知的因素,在生产发生变化的情况下,可能对物料的周转周期存在误判,缺乏科学性。因此,要准确判断生产工序物料周转时间,必须依靠数据分析,科学化地找出精准的时间周期,从而为查找导致生
9、产出现异常的原因提供科学的方法和依据。,三、相关性分析生产周期分析法,三、相关性分析生产周期分析法,生产周期分析法,应用实例,三、相关性分析生产周期分析法,1、了解数据分布的形态;2、研究和分析过程能力;3、判断数据的真实性;4、计划产品的不良率;5、求分布的平均值与标准差;6、确定控制规格界限;7、与规格或标准值比较。,四、直方图的作用和应用目的,四、直方图常见直方图及其意义,四、直方图常见直方图及其意义,四、直方图常见直方图及其意义,以上图表我们可以获取以下信息:1、当落窑品指标合格率高时,白度、7.5m温度、21.5m温度、窑尾温度和二次风温度均比较集中于某个范围;2、当落窑品指标合格率
10、低时,白度、7.5m温度、21.5m温度、窑尾温度和二次风温度分布比较宽,范围跨度大。通过以上分析我们可以找出当落窑品指标合格率高时各指标控制范围,有利于稳定生产。,四、直方图应用实例,直方图多元直方图,四、直方图应用实例,控制图是对过程数据加以测定、记录和绘图,从而进行控制管理的一种用统计方法设计的控制图型。图上有中心线(Center Line)、上控制界限(UCL)和下控制界限(LCL),并有按时间顺序抽取的样本统计量数值的描点序列.参见下列控制图示图:,上控制限中心线下控制限,五、控制图,五、控制图设计原理图示说明,五、控制图单值-移动极差控制图,五、控制图单值极差控制图应用实例,单值极
11、差图,五、控制图取样树,首先,学习一下取样树相关知识,我们将会有以下收获:1、理解交叉与嵌套取样实验设计之间的不同点。2、在制定的方案中找出最佳的途径。,五、控制图取样树,五、控制图取样树,五、控制图均值-移动极差控制图,何时用?连续性数据,子群的大小大于1;为什么用?监控工艺过程控制;a:子群的变化是否一致(稳定);b:在工艺过程控制中是否有明显的变化证据;改进工艺控制;a:变化从何而来(是子群内还是子群间)b:寻找最大变化处来改进质量。如何用?变化可以分为两组;子群内和子群间;单值移动极差控制图关注子群内变化的稳定性;均值极差图区分子群内差异和子群间差异的变化。,五、控制图均值-移动极差控
12、制图,五、控制图均值-移动极差控制图,五、控制图均值-移动极差控制图,均值极差图,均值-移动极差控制图应用实例,对生产上各关键指标的评估,可以以评估报告的形式进行,通过评估报告,对指标的所有情况有清晰的了解。,六、生产过程评估,BLR-699雷诺指数正态分布图,正态(1931.44,52.847),六、生产过程评估,BLR-699雷诺指数SPC图,六、生产过程评估,BLR-699雷诺指数能力分析控制图,六、生产过程评估,生产能力=规格上限-规格下限/6*标准差CPk1.33生产合格:需要进一步提高CPk2.00 生产达到6 sigma质量,六、生产过程评估,cpk值计算及正态分布,六、生产过程评估应用实例,03,PART Three,分析报告,一、数据处理及分析方法作用,一、数据处理及分析方法作用,直方图,用来展示过程的分布情况,通过不同的分布情况反映出不同的控制状态,从而确定生产控制较好时期的一系列生产参数。,控制图,单值极差控制图可以用来分析单个工序生产因素控制情况,均值极差图可以用来分析多个并列工序间变异指标的原因分析。,生产过程评估,通过对生产过程能力(CPK)的评估,可以根据分析结果准确地判断目前单个生产指标稳定性控制情况,从而有效促进生产稳定性管理,帮助公司各生产工序稳定运行。,一、数据处理及分析方法作用,谢谢大家,