《项目二试验检测数据处理.ppt》由会员分享,可在线阅读,更多相关《项目二试验检测数据处理.ppt(38页珍藏版)》请在三一办公上搜索。
1、项目二、试验检测数据处理,工程质量的评价是以试验检测数据为依据的。试验检测采集得到的原始数据类多量大,有时杂乱无章,甚至还有错误,因此,必须对原始数据进行分析处理才能得到可靠的试验检测结果。本章以数理统计与概率论为基础,介绍试验检测数据的处理方法。,情境一、认识误差,二误差的表示,相对误差,过失误差,随机误差,系统误差,多数情况下是由仪器或试验方法引起的;误差的数值和符号有较明显的规律。可通过试验或分析掌握其变化规律,在测量结果中加以修正。,是由许多难以控制的微小因素造成的,具有较强的偶然性;误差的数值和符号没有明显的规律;可用数理统计方法进行分析和处理,以获得可靠的测量结果。,是由于试验人员
2、测错、读错、记错或计算错误等疏忽大意、不小心造成的;或环境条件、试验对象的异常变化而引起的。误差的数值明显的偏离试验结果利用一定的准则先判定,然后从测得的数据中剔除。,三、误差的分类,四、误差的来源,装置误差,方法误差,环境误差,人为误差,情境二、抽样检验,1、总体:又称母体,是统计分析中所要研究对象的全体。有限总体:可以用数量来衡量的总体。无限总体:一批产品,一道工序或一个连续的整体。2、个体:组成总体的每个单元称为个体。3、样本:从总体中抽取一部分个体就是样本。4、样品:组成样本的每一个个体叫做样品。,一、基本概念,5、样本容量:是指样本中所含样品的数量,通常用n来表示。样本容量越大,可靠
3、性越大,工作量越大,花费越多。6、总体与样本的关系:7、检验的基本意义:、对各个物品的检验:各个产品试验与质量判定标准比较判定优良品与不良品、对批进行检验:批抽样对样品进行检验与批的判定标准作比较判定批的合格与否,二、抽样检验的意义,检测设备,破损性,非破损性,破坏性检验是不可能对全部产品都作检验的,非检验仪具器械的种类少,性能难以稳定,四、抽样检验常用方法,情境三、数据的修约规则,一、计数值数据和计量值数据,二、有效数字,有效数字的概念:由数字组成的一个数,除最末一位数字是不确切值或可疑值外,其他数字皆为可靠值或确切值,则组成该数的第一个不是0的数字开始的所有数字包括末位数字称为有效数字,除
4、有效数字外其余数字为多余数字。,0812、0.0762、3.54、2.00、3.54103,有效数字位数,三位,三、质量数据的修约规则,拟舍去的数字中,其最左面的第一位数字等于5,而后面的数字并非全部为0时,则进1,即所留下的末位数字加l。,拟舍去的数字中,其最左面的第一位数字小于5时,则舍去,留下的数字不变。,拟舍去的数字中,其最左面的第一位数字大于5时,则进1,即所留下的末位数字加1。,拟舍去的数字并非单独的一个数字时,不得对该数值连续进行修约,应按拟舍去的数字中最左面的第一位数字的大小,照上述各条一次修约完成。,拟舍去的数字中,其最左面的第一位数字等于5,而后面无数字或全部为0时,所保留
5、的数字末位数为奇数则进1,如为偶数则舍去。,情境四、数据的统计特征与分布,一、数据的统计特征,一、算术平均值,三、极差,四、标准偏差,五、变异系数,二、数据的分布特征,1、正态分布 正态分布是应用最多、最广泛的一种概率分布,而且是其他概率分布的基础。,平均值是f(x)曲线的位置参数,它决定曲线最高点的横坐标。标准偏差是f(x)曲线的形状参数,它的大小反映了曲线的宽窄程度。越大,曲线低而宽,说明观测值落在附近的概率越小,观测值越分散。越小,曲线高附近的概率越大,观测值越集中。,2、t分布,t分布有如下特征:以0为中心,左右对称的单峰分布;t分布是一簇曲线,其形态变化与n大小有关。自由度n越小,t
6、分布曲线越低平;自由度n越大,t分布曲线越接近标准正态分布(分布)曲线。,情境五、可疑数据的取舍方法,工程质量常会发生波动情况。由于质量的波动,自然会引起质量检测数据的参差不齐,有时还会发现一些明显过大或过小的数据,这些数据为可疑数据。因此,在进行数据分析之前,应用数理统计法判别其真伪,并决定取舍。,方案一、拉依达法,方案二、肖维纳特法,肖维纳特法可疑数据舍弃的标准为:,方案三、格拉布斯法,格拉布斯法假定测量结果服从正态分布,根据顺序统计量来确定可疑数据的取舍。例如做n次重复试验,测得结果为x1,x2,xn,而且xi服从正态分布。,按值由小到大顺序重新排成,得:,当最小值x1可疑时,则,当最大
7、值xn可疑时,则,在指定的显著性水平(一般0.05)下,求得判别可疑值的临界值 g0(,n),格拉布斯法的判别标准为:,gg0(,n),情境六、质量数据的统计方法,质量数据的统计,就是运用统计性规律,收集、整理、分析、利用数据,并以这些数据作为判断、决策和解决质量问题的依据。,方案一、直方图法,频数的统计方法的两种:一是以单个数值进行统计,即某个数据重复出现的次数就是它的频数;二是按区间数值进行统计,即是在已收集的数据中按照一定划分范围把整个数值分成若区间,按每个区间内数值重复出现的次数作为这个区间的频数。在质量控制中,一般多采用第二种方法,也就是按区间进行频数统计。,绘图步骤:(1)收集数据
8、一般应不少于50100个数据,本例为100个数据。(2)数据分析与整理从收集的数据中找出最大值与最小值,并计算其极差。(3)确定组数与组距通常先定组数,后定组距。组数用B表示,应根据收集数据总数而定。当数据为50以下时,B57组;总数为50100时,B610组;总数为100250时,B712组;总数为250以上时,B1020组。组距用h表示,其计算公式为:,(4)确定组界值 为避免数据恰好落在组界上,组界值要比原数据的精度高一位。第一组的下界值=xmin-h/2 第一组的上届值=xmax-h/2 第一组的上界值就是第二组的下界值,第二组的下界值加上组距h,即为第二组的界值,依次类推。(5)统计
9、频数 组界值确定后按组号统计频数、频率(相对频数)。(6)绘制直方图 以横坐标为质量特殊性,纵坐标为频数(或频率)作直方图。,方案二、控制图法,直方图是质量控制的静态分析法,反映的是质量在某一段时间里的静止状态。然而工程都是在动态的产生施工过程中形成的,因此,在质量控制中单用静态分析法是不够的,还必须有动态分析法。采用这种方法,可随时了解产生过程中质量的变化情况,及时采取措施,使生产处于稳定状态。控制图法就是典型动态分析法。,绘制步骤:收集数据并整理。原则上要求收集50100个以上数据。把数据按时间和分批的顺序排列、分组。计算各组的平均值、极差,并列于表中。计算各组平均值的平均值、极差的平均值
10、。计算控制界限。建立坐标,画出控制图。中心线用实线表示,控制界限用虚线示,并将样本数据按抽样顺序描在图上。,方案三、相关图法,1、绘图步骤:数据收集。成对地收集两种特性的数据做成数据表,数据应在30组以上。设计坐标。在坐标纸上以原因作x轴,结果(特性)作y轴,找出x、y的最大值和最小值,以最大值与最小值的差定坐标长度,并定出适当的坐标刻度。数据打点入座。将集中整理后的数据依次相应用“”标出纵横坐标交点。注说明。在图中适当位置写明数据个数、收集时间、工程部位名称、制图人和制图日期等。,2、相关图的几种基本类型:、正相关。随着x的增加,y也明显增加;、弱正相关。随着x的增加,y大体上也增加,但不像
11、正相关那样呈直线状;、负相关。随着x的增加,y也明显减小;、弱负相关。随着x的增加,y大体上减小,但不像负相关那样呈直线状;、不相关。x的增减对y无影响,即x与y没有关系;、非线性相关。点的分布呈曲线状。,图片,继续,相关图的基本形式,返回,3、回归分析 做出相关图后,即可根据回归分析揭示两个变量(因素)之间的相关关系,并可确定它们之间的定量表达式回归方程。在实际问题中,有时两个变量之间的关系是线性,而有时两个变量之间则存在非线性关系。因此,一般情况下,试验结果的数学表示包括三个方面的工作:确定回归方程的类型。确定回归方程中的回归系数。回归方程相关关系的判断。,一元线性回归是工程中常遇到的配直
12、线的问题。通过试验,可以得到若干组的对应数据,根据这些数据画出相关图,当点大致分布在一条直线附近时,说明两变量之间存在线性关系,即可以用一条适当的直线来表示这两个变量的关系。此直线方程为:Y a+bX 根据这个条件可以求得:,任何两个变量x、y的若干组试验数据,都可以按上述方法配置一条回归直线,假如两变量x、y之间根本不存在线性关系,那么所建立的回归方程就毫无实际意义。因此,需要引入一个数量指标来衡量其相关程度,这个指标就是相关系数,用r表示:,式中:,相关系数r是描述回归方程线性相关的密切程度的指标,其取值范围为11。的绝对值越接近于l,x和y之间的线性关系越好,当1时,x与y之间符合直线函数关系,称x与y完全相关,这时所有数据点均在一条直线上;如果趋近于0,则x与y之间没有线性关系,这时x与y可能不相关,也可能是曲线相关。对于一个具体问题,只有当相关系数的绝对值大于临界值时,才可用直线近似表示x与y之间的关系,也就是x与y之间存在线性相关关系,其中临界值与测量数据的个数n和显著性水平有关。,