误差及数据分析的统计处理.ppt

资源描述

《误差及数据分析的统计处理.ppt》由会员分享，可在线阅读，更多相关《误差及数据分析的统计处理.ppt（60页珍藏版）》请在三一办公上搜索。

1、误差及数据分析的统计处理,误差及数据分析的统计处理,定量分析中的误差,误差(Error)与准确度(Accuracy),1.误差测定值xi与真实值之差误差的大小可用绝对误差 E(Absolute Error)和相对误差 RE(Relative Error)表示。E=xi,相对误差表示误差占真值的百分率或千分率。,误差及数据分析的统计处理,2.准确度,(1)测定平均值与真值接近的程度;(2)准确度高低常用误差大小表示,误差小，准确度高。,例1：,分析天平称量两物体的质量各为1.6380 g 和0.1637 g，假定两者的真实质量分别为1.6381 g 和0.1638 g，则两者称量的绝对误差分别

2、为：(1.63801.6381)g=0.0001 g(0.16370.1638)g=0.0001 g两者称量的相对误差分别为：,绝对误差相等，相对误差并不一定相同。,误差及数据分析的统计处理,3.说明,(1)绝对误差相等，相对误差并不一定相同;(2)同样的绝对误差，被测定的量较大时，相对误差就比较小,测定的准确度也就比较高;(3)用相对误差来表示各种情况下测定结果的准确度更为确切;(4)绝对误差和相对误差都有正值和负值。正值表示分析结果偏高，负值表示分析结果偏低;(5)实际工作中，真值实际上是无法获得;常用纯物质的理论值、国家标准局提供的标准参考物质的证书上给出的数值、或多次测定结果的平均值当

3、作真值;,误差及数据分析的统计处理,误差及数据分析的统计处理,偏差(Deviation)与精密度(Precision),1.偏差个别测定结果 xi 与几次测定结果的平均值的差。绝对偏差 di：测定结果与平均值之差；相对偏差 dr：绝对偏差在平均值中所占的百分率或千分率。,误差及数据分析的统计处理,算术平均偏差（Average Deviation）：,相对平均偏差表示为:,2.标准偏差（Standard Deviation）,又称均方根偏差，当测定次数趋於无限多时，称为总体标准偏差，用表示如下：,为总体平均值，在校正了系统误差情况下，即代表真值；n 为测定次数。,(n-1)表示 n 个测定值中

4、具有独立偏差的数目，又称为自由度。,有限次测定时，标准偏差称为样本标准差，以 s 表示：,误差及数据分析的统计处理,用下式计算标准偏差更为方便：,s与平均值之比称为相对标准偏差，以 sr 表示:,也可用千分率表示(即式中乘以1000)。如以百分率表示又称为变异系数 CV(Coefficient of Variation)。,误差及数据分析的统计处理,已知两组数据，比较精密度好坏甲 0.3-0.2-0.4 0.2 0.1 0.4 0.0-0.3 0.2-0.3乙 0.0 0.1-0.7 0.2-0.1-0.2 0.5-0.2 0.3 0.1解：,误差及数据分析的统计处理,3.精密度,（1）精密度

5、：在确定条件下，将测试方法实施多次，求出所得结果之间的一致程度。精密度的大小常用偏差表示。（2）精密度的高低还常用重复性（Repeatability）和再现性（Reproducibility）表示。重复性(r)：同一操作者，在相同条件下，获得一系列结果之间的一致程度。再现性(R)：不同的操作者，在不同条件下，用相同方法获得的单个结果之间的一致程度。（3）用标准偏差比用算术平均偏差更合理。,误差及数据分析的统计处理,准确度与精密度的关系,精密度是保证准确度的先决条件；精密度高不一定准确度高；两者的差别主要是由于系统误差的存在。,精密度准确度好好好稍差差差很差偶然性,误差及数据分

6、析的统计处理,例：,分析铁矿中铁含量，得如下数据：37.45%,37.20%,37.50%,37.30%,37.25%计算此结果的平均值、平均偏差、标准偏差、变异系数。计算：,误差及数据分析的统计处理,误差的分类及减免误差的方法,系统误差或称可测误差(Determinate Error)偶然误差或称未定误差、随机误差(Indeterminate Errors)1.系统误差产生的原因、特点及减免,系统误差的特点,(1)重复性：同一条件下，重复测定中，重复地出现；(2)单向性：测定结果系统偏高或偏低；(3)可校正性：其大小可以测定，可对结果进行校正。,误差及数据分析的统计处理,（1）方法误差(Me

7、thod Errors):对照实验如反应不完全；干扰成分的影响；指示剂选择不当；对照试验：选择一种标准方法与所用方法作对比或选择与试样组成接近的标准试样作试验，找出校正值加以校正。（2）仪器和试剂误差：空白实验试剂或蒸馏水纯度不够；空白试验：指除了不加试样外，其他试验步骤与试样试验步骤完全一样的实验，所得结果称为空白值。,产生原因,误差及数据分析的统计处理,（3）操作误差例：分析天平，E=0.0001g，使其Er0.1%，则称量的物质最少为多少g?（4）主观误差（Personal Errors），如观察颜色偏深或偏浅，第二次读数总是想与第一次重复等造成。,误差及数据分析的统计处理,系统误差的判

8、断回收实验,在测定试样某组分含量的基础上，加入已知量的该组分，再次测定其组分含量。由回收试验所得数据计算出回收率。,由回收率的高低来判断有无系统误差存在。常量组分:一般为99%以上，微量组分:90110%。,误差及数据分析的统计处理,2.偶然误差产生的原因、性质及减免,由一些无法控制的不确定因素引起的。（1）如环境温度、湿度、电压、污染情况等的变化引起样品质量、组成、仪器性能等的微小变化；（2）操作人员实验过程中操作上的微小差别；（3）其他不确定因素等所造成。性质：时大时小，可正可负；非单向性；不可避免。减免方法：无法消除。,误差及数据分析的统计处理,偶然误差的分布服从正态分布,横坐标：以为单

9、位来表示的随机误差；纵坐标：误差出现的概率大小。,1.服从正态分布的前提测定次数无限多；系统误差已经排除。2.定义,误差及数据分析的统计处理,3.误差范围与出现的概率之间的关系,误差及数据分析的统计处理,置信度：在某一定范围内测定值或误差出现的概率。68.3%,95.5%,99.7%即为置信度,置信区间：真实值在指定概率下，分布的某个区间。，2，3 等称为置信区间。置信度选得高，置信区间就宽。,4.置信度与置信区间,误差及数据分析的统计处理,有限次测定中偶然误差服从 t 分布,有限次测定无法计算总体标准差和总体平均值,则偶然误差并不完全服从正态分布，服从类似于正态分布的 t 分布(t 分布由

10、英国统计学家与化学家提出，以Student的笔名发表)。t 的定义与 u 一致,误差及数据分析的统计处理,t 分布曲线,t 分布曲线随自由度 f(f=n-1)而变，当 f 20时，与正态分布曲线很近似，当 f 时，二者一致。t 分布在分析化学中应用很多。,t 值与置信度和测定值的次数有关，可由表 2-2 中查得。,误差及数据分析的统计处理,表2-2 t 值表,误差及数据分析的统计处理,讨论：,(1)由式：,得：,误差及数据分析的统计处理,(2)上式的意义：在一定置信度下(如95%)，真值(总体平均值)将在测定平均值附近的一个区间即在,之间存在，把握程度 95%。该式常作为分析结果的表达式。,

11、(3)置信度，置信区间，其区间包括真值的可能性，一般将置信度定为95%或90%。,误差及数据分析的统计处理,例：,测定 SiO2 的质量分数，得到下列数据，求平均值、标准偏差、置信度分别为90%和95%时平均值的置信区间。28.62,28.59,28.51,28.48,28.52,28.63解：,查表 2-2 置信度为 90%，n=6 时，t=2.015。,置信度为 95%时：,置信度，置信区间。,误差及数据分析的统计处理,例：,测定钢中含铬量时，先测定两次，测得的质量分数为1.12%和1.15%；再测定三次,测得的数据为1.11%,1.16%和1.12%。计算两次测定和五次测定平均值的置信区

12、间（95%置信度）。,查表 2-2，得 t95%=12.7。,解：n=2 时,误差及数据分析的统计处理,n=5 时：,查表 2-2，得 t95%=2.78。,在一定测定次数范围内，适当增加测定次数，可使置信区间显著缩小，即可使测定的平均值与总体平均值接近。,误差及数据分析的统计处理,公差,公差：生产部门对于分析结果允许误差的一种表示法超差：分析结果超出允许的公差范围。需重做。公差的确定：（1）组成较复杂的分析，允许公差范围宽一些；（2）一般工业分析，允许相对误差在百分之几到千分之几；（3）而原子质量的测定，要求相对误差很小；（4）国家规定。,误差及数据分析的统计处理,钢中的硫含量分析的允许公

13、差范围,国家标准中，对含量与允许公差之关系常常用回归方程式表示。,误差及数据分析的统计处理,分析结果的数据处理,为什么要对数据进行处理？数据进行处理包括哪些方面？可疑数据的取舍过失误差的判断分析方法的准确度（可靠性）系统误差的判断,误差及数据分析的统计处理,1.Q 值检验法,（1）数据排列 x1 x2 xn（2）求极差 xn x1（3）求可疑数据与相邻差：xn xn-1 或 x2 x1（4）计算：,（5）根据测定次数和要求的置信度,(如90%)查表2-4：（6）将 Q 与 Qx（如 Q90）相比，若 Q Qx 舍弃该数据,（过失误差造成）若 Q Qx 保留该数据,（偶然误差所致）,可疑数据的

14、取舍,误差及数据分析的统计处理,表 2-4 Q 值表,误差及数据分析的统计处理,（1）排序：x1,x2,x3,x4（2）求和标准偏差 s（3）计算G值：,Grubbs 法,（4）由测定次数和要求的置信度，查表得G 表（5）比较若G计算 G 表，弃去可疑值，反之保留。由于格鲁布斯(Grubbs)检验法引入了标准偏差，故准确性比Q 检验法高。,误差及数据分析的统计处理,表 2-3 G(p，n)值表,误差及数据分析的统计处理,例5：,测定某药物中Co的含量（10-4）得到结果如下：1.25,1.27,1.31，1.40，用Grubbs 法和 Q 值检验法判断 1.40 是否保留。,查表 2-3，

15、置信度选 95%，n=4，G表=1.46 G计算 G表故 1.40 应保留。,解：用 Grubbs 法：x=1.31；s=0.066,误差及数据分析的统计处理,用 Q 值检验法：可疑值 xn,查表 2-4，n=4，Q0.90=0.76 Q计算 Q0.90 故 1.40 应保留。,误差及数据分析的统计处理,讨论：,(1)Q值法不必计算 x 及 s，使用比较方便；(2)Q值法在统计上有可能保留离群较远的值。(3)Grubbs 法引入 s，判断更准确。(4)不能追求精密度而随意丢弃数据；必须进行检验；例：三个测定值，40.12,40.16 和 40.18,置信区间：40.07 40.23 之间（置

16、信度为95%）。,置信区间：40.0440.30，变大。,舍去 40.12：,误差及数据分析的统计处理,平均值与标准值的比较(方法准确性),检验一个分析方法是否可靠,常用已知含量的标准试样,用 t 检验法将测定平均值与已知值(标样值)比较:,若 t计算 t表，则与已知值有显著差别(存在系统误差)。若 t计算 t表，正常差异（偶然误差引起的）。,误差及数据分析的统计处理,例6：,用一种新方法来测定试样含铜量，用含量为11.7 mg/kg的标准试样，进行五次测定，所得数据为：10.9,11.8,10.9,10.3,10.0判断该方法是否可行？（是否存在系统误差）。解：计算平均值=10.8，标准偏差

17、 S=0.7,查表 2-2 t 值表，t(0.95,n=5)=2.78t计算 t表说明该方法存在系统误差，结果偏低。,误差及数据分析的统计处理,两个平均值的比较,相同试样、两种分析方法所得平均值的比较（缺标准值时）系统误差的判断对两个分析人员测定相同试样所得结果进行评价；对两个单位测定相同试样所得结果进行评价；对两种方法进行比较，即是否有系统误差存在；判断方法：t 检验法；F 检验法前提：两个平均值的精密度没有大的差别。,误差及数据分析的统计处理,F 检验法,也称方差比检验:,若 F计算 F表,被检验的分析方法存在较大的系统误差。,t 检验式：,误差及数据分析的统计处理,表 2-5 置信度9

18、5%时 F 值,fs大：方差大的数据的自由度；fs小：方差小的数据的自由度。（f=n-1）,误差及数据分析的统计处理,例7：,甲、乙二人对同一试样用不同方法进行测定,得两组测定值：甲：1.26,1.25,1.22 乙：1.35,1.31,1.33,1.34问两种方法间有无显著性差异？,解：n甲=3,S甲=0.021,n乙=4,S乙=0.017,查表2-5，F 值为 9.55，说明两组的方差无显著性差异。进一步用 t 公式进行计算。,误差及数据分析的统计处理,再进行 t 检验：,查表 2-2 t 值表 f=n1+n22=3+42=5，置信度 95%t表=2.57，t计算t表甲乙二人采用的不同方

19、法间存在显著性差异,误差及数据分析的统计处理,例7 的讨论：,（1）计算表明甲乙二人采用的不同方法间存在显著性差异；系统误差有多大？如何进一步查明哪种方法可行？（2）分别与标准方法或使用标准样品进行对照试验，根据实验结果进行判断。（3）本例中两种方法所得平均值的差为：,其中包含了系统误差和偶然误差。（4）根据 t 分布规律，偶然误差允许最大值为：,说明可能有0.05的值由系统误差产生。,误差及数据分析的统计处理,数据统计处理的一般步骤：1、计算统计值n,平均值，s2、可疑数据的取舍G/Q检验法3、剩下的数据进行F检验，检验精密度的显著差异4、在精密度误差不大的情况下，进行t检验，确定方法的准确

20、度,误差及数据分析的统计处理,有效数字及其运算规则,有效数字 1.实验过程中遇到的两类数字（1）非测量值如测定次数；倍数；系数；分数；常数()有效数字位数可看作无限多位。（2）测量值或计算值数据位数反映测量的精确程度。这类数字称为有效数字。可疑数字：有效数字的最后一位数字，通常为估计值，不准确。一般有效数字的最后一位数字有1个单位的误差。,2.有关有效数字的讨论,（1）正确记录实验数据分析天平 0.5180g（不能记录为0.518g或0.51800g)结果绝对偏差相对偏差有效数字位数0.51800 0.00001 0.002%50.5180 0.0001 0.02%40.518 0

21、.001 0.2%3,（2）数据中零的作用,数字零在数据中具有双重作用：a.作普通数字用 b.作定位用（3）注意点 a.改变单位不能改变有效数字位数 b.容量器皿:滴定管,移液管,容量瓶；4位有效数字 c.分析天平（万分之一）取4位有效数字 d.标准溶液的浓度，用4位有效数字表示:0.1000 mol/L e.对数值，小数点后的数字位数为有效数字位数,修约规则,1.为什么要进行修约？数字位数能正确表达实验的准确度，舍去多余的数字。2.修约规则：“四舍六入五留双”（1）当多余尾数4时舍去尾数，6时进位。（2）尾数正好是5时分两种情况：a.若5后数字不为0，一律进位，0.1067534 b.5后无

22、数或为0，采用5前是奇数则将5进位，5前是偶数则把5舍弃，简称“奇进偶舍”。0.43715;0.43725 数据修约规则可参阅GB8170-87。,3.示例与讨论,（1）示例：保留四位有效数字，修约：14.2442 14.24 26.4863 26.49 15.0250 15.02 15.0150 15.02 15.0251 15.03（2）一次修约到位，不能连续多次的修约如 2.3457修约到两位，应为2.3，如连续修约则为 2.3457 2.346 2.35 2.4 不对。,运算规则,1.加减法运算结果的位数取决于绝对误差最大的数据的位数例：0.0121 绝对误差：0.0001 25

23、.64 0.01 1.057 0.001,26.7091,2.乘除法运算,有效数字的位数取决于相对误差最大的数据的位数。例：(0.0325 5.103 60.0)/139.8=0.071179184 0.0325 0.0001/0.0325 100%=0.3%5.103 0.001/5.103 100%=0.02%60.06 0.01/60.06 100%=0.02%139.8 0.1/139.8 100%=0.07%,3、乘方或开方有效数字位数不变,先修约再运算？先运算再修约？结果数值有时不一样。将参与运算的各数的有效数字位数修约到比该数应有的有效数字位数多一位(多取的数字称为安全数字)，再

24、进行运算。,课堂练习1.在定量分析中，_ _误差影响测定结果的精密度；_误差影响测定结果的准确度。2.不加试样，按照试样分析步骤和条件平行进行的分析试验，称为_。通过它主要可以消除由试剂、蒸馏水及器皿引入的杂质造成的_。3.用减量法称取试样，使用了一只磨损的砝码，将对测定结果产生_误差。（正、负）,4.下列数据包括有效数字的位数为0.003080_位；6.020*10-3_位；1.60*10-5 _位；pH=10.85 _位；pKa=4.75 _位；0.0903molL-1 _位。5.下列情况所引起的误差中，不属于系统误差的是（）.A.移液管转移溶液后残留量稍有不同 B.称量时使用的砝码锈蚀C.天平的两臂不等长 D.试剂里含微量的被测组分,6.指出在下列情况下，各会引起哪种误差？如果是系统误差，应该采用什么方法减免？(1)砝码被腐蚀；(2)天平的两臂不等长；(3)容量瓶和移液管不配套；(4)试剂中含有微量的被测组分；(5)天平的零点有微小变动；(6)读取滴定体积时最后一位数字估计不准；(7)滴定时不慎从锥形瓶中溅出一滴溶液；(8)标定HCl溶液用的NaOH标准溶液中吸收了CO2。,7.两位分析者同时测定某一试样中硫的质量分数，称取试样均为3.5g，分别报告结果如下：甲：0.042%,0.041%；乙：0.04099%,0.04201%。问哪一份报告是合理的，为什么？,

展开阅读全文