《第3章定量分析中误差及数据处理ppt课件.ppt》由会员分享,可在线阅读,更多相关《第3章定量分析中误差及数据处理ppt课件.ppt(69页珍藏版)》请在三一办公上搜索。
1、第3章 定量分析中的误差及数据处理,Errors and Data Processing In Quantitative Analysis,学习目的,原始测量数据如:m、V,有效数字,测量误差客观存在,测量结果:x1、x2、x3,应记录几位数字?,计算公式,应保留几位数字?,有效数字的运算及修约,误差的分类、特点及消除或减小,如何用测量值x1、x2、x3科学的表达样品真值,置信区间,可疑数值判断,显著性检验,基本内容,3-1 误差的基本概念3-2 误差的传递3-3 有效数字及运算规则3-4 随机误差的正态分布3-5 少量数据的统计处理3-6 数据评价显著性检验、异常值的取舍3-7 提高分析结果
2、准确度的方法3-8 回归分析(自学,第11章涉及),3-1 误差的基本概念(1),误差:指测定值与客观存在的真值的接近程度,用于衡量测定结果准确度的高低。,绝对误差(Absolute Error),相对误差(Relative Error),存在正负,真值是无法获得的。通常可用标准值(采用多种可靠的方法,由具有丰富经验的分析人员经过反复多次测定得出的比较准确的结果)代替;纯物质中元素的理论含量亦可作为真值。,例1:测定含铁样品中wFe比较结果的准确度:铁矿中:1=62.38%, =62.32%Li2CO3试样中:2=0.042%, =0.044%,解:,相对误差考虑了分析结果自身的大小,表示准确
3、度更具有实际意义,3-1 误差的基本概念(2),偏差:指平行测定结果(x1, x2, x3xixn)之间的接近程度,用于衡量所得结果的精密度。, 极差: 相对极差:,简单直观,但没有用到全部数据,适用于少数几次测定,偏差: 相对偏差: 平均偏差: 相对平均偏差:0,3-1 误差的基本概念(3),n-1:自由度(f),n;s,亦称变异系数CV,与真值一样无法获得的,但可由具有丰富经验的分析人员经过反复多次测定得出的s代替。,分析对象的整体称为总体,从中随机抽取的一部分称为样本,样本所含的个体数称为样本容量(n),样本的相对标准偏差,总体的标准偏差,样本的标准偏差,例2:判断下列两组测定数据精密度
4、的差异,解:,标准差能更加灵敏的反应出精密度的差异,是否表明第二组数据的精密度比第一组好?,准确度与精密度的关系,精密度好是准确度好的前提精密度好不一定准确度高(可能存在系统误差)在消除系统误差的前提下,可用精密度表示准确度,3-1 误差的基本概念(4),误差的分类系统误差(Systematic Error)具有单向性、重现性、为可测误差,理论上可消除随机误差(Random Error),亦称偶然误差由不确定因素引起服从统计规律(见3-4)过失误差(mistake)由粗心大意引起,可以避免,通常不算入误差范畴,系统误差的来源及消除,方法误差:方法选择不适当,如重量法中沉淀剂选择不当 选用其他方
5、法或校正 试剂误差:不纯或存在干扰物质 更换试剂或做空白实验扣除仪器误差:如刻度不准、砝码磨损等 校正主观误差:如颜色观察、读数习惯等 加强技术训练,如何判断系统误差的存在?(见3-6),空白实验,在不加待测组分的情况下,按照与待测组分完全相同的分析条件和步骤进行测定,所得结果即为空白值。将试样测定值减去空白值,即可消除由于试剂、用水、实验器皿等含有被测组分或干扰物质而产生干扰误差。,例3:指出下列情况会引起哪种误差?如果是系统误差应如何消除?,系统误差;校正,系统误差;提纯或空白实验,随机误差,随机误差,系统误差;加强训练,过失;重做,系统误差;改用定量滤纸,系统误差和随机误差的比较,3-1
6、 误差的基本概念(5),公差(允许差):是由多次测定所得的一系列数据中最大值和最小值的允许界限,生产部门对分析结果误差允许的一种限量。公差范围的确定涉及到多种因素,即可用相对误差表示,亦可用绝对误差表示。分析结果在公差允许范围内即为合格,反之则需重做。,3-2 误差的传递(1),定量分析的分析结果是由各测量值按一定的公式运算得到。由于各测量值都有各自的误差,因此各测量值的误差都将会传递到分析结果中去,而影响分析结果的准确度。如果能够知道误差的传递规律,就可用每个测量值的误差来估算分析结果的误差。很重要,但由于实际计算很困难,且在通常的分析测定中较少应用,因此不作要求。,3-2 误差的传递(2)
7、,虽然不要求掌握由测量值的误差来估算分析结果误差, 但应当知道测量过程中误差是不断积累的,最终误差主要由误差最大的那一步决定,因此设计实验时应使分析各环节的测量误差基本接近,以使分析测定准确、快速进行。如常量滴定分析(Er0.3%)中,称量误差、体积误差及终点误差通常均控制在0.1%以内;又如直接电位法的误差为4%左右,称样量为1g左右,精度为0.01 g的天平(台秤)即可满足要求。,3-2 误差的传递(2),极值误差假设每一步所产生的误差都是最大的,而且相互积累,此时算得的误差称为极值误差。由于各测量值的误差未必会是最大值,且存在正负抵消的可能,因此极值误差表示误差大小并不很合理,但可用于粗
8、略估计可能出现的最大误差。,例4:滴定分析中滴定体积的控制50 mL滴定管的读数精度?读取一次滴定体积的极值误差?计算滴定体积分别为2.00和20.00 mL时相对极值误差。,0.01 mL,0.02 mL,解:,常量滴定分析时,通常要求由滴定管读数引起的误差在0.1%以内,同时要求节约试剂,因此滴定体积一般应控制在2030 mL范围内(25 mL),例5:滴定分析中称样质量的控制万分之一分析天平的精度?称取一份试样的绝对误差?计算称样质量分别为20.0和200.0 mg时相对误差。,0.1 mg,0.2 mg,解:,常量滴定分析时,通常要求称量引起的误差在0.1%以内,因此称样质量一般应控制
9、在200 mg以上,3-3 有效数字及其运算规则(1),有效数字:指实际能测到的数字,包括全部可靠数字及一位不确定数字,它既反映数字的大小,也反映测量精度。质量分析天平(称至0.1mg):12.8218 g ;0.2238 g ;0.0500 g千分之一天平(称至0.001g):0.234g百分之一天平(称至0.01g):4.03g ;0.23g台秤(称至0.1g):4.0g ;0.2g,3-3 有效数字及其运算规则(2),体积滴定管(量至0.01mL):26.32 mL 4;3.97 mL 3容量瓶:100.0 mL 4;250.0 mL 4 移液管:25.00 mL 4 量筒(量至1 mL
10、或0.1 mL):25 mL 2,4.0 mL 2,应用时应根据需要选择适当的衡、量器,关于有效数字的几项规定(1),数字前0不计,数字后0计入:0.02450数字后的0含义不清时,最好用指数形式表示:1000(1.0103, 1.00103, 1.000103 )自然数可以看成具有无限多位有效数字(如倍数、分数关系);常数也可以(、e)数字第一位大于等于8的,计算时可多计一位有效数字:9.45 104, 95.2%,8.65,关于有效数字的几项规定(2),对数与指数的有效数字按尾数计:10-2.34;pH=11.02,则H+=9.510-12误差只需保留1-2位化学平衡计算中,结果一般保留2
11、个有效数字(由于K值一般为两个有效数字)常量分析一般为4个有效数字(Er0.1%);微量分析一般为2-3个有效数字。,测定结果如下:1.25,1.27,1.31,1.40,求得s=0.07。误差(偏差)应该与测量值具有相同的精度。,10-2.34=0.004571;10-1.34=0.04571;10-0.34=0.4571指数(对数)的整数部分对仅影响结果中小数点的位置,例6:关于有效数字下列数值中,有效数字为四位的是( )A. =3.141 B. pH=10.50 C. MgO%=25.30 D. 222.30测得某种新合成的有机酸pKa为12.35,其Ka值应表示为( )A. 4.467
12、10-13 B. 4.4710-13 C. 4.510-13 D. 410-13已知某溶液的pH为11.02,其氢离子活度的正确表示为( )molL-1A. 9.55010-12 B. 9.5510-12 C. 9.510-12 D. 110-11 已知某样品的测量数据为(%)0.25、0.20、0.18、0.24、0.23、0.25、0.22,计算其:,0.22,0.02,0.03,3-3 有效数字及其运算规则(3),有效数字运算中的修约规则:四舍六入五成双,例如要修约为四位有效数字时:尾数4时舍:0.52664 0.5266尾数6时入:0.36266 0.3627尾数5时:(1)若后面数为
13、0, 舍5成双: 10.2350 10.24 ,250.650 250.6 (2) 若5后面还有不是0的任何数皆入:18.0850001 18.09,3-3 有效数字及其运算规则(4),加减法运算规则:结果的绝对误差应不小于各项中绝对误差最大的数,即与小数点后位数最少的数一致,乘除法:结果的相对误差应与各因数中相对误差最大的数相适应,即与有效数字位数最少的一致,0.012125.661.05780.328432,3-3 有效数字及其运算规则(5),在目前的实际应用中,通常运算过程中不必修约,只对最后结果修约即可,但是必须符合方法精度。最终测定结果的表示:(1)化学法:含量10%时4位,10%时
14、3位;测定中涉及到的标准溶液浓度通常为4位;(2)仪器法:2-3位(识具体而定),3-4 随机误差的分布规律(1),测量值x的分布规律正态(高斯)分布,前提:测量中不存在过失误差,y: 概率密度 x: 测量值: 总体平均值 : 总体标准差,=真值,和分别决定了正态曲线的位置与形状,描述了测量值x出现在某一位置的概率密度或出现在某一区域内的概率(如:出现在+内的概率为1),反映数据集中趋势,反映数据分散趋势,3-4 随机误差的分布规律(2),测量平均值 的分布规律,即一系列测定的平均值 (m)的分布规律(其中任一平均值均是n(有限)次测定平均结果),亦符合正态分布,描述了测量平均值 出现在某一位
15、置的概率密度或出现在某一区域内的概率。,统计学证明,:总体平均值的标准差:总体的标准差,以平均值表示测定结果,可有效地减小随机误差!,:样本平均值的标准差:样本的标准差,3-4 随机误差的分布规律(3),随机误差的分布规律,随机误差分布规律对称性:绝对值相同的正负误差出现概率相等(相互抵消)集中性:小误差出现的概率大,大误差出现的概率小,特大误差概率极小(小概率原理:测量次数较少时不会出现大的误差),描述了随机误差出现在某一位置的概率密度或出现在某一区域内的概率,随机误差,符合正态分布,3-4 随机误差分布规律(4),标准正态分布曲线(1),3-4 随机误差分布规律(5),标准正态分布曲线(2
16、),标准正态分布N(0,1),将所有形状的状态分布曲线,转化为一固定形状的曲线,u的含义还是随机误差(以为单位),因此曲线下的面积还是指随机误差出现在这一区域内的概率,3-4 随机误差分布规律(6),正态分布概率积分表,0.40.30.20.10.0,-3 -2 -1 0 1 2 3,标准正态分布曲线N(0,1),0.40.30.20.10.0,-3 -2 - 0 2 3,-3 -2 - + +2 + 3,-4 -3 -2 -1 0 1 2 3 4,随机误差的区间概率,测定值x落在区间up内的概率是P是否可以推出区间xup包含的概率也是P,x落在区间内的概率为Pu落在up区间内的概率也为P,u
17、=1时,x(测定值)处于区间()的概率为68.3%,即对于无限次测量有68.3%的x落在区间()内,这些x所形成的区间(x)一定包含!因此任一x与组成的区间(x)包含的概率也为68.3%,0.40.30.20.10.0, -2 - + +2 x,68.3%,由于随机误差的必然存在,测量值x不能直接等同于真值如果上式成立,则可以在给定概率P的前提下(up已知),由测定值x和标准偏差组成一个区间,而该区间包含的概率为P,如此就可以科学地表示测定结果了。由于是在一定概率(置信度)下获得的区间,因此称为置信区间。,3-4 随机误差分布规律(7),的置信区间一定置信度(概率)下,可能存在的区间用单次测定
18、值表示:用n次测定的平均值表示:,例7:某标准钢样含磷为0.087%,标准分析方法的=0.002%,现在按标准方法进行分析,四次测定结果(%)分别为0.083、0.084、0.086、0.087,请给出置信度为95%时测定结果平均值的置信区间。,解:,不知道时,应该怎么表示分析结果呢?,3-5 有限数据的统计处理(1),实际测定流程,总体,样本,数据,抽样,测定,如何用统计方法的方法给出置信区间呢?,t分布曲线,-3 -2 -1 0 1 2 3,t也表示随机误差(以 为单位),曲线下的面积也是指随机误差出现在该区域的概率。(t、f、P三者的关系?),以t值代替u值,从而修正消除以 代替 所引起
19、的偏差。,t分布值表,40表3-7,3-5 有限数据的统计处理(2),的置信区间已知时:未知时:,例8:测定SiO2质量分数,得到下列数据(%):28.62,28.59,28.51,28.48,28.52,28.63,求置信度分别为90%和95%时的总体均值的置信区间。,解:,置信度为90%时:,置信度为95%时:,置信度越大,置信区间范围越大,因此应根据实际情况选择适当大小,例9:测定钢中铬含量,所得数据如下(%):1.12,1.15,1.11,1.16,1.12。分别按前两次测定和五次测定数据来计算总体均值的置信区间(p=95%)。,二次测定:,五次测定:,增加测量次数,可在相同置信度下,
20、缩小置信区间的范围。,解:,测定次数与置信区间的关系,0 5 10 15 20,1.00.80.60.40.20.0,综合误差和工作量等方面考虑,实际测定时n=3-6次即可,3-6 数据的评价,是否存在系统误差,是否存在操作过失,可疑数据检验,显著性检验,真值,3-6-1 可疑数据的取舍(1),Q检验法按大小排序(x1,x2,x3,xn)确定可疑值( x1 或xn )计算Q值选定置信度,查表得Qp,n(表)判断取舍,每次检验只能确定一个可疑值。若该值需被舍弃,可按相同的方法对剩下的数据进行检验。,Q值表,44表3-9,3-6-1 可疑数据的取舍(2),Grubbs法按大小排序(x1,x2,x3
21、,xn)确定可疑值( x1 或xn )计算G值选定置信度,查表得Gp,n(表)判断取舍,与Q相同,每次检验只能确定一个可疑值。若该值需被舍弃,可按相同的方法对剩下的数据进行检验。,Gp,n值表,44表3-10,例10:测定药物中Co的质量分数(10-6)得到如下结果:1.25,1.27,1.31,1.40。分别用Q检验法和Grubbs法判断是否存在可疑值(p=95%)。,解:,Grubbs法:,保留,Q检验法:,保留,采用不同的置信度或不同的判定方法得到的结果可能不同。,3-6-2 显著性检验(1),测定值与标准值的比较提出假设:=0计算t值给定显著水平查表得t,f(t表)判断,例11:用一种
22、新方法来测定试样中的Cu含量,对含Cu为11.7 mg/Kg的标准试样进行测定,所得数据为10.9,11.8,10.9,10.3,10.0(mg/Kg)。判断该方法是否可以行?,解:,假设不成立,新方法测得数值偏低!,3-6-2 显著性检验(2),两组测定结果的比较涉及两组 、n、s,应如何处理?首先对两组数据的测量精密度进行比较(F检验);在F检验结论的基础上,再对两组数据进行t检验。需要进行F+t两步检验,F检验-比较两组数据的精密度,假设1=2计算F值给定置信度,查表的F(fs大,fs小)判断,两组数据精密度不相同时进行t检验很复杂,本课程仅要求两组数据精密度相同的情况。,置信度为90%
23、的F值表(双边),41表3-8,若进行单边检验,上面的置信度为95%,t检验-比较两组数据的平均值,假设1=2计算t值给定显著因子,查表得t表判断若t计算t表,表明存在显著性差异;反之则不存在。,合并标准差,例12:甲乙两人用同种方法测定某试样,结果如下,解:,F检验(给定=0.10),t检验(给定=0.10),甲乙的测定结果存在显著性差异,若仅比较精密度是否存在显著性差异,只需进行F检验。,是否可根据检验结果判定哪组数据存在系统误差呢?,3-7 测定方法的选择与准确度的提高,选择合适的分析方法根据待测组份的含量、性质,试样的组成及对准确度的要求减小测量误差取样量,滴定体积等要控制在适当的范围
24、减小随机误差使平均值更接近真值消除系统误差显著性检验确定有无系统误差存在;找出原因,对症解决,系统误差的判断,标准物质(3-6中显著性检验1)标准方法(3-6中显著性检验2)回收实验,作 业,完成作业1,并与下周二上交;为了登记方便,请一定写上作业编号,即各位同学在本班点名册中的顺序(与作业同时发到公共信箱);作业字迹要工整,可以较为容易识别。各班学习委员收齐排序后交给老师。,本章小结(1),基本概念误差的表征误差的分类,准确度,精密度,(Ea、Er),R、d、 、s、,系统误差,随机误差,特点:单向、重复、固定、理论可消除,特点:符合正态分布,不可消除,来源及消除:方法、试剂、仪器、操作;判
25、断,来源:不确定的偶然因素;减小,过失,(R、d、 、s、),本章小结(2),分析结果的正确表达(x1, x2.xn)过失的判断:可疑数据检验系统误差的判断:显著性检验分析结果的正确表达:置信区间,与标准值的比较:,两种方法的比较:,随机误差无法避免,除非n, =,本章小结(3),有效数字:指实际能测到的数字,包括全部可靠数字及一位不确定数字,它既反映数字的大小,也反映测量精度。记录时应体现仪器精度有效数字运算及修约规则,实际应用中(连续计算)只对最后结果修约即可,但是必须符合方法精度。通常:(1)化学法:测定的中间过程如标准溶液的浓度4位;分析结果含量大于10%时4位,小于10%三位;(2)仪器法:2-3位;(3)平衡常数:2位,其他注意事项:如指数、pH;s、 等,