《分析化学中的误差与数据处理.ppt》由会员分享,可在线阅读,更多相关《分析化学中的误差与数据处理.ppt(83页珍藏版)》请在三一办公上搜索。
1、第3章 误差与分析数据处理,3.1 测量值的准确度和精密度2.2 有效数字及其运算法则2.3 有限量测量数据的统计处理,2.1测量值的准确度和精密度,2.1.1 准确度和精密度1.准确度:测定值与“真值”接近的程度。误差是衡量测量准确度高低的尺度。绝对误差:测量值(x)与真值(xT)之间的差值。,相对误差:绝对误差与真值的比值,即相当于真实值的百分率,表示为,绝对误差与相对误差都有大小和正负之分。相对误差反映的是误差在真实值中所占的比例大小,因此在绝对误差相同的条件下,待测组分含量越高,相对误差越小;反之,相对误差越大。,例:滴定的体积误差,称量误差,滴定剂体积应为2030mL,称样质量应大于
2、0.2g,在分析工作中,用相对误差衡量分析结果,比绝对误差更常用;而且根据相对误差的大小,还能提供正确选择分析方法的依据。,真值与标准参考物质,计量学约定真值:由国际计量大会定义的单位(国际单位)及我国的法定计量单位。国际单位制的基本单位:长度、质量、时间、电流强度、热力学温度、发光强度及物质的量。理论真值:如某化合物的理论组成等。相对真值:人们设法采用各种可靠的分析方法,使用最精密的仪器,经过不同实验室、不同人员进行平行分析,用数理统计方法对分析结果进行处理,确定出个组分相对准确的含量,此值称为标准值,一般用标准值代表该物质中各组分的真实含量。,例1 用重量分析法测定纯BaCl22H2O试剂
3、中Ba的含量,结果为56.14%,56.16%,56.17%,56.13%,计算测定结果的绝对误差和相对误差。(已知:Ar(Ba)=137.33,Mr(BaCl22H2O)=244.27),精密度与偏差,精密度表示平行测量的各测量值(实验值)之间互相接近的程度,一般用偏差d表示。,偏差(d):单个测量值与测量平均值的差值称为偏差,其值可正可负.,平均偏差():各单个偏差绝对值的平均值称为平均偏差,相对平均偏差:平均偏差与测量平均值的比值称为相对偏差,标准偏差(S):,相对标准偏差(RSD,亦称为变异系数):,(n20),标准偏差通过平方运算,它能将较大的偏差更显著地表现出来,因此,标准偏差能更
4、好地反映测定值的精密度。在实际工作中多用RSD表示分析结果的精密度。偏差也可以用全距(R)或称极差来表示,它是一组测量数据中最大值与最小值之差,例2 用光度法测定试样中微量铜的含量,六次测定结果分别为0.21%,0.23%,0.24%,0.25%,0.24%,0.25%,试计算单次测定的平均偏差、相对平均偏差、标准偏差、相对标准偏差和极差。解 先求平均值,单次测定的偏差为,平均偏差,相对平均偏差,标准偏差,相对标准偏差,极差,重复性和再现性:二者是精密度的常见别名,二者稍有区别。一个分析人员,在同一个实验室中用同一套仪器,在短时间内对同一试样的某物理量进行反复测量,所得测量值接近的程度称为重复
5、性。由不同实验室的不同分析人员和仪器,共同对同一试样的某物理量进行反复测量,所得结果接近的程度,称为再现性。,准确度与精密度的关系,准确度表示测量值与真值的接近程度,用误差来衡量。误差越小,分析结果的准确度越高;反之,误差越大,准确度越低。精密度表示几次平行测定结果之间的相互接近程度,用偏差来衡量。偏差越小表示精密度越好。1.精密度是保证准确度的先决条件,精密度差,所得结果不可靠。2.精密度好,不一定准确度高,因为可能存在系统误差。,图2-1 定量分析中的准确度与精密度,如果消除或校正了系统误差,精密度高的有限次测量的平均值 就是最佳值,因为它最接近于真值。总之,只有精密度与准确度高的测量结果
6、才是可取的。,系统误差和偶然误差,系统误差:也称为可定误差,是由某种确定的原因造成的误差。1)一般它有固定的方向(正或负)和大小,重复测定时重复出现。2)根据系统误差的来源,可把它分为方法误差、仪器或试剂误差及操作误差三种。方法误差:是由不适当的实验设计或方法所引起的误差。通常对实验结果影响较大。如溶解损失、终点误差仪器或试剂误差:由于实验仪器或试剂所引起的误差。如刻度不准、砝码磨损、试剂不纯等操作误差:由于操作者的主观原因在实验过程中所引起的误差。如对沉淀的洗涤次数过多或不够。主观误差:如滴定分析中终点颜色的确定偏深或偏浅。,因为系统误差是以固定的方向和大小出现,并具有重复性,故可用加校正值
7、的方法予以消除。,偶然误差:也称随机误差,是由偶然因素引起的误差。如实验室温度、湿度、电压、仪器性能等的偶然变化以及操作者对平行试样处理的微小差异等均引起偶然误差。1)偶然误差的方向(正负)或大小都不是固定的,因此,不能用加校正值的方法减免。2)偶然误差的出现服从统计规律。在消除系统误差的前提下,平行测量的次数越多,则测量值的算术平均值越接近于真值。因此,适当地增加平行测定次数,取平均值表示测定结果,可以减少偶然误差。,公差:是生产部门对分析结果误差允许的一种限量,如果误差超出允许的公差范围,该项分析工作就应该重做。公差范围的确定,与诸多因素有关。首先是根据实际情况对分析结果准确度的要求而定;
8、其次,公差范围常依试样组成及待测组分含量不同,组分越复杂,引起误差的可能性就愈大,允许的公差范围则宽一些。,误差的传递,在定量分析中,分析结果是通过各测量值按一定的公式运算得到的。既然每个测量值都有各自的误差,因此各测量值的误差将要传递到分析结果中去,影响分析结果的准确度。(一)系统误差的传递(1)和、差的绝对误差等于各测量绝对误差的和、差;如分析结果的计算公式为R=A+B+C,则ER=EA+EB+EC,(2)乘除法若分析结果的计算公式为R=AB/C,则,即在乘除运算中,分析结果的相对系统误差等于各测量值相对系统误差的代数和。,(3)指数关系若分析结果R 与测量值A 有下列关系:R=mAn,则
9、误差传递关系为,即分析结果的相对误差为测量值的相对系统误差的指数倍。,(4)对数关系若分析结果R与测量值A有下列关系R=mlgA,其误差传递关系式为,(二)偶然误差的传递可用极值误差法或标准偏差法对其影响进行判推断和估计。1)极值误差法:认为一个测量结果中各个步骤测量值的误差既是最大的,又是叠加的,即是一种最不乐观的估计。其计算法则P49。2)标准偏差法:利用偶然误差的统计学传递规律估计测量结果的偶然误差。其计算法则见P47。,了解误差传递的规律,在进行分析工作时,对各步测量所应达到的准确程度,可以做到心中有数。由于一系列分析步骤中,大误差环节对结果准确度的影响有举足轻重的作用,因此,在分析测
10、量中应避免大误差环节,使各测定环节的误差(或偏差)接近一致或保持相同的数量级。,有效数字及其运算规则,在定量分析中,分析结果所表达的不仅仅是试样中待测组分的含量,同时还反映了测量的准确程度。因此,在实验数据的记录和结果计算中,保留几位有效数字不是任意的,要根据测量仪器、分析方法的准确度来决定。有效数字:在分析工作中实际能测量到的数字。包括全部可靠数字及一位不确定数字在内,1.数字前的0不计,数字后的计入:0.02450(4位)2.数字后的0含义不清楚时,最好用指数形式表示:1000(1.0103,1.00103,1.000 103)3.自然数可看成具有无限多位数(如倍数关系、分数关系);常数亦
11、可看成具有无限多位数,如,几项规定,4.不能因为变换单位而改变有效数字的位数。例如,0.0345g是三位有效数字,用毫克为34.5mg,用微克表示为3.45104g,但不能写为34500 g,因为这样表示比较模糊,有效数字位数不确定。5.对数与指数的有效数字位数按尾数计,如 10-2.34(2位);pH=11.02,则H+=9.510-126.误差只需保留12位;7.化学平衡计算中,结果一般为两位有效数字(由于K值一般为两位有效数字);,8.高含量(10%)组分的测定,一般为4 位有效数字,含量在1%10%的一般要求三位有效数字;含量小于1%的组分只要求两位有效数字。9.数据的第一位数大于等于
12、9的,可按多一位有效数字对待,如 9.45104,95.2%,8.6,台秤(称至0.1g):12.8g(3),0.5g(1),1.0g(2)分析天平(称至0.1mg):12.8218g(6),0.5024g(4),0.0500g(3)滴定管(量至0.01mL):26.32mL(4),3.97mL(3)容量瓶:100.0mL(4),250.0mL(4)移液管:25.00mL(4);量筒(量至1mL或0.1mL):26mL(2),4.0mL(2),数字的修约规则,在处理数据过程中,涉及到各测量值的有效数字位数可能不同,因此需按照计算规则,确定各测量值的有效数字位数。1)采用“四舍六入五留双”的规则
13、进行修约2)禁止分次修约3)可多保留一位有效数字进行运算4)修约标准偏差,应使结果准确度降低。表示标准偏差和RSD时,一般取两位有效数字,运算规则 加减法:结果的绝对误差应不小于各项中绝对误差最大的数.(与小数点后位数最少的数一致)50.1 50.1 1.46 1.5+0.5812+0.6 52.1412 52.2 52.1,一般计算方法:先计算,后修约.,结果的相对误差应与各因数中相对误差最大的数相适应.(即与有效数字位数最少的一致)例 0.012125.661.05780.328432,0.328,乘除法:,复杂运算(对数、乘方、开方等),例 pH=5.02,H+?pH5.01 H+9.7
14、72410-6 pH5.02 H+9.549910-6 pH5.03 H+9.332510-6 H+9.510-6 mol L-1,报告结果:与方法精度一致,由误差 最大的一步确定.,如 称样0.0320g,则w(NaCl)=99%(3位);称样0.3200g,则w(NaCl)=99.2%(4位);,分析化学中的数据处理凡是测量就有误差存在,用数字表示的测量结果都具有不确定性。如何更好地表达分析结果,使其既能显示出测量的精敏度,又能表达出结果的准确度;如何对测量的可疑值或离群值有根据地取舍;如何比较不同人不同实验室之间的结果以及不同实验方法得到的结果等分析化学中愈来愈广泛地采用统计学方法来处理
15、各种分析数据。,随机误差的正态分布,随机误差具有随机性,但多次重复测定,服从一定的统计规律。1。频率分布 事例:测定w(BaCl22H2O):173个有效数据,处于98.9%100.2%范围,按0.1%组距分14组,作 频率密度-测量值(%)图.,频率密度直方图和频率密度多边形,两个特点,(1)离散特性全部数据是分散的、各异的,具有波动性,但这种波动性是在平均值周围波动,或比平均值稍大些,或比平均值稍小些。离散性用标准偏差s来表示,它能反映出大的偏差,也即离散程度。当测量次数为无限多次时,其标准偏差为总体标准偏差,用符号来表示:,(2)集中趋势各数据虽然是分散的、随机出现的,但当数据多到一定程
16、度时,它们有向某个中心值集中的趋势,这个值通常是算术平均值。当数据无限多时将无限多次测定的平均值称为总体平均值,用符号表示。在分析化学中,测量数据一般符合正态分布规律。,正态分布曲线 N(,),正态分布曲线由和两个基本参数决定.其中,为n 时测量值的均值,若没有系统误差,就是真值.表示数据的离散程度,y:概率密度(测量值出现的频率)x:测量值:总体平均值x-:偶然误差:总体标准差,偶然误差的规律,定性:小误差出现的概率大,大误差出现的概率小,特大误差概率极小;正、负误差出现的概率相等.,定量:某段曲线下的面积则为概率.,标准正态分布曲线,标准正态分布曲线 N(0,1),曲线下面积,正态分布概率
17、积分表,y,偶然误差的区间概率,总体平均值的估计,科学地表达分析所得结果:对总体平均值进行估计,在一定的置信度下给出一个包含总体平均值的范围。平均值的标准偏差从总体中分别抽出m个样本,每个样本各进行n次平行测定,每个样本作n 次测量的平均值的标准偏差 与单次测量结果的标准偏差s的关系为,对于无限次测量值,则为,n为测定次数,上式说明,n次测量平均值的标准偏差是1次测量标准偏差的 1/,即n次测量的可靠性是1次测量的,倍,有限数据的统计处理,正态分布曲线是无限次测量数据的随机误差的分布规律,而在实际分析工作中,测量次数都是有限的,其随机误差不服从正态分布。如何以统计的方法处理有限次测量数据,使其
18、合理地推断总体的特征?,当测量数据不多时,无法求得总体平均值和总体标准偏差,只能用样本的标准偏差s来估计测量数据的分散情况。用s代替,正态分布曲线相应变为t分布曲线。,(1)t 分布曲线,y(概率密度),t 分布曲线与正态分布曲线的异同:正态分布曲线只与u值有关;t分布曲线不仅随t值而改变,还与f 值有关。,t 分布值表,置信度:表示在某一t值时,测定值落在(ts)范围内的概率。测定值落在此范围之外的概率为(1-P),称为显著性水准,用 表示。由于t值与置信度及自由度有关,一般表示为t,f,例如t0.05,10,(2)平均值的置信区间当用单次测量结果(x)来估计总体平均值的范围:=xu若以样本
19、平均值来估计总体平均值可能存在的区间,用下式表示:,对于少量测量数据,必须根据t 分布进行统计处理,则,表示在某一置信度下,以平均值为中心,包括总体平均值在内的可靠性范围,称为平均值的置信区间。,例:测定钢中铬的质量分数,5次测定结果的平均值为1.13%,标准偏差为0.022%。计算(1)平均值的标准偏差;(2)的置信区间.。(t0.95,3=3.18 t0.95,4=2.78 t0.95,5=2.57),解:(1),(2)查表可知P=95%,f=4,t=2.78 根据,=(1.130.03)%,另例10,见课本P62,置信度越低,同一体系的置信区间就越窄;置信度越高,同一体系的置信区间就越宽
20、,即所估计的区间包括真值的可能性也就越大。在实际工作中,置信度不能定得过高或过低。若置信度过高则会使置信区间过宽,这种判断就失去意义了;置信度定得过低,其判断可靠性就不能保证了。在分析化学中,一般将置信度定在95%或90%。,显著性检验,对标准试样或纯物质进行测定时,所得到的平均值与标准值的比较问题;不同分析人员、不同实验室和采用不同分析方法对同一试样进行分析时,两组分析结果的平均值之间的比较问题;革新、改造生产工艺后的产品分析指标与原指标的比较问题等。数据之间的差异是由随机误差引起的,还是由系统误差引起的?分析结果之间存在“显著性差异”就认为它们之间有明显的系统误差,否则就认为没有系统误差,
21、纯属随机误差引起的,认为是正常的。,显著性检验:t检验法和F检验法,(一)t检验t检验用于判断某一分析方法或操作过程中是否存在较大的系统误差.1.测定值与标准值比较,根据,若样本均值 的置信区间 能将标准值包括在此范围内,即可作出 与不存在显著性差异的结论.,t 检验法,(1)提出假设:=0(2)给定显著水平(3)计算,(4)查t 表,若 拒绝假设.例题见课本P63例11。,2.两组测量结果比较,第一步:F 检验比较两组的精密度(1)假设:1=2,显著水平为0.05的F 分布值表,较大 s,分母,第二步:t 检验比较 与,检验表明1=2后,(1)假设 1=2,例用两种方法测定w(Na2CO3)
22、,F计F0.05(3,4)=6.59,1 和2 无显著差异;,2.t 检验(给定=0.05),两种方法不存在系统误差。,1.F 检验(给定=0.10),解:,F 分布表中,F值是单边值,可直接用于单侧检验,即检验某组数据的精密度是否大于、等于(或小于、等于)另一组数据的精密度时,此时置信度为95%(显著性水平为0.05)。而进行双侧检验时,如判断两组数据的精密度是否存在显著性差异时,显著性水平为单侧检验时的两倍,即0.10,此时的置信度P=1-0.10=0.90,即90%。,可疑值取舍,在实验中,当对同一试样进行多次平行测定时,常发现某一测量值与其他数据相差较大,这一数据称为可疑值(也称离群值
23、或极端值)。如果确定这是由于过失造成的,则可以弃去不要,否则不能随意舍弃,应该用统计检验的方法,确定该可疑值与其他数据是否来源于同一总体,以决定取舍。,法,格鲁布斯法(G法)Q检验法,格鲁布斯检验法使用范围广,效果也更好。其检验步骤如下:1)计算包括可疑值在内的平均值2)计算可疑值与平均值之差3)计算包括可疑值在内的标准差S4)按下式计算,5)查出T的临界值Ta,n。若计算出的T值 Ta,n,则该可疑值应当舍去,否则应保留。,例题:用滴定法测定铁矿石中的铁(以Fe%表示)。六次测定结果如下:60.72,60.81,60.70,60.78,60.56,60.84(1)用格鲁布斯法检验有无应舍去的
24、测定值(P=0.95)?(2)求分析结果的算术平均值、标准偏差和变异系数。(3)已知此标准试样中铁的真实含量为60.75%,问上述测定方法是否准确可靠?(95%置信度)t0.95,3=3.18,t0.95,4=2.78,t0.95,5=2.57,t0.95,6=2.45,表 格鲁布斯法检验临界值,G0.95,6=1.82 因为G1 G09.85,6 G2 G095,6所以无舍去的测定值,t0.95.5=2.57 因为t计 t0.95.5,所以方法可靠。,Q检验法,步骤:1)将所有数据按递增的顺序排序,可疑数据将在序列的开头或末尾出现。2)算出可疑数据与其临近值之差的绝对值3)算出序列中最大值与
25、最小值之差。4)按照上式计算Q计算5)查Q的临界值表,若Q计算大于表中相应的Q临界值,则该数据应舍去,否则应保留。,Q值表,例7 测定某溶液浓度(molL-1),得结果:0.1014,0.1012,0.1016,0.1025,问:0.1025是否应弃去?(置信度为90%),0.1025应该保留.,法,偏差大于,的个别测量值可以舍去。方法简单,,不必查表,但存在较大误差。,采用该法判断可疑值取舍时,首先应求出除可疑值外的其余数据的平均值 和平均偏差,然后将可疑值与平均值进行比较,如绝对差值大于,则将可疑值舍去,否则保留。,数据统计处理的基本步骤:,首先进行可疑数据的取舍(格鲁布斯检验等),而后进
26、行精密度检验(F检验),最后进行准确度检验(t 检验)。,提高分析结果准确度的方法,(一)选择恰当的分析方法不同分析方法的灵敏度和准确度不同。化学分析法的灵敏度虽不高,但对常量组分的测定,能获得比较准确的分析结果(相对误差0.2%),而对微量或痕量组分则无法准确测定。仪器分析法灵敏度高、绝对误差小,虽然其相对误差误差较大,不适合于常量组分的测定,但能满足微量或痕量组分测定准确度的要求。,(二)减少测量误差 为了保证分析结果的准确度,必须尽量减少各步的测量误差。例子见课本p72(三)减少偶然误差的影响根据偶然误差的分布规律,在消除系统误差的前提下,平行测定次数越多,其平均值越接近于真值。因此,增加平行测定次数,可以减少偶然误差对分析结果的影响。,(四)消除测量中的系统误差 具单向性、重现性,为可测误差.1)与经典方法比较,判断所建方法的可行性2)校准仪器 仪器:刻度不准、砝码磨损 定期校准 3)对照试验在与试样相同的测定条件下,用已知百分质量分数的标准样品,对所选方法的准确性进行校核。4)回收试验5)空白实验,