《武汉大学分析化学第五版上册第三章分析化学中的误差与数据处理.ppt》由会员分享,可在线阅读,更多相关《武汉大学分析化学第五版上册第三章分析化学中的误差与数据处理.ppt(116页珍藏版)》请在三一办公上搜索。
1、第三章 分析化学中的误差与数据处理,3.1 分析化学中的误差3.2 有效数字及其运算规则3.3 分析化学中的数据处理3.4 显著性检验3.5 可疑值取舍3.6 回归分析法3.7 提高分析结果准确度的方法,定量分析是根据物质的性质测定物质的量,与其他测量方法一样,所得结果不可能绝对准确,即使采用最可靠的分析方法,使用最精密的仪器,由很熟练的分析人员进行测定,也不可能得到绝对准确的结果。同一个人对同一样品进行多次分析,结果也不尽相同。这就表明,在分析过程中,误差是客观存在的。,例如:普通分析天平称量试剂与样品只能准确到0.0001g,滴定管读数误差0.01mL,pH计测量误差为0.02等,般常量分
2、析结果的相对误差为千分之几、微量分析的结果则为百分之几。测定的结果只能趋近于被测定组分的真实含量,而不可能达到其真实含量。因此,进行定量分析时必须将所得数据进行归纳、取舍等一系列分析处理,对分析结果的可靠性和精确程度作出合理的判断和正确的表述,为此应该了解分析过程中产生误差的原因及误差出现的规律;并采取措施减少误差,使测定的结果尽量接近客观真值。,3.1分析化学中的误差,3.1.1 准确度与精密度准确度 Accuracy 准确度表示测量值与真实值的接近程度。它说明测定结果的可靠性,用误差值来衡量,误差越小,分析结果的准确度越高。精密度 precision 精密度表示平行测量结果的相互接近程度。
3、它表达了测定结果的重复性和再现性,用偏差表示。,准确度与精密度的关系例:A、B、C、D 四个分析工作者对同一铁标样(WFe=37.40%)中的铁含量进行测量,得结果如图示,比较其准确度与精密度。,36.00 36.50 37.00 37.50 38.00,A表观准确度高,精密度低,B准确度高,精密度高,C准确度低,精密度高,D准确度低,精密度低,(不可靠),结论:1、精密度是保证准确度的前提。2、精密度高,不一定准确度就高。,3.1.2.1误差:,测定值与真值之差(误差以真值为标准)(真实值为正,真实值为负),绝对误差=个别测得值-真实值 即:Ea=x-xT,相对误差,相对误差更能体现误差的大
4、小,Ea相同的数据,Er可能不同,3.1.2 误差与偏差,例(天平 Ea=0.0002g),甲:x甲=3.3460g xT=3.3462g 则:Ea甲=0.0002 Er甲=0.006%,乙:x乙=0.3460g xT=0.3462g则:Ea乙=0.0002 Er乙=0.06%,甲.乙Ea(绝对误差)相同,但Er(相对误差)差10倍说明当Ea一定时,测定值愈大,Er愈小.这就是当天平的Ea一定时为减小称量的误差,要求:m称 0.2 g(Er0.1%)的道理.,真值T(True value)某一物理量本身具有的客观存在的真实值。真值是未知的、客观存在的量。在特定情况下认为是已知的:,理论真值(如
5、化合物的理论组成)计量学约定真值(如国际计量大会确定的长度、质量、物质的量单位等等)相对真值(如高一级精度的测量值相对于低一级精度的 测量值),例如,标准样品的标准值,3.1.2.2 基本概念,例 用沉淀滴定法测得纯NaCl试剂中的wCI为60.53,计算绝对误差和相对误差。解:根据理论值计算得 wCl%MCI/MNaCI 35.45/(35.45+22.99)60.66%作为真值。Ea=X-XT=60.53%-60.66%=-0.13%Er=(Ea/XT)100%=(-0.13%/60.66%)100%=-0.2%,平均值:n次测定的算术平均值,中位数:一组数据按大小顺序排列 测量值是奇数时
6、,指中间一个数据 测量值是偶数时,指中间相邻两个测量值的平均值,3.1.2.3 偏差:表示测量值与平均值的差值(偏差以平均值为标准),基本概念总体:对象全体(n)样本:其中的值(n 20)样本容量n:如:n=3总体平均值:样本平均值:,1 当n,=lim x n,偏差 绝对偏差:相对偏差:,偏差:表示测量值与平均值的差值,当测量次数为有限次,n20 时 样本平均偏差 样本相对平均偏差,平均偏差,平均偏差代表一组测量值中任何一个数据的偏差,没有正负号.因此,它最能表示一组数据间的重现性.在一般分析工作中平行测定次数不多时,常用平均偏差来表示分析结果的精密度.,当测量次数为无限次,n30 时 总体
7、平均偏差,用平均偏差表示精密度比较简单,但不足之处是在一系列测定中,小的偏差测定总次数总是占多数,而大的偏差的测定总是占少数,所以当测定次数较多时,用标准偏差来表示精密度。,标准偏差,样本,样本标准偏差,样本的相对标准偏差(变异系数),标准偏差通过平方运算,它能将较大的偏差更显著地表现出来(即离散程度),因此,标准偏差能更好地反映测定值的精密度。实际工作中,都用RSD表示分析结果的精密度。,总体标准偏差,平均值的偏差,从总体中分别抽出m个样本(通常进行分析只是从总体中抽出一个样本进行n次平行测定),每个样本各进行n次平行测定因为有m个样本,也就有m个平均值,平均值的平均偏差,平均值的标准偏差,
8、平均值的标准偏差与测定次数的平方根成反比。当测量次数增加时,平均值的标准偏差减小,即精密度提高。在分析化学实际工作中,一般平行测定34次即可,要求较高时,可测定59次,最多1012次。,小结,样本,总体,平均值,平均偏差,标准偏差,平均值的平均偏差,平均值的标准偏差,例3测定莫尔盐FeSO47H2O中Fe%,四次分析结果为(%):20.01,20.03,20.04,20.05,解 _(1)n=4 x=20.03%,3.1.2.4 极差,一组测量数据中,最大值(max)与最小(min)之差,又称全距或范围误差 R=xmax-xmin 用该方法表示误差,十分简单,适用于少数几次测定中估计误差的范围
9、,它的不足之处是没有利用全部测量数据 相对极差为,是生产部门对分析结果误差允许的一种限量,如果误差超出允许的公差范围,该项分析工作就应重做,与诸多因素有关。,3.1.2.4 公差,1)根据实际情况对分析结果准确度的要求而定;2)公差范围常依试样组成及待测组分含量而不同;3)由于各种分析方法所能达到的准确度不同,则公差的范围也不同。,3.1.3 误差的分类,系统误差(Systematic error)某种固定的因素造成的误差。随机误差(Random error)不定的因素造成的误差过失误差(Gross error,mistake),系统误差(可测误差):由比较固定的原因引 起的误差,系统误差影响
10、结果的准确度,单向性:要么偏高,要么偏低,即正负、大小有一 定地规律性;重复性:同一条件下,重复测定中,重复地出现;可测性:误差大小基本不变。,特点:,1.方法误差:方法本身造成的2.仪器误差:仪器本身的局限3.试剂误差:试剂不纯4.操作误差:操作不正确5.主观误差:操作习惯,辨别颜色读刻度的 差别,来源:,(1)方法误差:由于不当的实验设计和分析方法选择所造成的。如:反应不能定量完成、有副反应发生;滴定终点与化学计量点不一致;配位滴定中干扰组分存在副反应;重量分析中沉淀的溶解、共沉淀等。,(2)仪器误差:主要是仪器本身不够准确或未经校准引起的。如:分析天平不等臂;砝码的锈蚀;滴定管刻度不准;
11、酸度计不用标准缓冲溶液校正;分光光度计波长没有校正。,(3)试剂误差:由于试剂不纯或蒸馏水中含有微量杂质所引起。如测定铁,蒸馏水中或者试剂中含有铁;分析化学实验一般要使用分析纯(A.R)试剂,使用化学纯(C.P)纯度不满足要求,要进行纯化,才能使用。,(4)操作误差:主要指在正常操作情况下,由于分析工作者掌握操作规程与控制条件不当所引起的。如:滴定管读数总是偏高或偏低。,(5)主观误差:又称个人误差。是由于分析人员本身造成的。如滴定分析中辨别滴定终点颜色时,有人偏深,有人偏浅;也有第二次滴定以第一次滴定结果的终点颜色为标准,尽量向其靠近等。,随机误差:随机偶然,难以控制,不可避免,来源:偶然性
12、因素特点:原因、方向、大小正负不定,不可测,随机误差影响结果的精密度,不确定性 不可避免性。只能减小,不能消除。每次测定结果无规律性,多次测量符合统计规律。,错误误差:操作者的粗心大意,1.过失误差:确系发生,数据必舍2.系统误差:采用对照试剂,加以改正3.随机误差:增加平行测定次数,系统误差与随机误差的比较,.:提高分析结果准确度的方法,3.7.1.选择合适的分析方法,1.根据分析准确度要求:常量分析:重量法,滴定法的准确度高,灵敏度低2.根据分析灵敏度要求:微量分析:仪器法灵敏度高,准确度低,3.根据分析干扰情况:如:,3.7.2.减少测量误差,1.称量:1/万天平 mS=Ea/Er=0.
13、0002g/0.1%=0.2g,2.体积:滴定管 V=Ea/Er=0.02mL/0.1%20mL,例6 以K2Cr2O7标定0.02mol/L 的Na2S2O3要使VNa2S2O3=25mL,称 m(K2Cr2O7)=?,解(1)Cr2O72-+6I-+14H+=2Cr3+3I2+7H2O I2+2S2O32-=2I-+S4O62-,1 1(2)nK2Cr2O7=nI2=nNa2S2O3 3 6,(4)Er%=(+0.0002/0.024)100=10.1,(5)为使Er0.1%,加大称样量,扩大10倍,配制成250mL(取25mL即为0.024g的量),3.7.3.增加平行测定次数,减小随机
14、误差:,一般 n=46,3.7.4.消除测量过程中的系统误差:同台天平称量,同支滴定管,标定条件与测定条件相同,对照试验:检验系统误差,用该分析方法对标准样品进行测定,将所得到的标准试样的测定结果与标准值进行对照,用显著性检验判断是否有系统误差用其他可行的分析方法进行对照试样以判断是否有系统误差采用不同分析人员、不同实验室用同一方法对同一试样进行对照试验,将所得结果加以比较。当对试样的组成不清楚时,可采用“加入回收法”常量组分 回收率99%微量组分 回收率90%-110%,空白试验:扣除系统误差,空白试验:在不加待测组分的情况下,按照与待测组分分析同样的分析条件和步骤进行试验,把所得结果作为空
15、白值,从试样的分析结果中扣除空白值。,校正仪器:减小或扣除系统误差,分析结果的校正:,例如:用电重量法测定纯度为99.9%以上的铜 系统误差:电解不很完全 校正:用光度法测定溶液中未被电解的残 余铜量,系统误差的校正,方法系统误差方法校正主观系统误差对照实验校正(外检)仪器系统误差对照实验校正试剂系统误差空白实验校正,3.1.4 误差的传递,一、系统误差的传递,1.加减法,若R为A,B,C 三个测量值相减的结果,R=A+B-C,则绝对误差E是各测量步骤结果绝对误差的代数和,ER=EA+EB-EC,2.乘除法,R是A,B,C 三个测量值的结果,则相对误差是各测量步骤相对误差的代数和,3.指数关系
16、,则相对误差为测量值的相对误差的指数倍,4.对数关系,则误差传递关系为,二.随机误差的传递,1.加减法,分析结果的标准偏差的平方是各测量步骤标准偏差的平方和,2.乘除法,是各测量步骤相对标准偏差的平方总和,3.指数关系运算时()则为,4.对数关系运算时(),则为,三.极值误差,加减法是各测量值的绝对误差的绝对值累加乘除法是各测量值相对误差的绝对值累加,3.2:有效数字及运算规则,3.2.1.有效数字(Significant Figures):分析结果中的有效数字是:实际测定的数值,包含一位不确定数字(可疑数字),有效位数:从数值左方非零数字算起到最后一位可疑数字,确定有效位数的位数.可疑数字:
17、通常理解为,它可能有1单位的误差(不确定性),3.2.2.有效数字的记录,1.一个量值只保留一位不确定的数字天平(1/10000):Ea=0.0001g滴定管:0.01mL pH计:0.01单位光度计:0.001单位电位计:0.0001V(E),例如:1.0005 五位有效数字0.5400,31.05%四位有效数字0.0540,1.86 三位有效数字 0.0054,0.40%两位有效数字0.0005,0.002%一位有效数字,2.“0”的双重意义:(1)作为普通数字使用时是有效数字:20.30mL 四位(2)作为定位时不是有效数字:0.02030 四位,3.在乘除法运算中,首位是9时,有效数字
18、可多算一位 例如:93.96%5位有效数字 0.0998 4位有效数字4.不确定 例如:3600(4位)3.6103(2位)3.60103(3位)3.6000103(5位)5.无限位:例如:,它们的相对误差绝对值接近,6.改变单位不改变有效数字的位数:0.0250g25.0mg2.50104g,7.各常数视为“准确数”,不考虑其位数:M,e,,8.pH,pM,logK等对数其有效数字的位数取决于尾数部分的位数,整数部分只代表方次,如:pH=11.02 H+=9.610-12 二位,m 分析天平(称至0.1mg):12.8228g(6),0.2348g(4),0.0600g(3)千分之一天平(称
19、至0.001g):0.235g(3)1%天平(称至0.01g):4.03g(3),0.23g(2)台秤(称至0.1g):4.0g(2),0.2g(1)V 滴定管(量至0.01mL):26.32mL(4),3.97mL(3)容量瓶:100.0mL(4),250.0mL(4)移液管:25.00mL(4);量筒(量至1mL或0.1mL):25mL(2),4.0mL(2),3.2.3.数字修约规则:四舍六入五成双,1.记录一个测定值时,只保留一位可疑数据,2.数字修约规则:四舍六入五成双,四舍六入五考虑;五后非零则进一;五后皆零视奇偶;五前为奇则进一;五前为偶则舍弃.,3.1483.1683.1500
20、23.153.25,两位 3.1 3.2 3.2 3.23.2,修约一次完成,不能分步 例如:8.5498.5 8.5498.558.6,3.2.4.运算规则:先修约后计算,1.加减法:最后位数由绝对误差最大的数值位数决定(即以小数点后位数最少的数据决定),例7 50.1+1.45+0.5802=50.1 50.1 1.45 1.4 0.5802 0.6 52.|1312|52.1,无意义,乘除法:由相对误差最大的数值位数决定(即以有效数字位数最少的数值决定),例8 0.012125.641.05872=以0.0121的3位有效数字为准:0.0121 0.0121 25.64 25.6 1.0
21、5782 1.06 0.328,例 根据有效数字计算规则计算 Y=12.007+(31.75+4.84-18.592)0.7285/21.3思路 上式包括两项,先应确定第二项计算结果的有效数字位数并计算,在此基础上再确定最后结果的有效数字位数,然后计算结果并根据应保留的位数进行修约。解 Y=12.007+(31.75+4.84-18.59)0.7285/21.3=12.007+18.000.7285/21.3=12.007+18.00.728/21.3=12.007+0.616=12.623,3.有效数字在分析化学中的应用:,(1)正确记录测量值:天平称0.3200g不能写成0.32或0.32
22、000(2)运算中可多保留一位,计算器运算结束按正确位数记录(3)表示含量:X%10 留四位;1-10%留三位;1%留二位(4)Er%:最多二位,(5)pH=8不明确,应写pH=8.0,3.3 分析化学中的数据处理,3.3.1 随机误差的正态分布,随机误差是由某些难以控制且无法避免的偶然因素造成的,它的大小、正负都不定,具有随机性。尽管单个随机误差的出现极无规律,但进行多次重复测定,会发现随机误差是服从一定的统计规律的,因此可以用数理统计的方法研究随机误差的分布规律。,1.频数分布,频率(相对频数):如果n次测量中随机事件A出 现了nA 次,则称F(A)=nA/n,概率:随机事件A的概率P(A
23、)表示事件A发生的 可能性大小当n无限大时,频率的极限为概率:limF(A)=P(A)(0P(A)1)P的可加性 P(A1+A2+A3+.An)=1,频数:每组中测量值出现的次数,在相同条件下对某矿石样品中铜含量进行测定,共得到100个测定值如下:1.36 1.49 1.43 1.41 1.37 1.40 1.32 1.42 1.47 1.39 1.41 1.36 1.40 1.34 1.42 1.42 1.45 1.35 1.42 1.39 1.44 1.42 1.39 1.42 1.42 1.30 1.34 1.42 1.37 1.36 1.37 1.34 1.37 1.46 1.44 1
24、.45 1.32 1.48 1.40 1.45 1.39 1.46 1.39 1.53 1.36 1.48 1.40 1.39 1.38 1.40 1.46 1.45 1.50 1.43 1.45 1.43 1.41 1.48 1.39 1.45 1.37 1.46 1.39 1.45 1.31 1.41 1.44 1.44 1.42 1.47 1.35 1.36 1.39 1.40 1.38 1.35 1.42 1.43 1.42 1.42 1.42 1.40 1.41 1.37 1.46 1.36 1.37 1.27 1.47 1.38 1.42 1.34 1.43 1.41 1.41 1
25、.41 1.44 1.48 1.55 1.37,分组(%)频数 相对频数(频率)1.2651.295 1 0.01 1.2951.325 4 0.04 1.3251.355 7 0.07 1.3551.385 17 0.17 1.3851.415 24 0.24 1.4151.445 24 0.24 1.4451.475 15 0.15 1.4751.505 6 0.06 1.5051.535 1 0.01 1.5351.565 1 0.01 100 1.00,相对频数分布直方图,横坐标:测定值x或x-;纵坐标:测定值的概率密度 相对频数分布直方图;当测量数据再增多,组(区间)划分再细,直方图
26、形式逐渐趋于 一条直线,即正态分布曲线,它表示出了来自同一总体的无限多次测定的各种可能结果(或随机误差)的分布。,离散特性,集中趋势,特点:,2.正态分布(高斯曲线),正态分布:即高斯分布,正态分布曲线数学表达式为:y:概率密度;x:测量值:总体平均值,即无限次测定数据的平均值,无系统误差时即为真值;反映测量值分布的集中趋势。:标准偏差,反映测量值分布的分散程度;x-:随机误差,正态分布曲线规律:x=时,y值最大,体现了测量值的集中趋势。大多数测量值集中在算术平均值的附近,算术平均值是最可信赖值,能很好反映测量值的集中趋势。反映测量值分布集中趋势。曲线以x=这一直线为其对称轴,说明正误差和负误
27、差出现的概率相等。当x趋于或时,曲线以轴为渐近线。即小误差出现概率大,大误差出现概率小,出现很大误差概率极小,趋于零。越大,测量值落在附近的概率越小。即精密度越差时,测量值的分布就越分散,正态分布曲线也就越平坦。反之,越小,测量值的分散程度就越小,正态分布曲线也就越尖锐。反映测量值分布分散程度。,两组精密度不同的测量值的正态分布曲线,1 2,1,2,正态分布曲线 N(,2)表示 曲线的形状取决于,确定了,N(,)也就定了。不论怎样,与不同,图形就不同。应用起来 不方便。概率P,由于下式中的积分计算同和有关,计算麻烦。,总体标准偏差 相同,总体平均值不同,总体平均值相同,总体标准偏差不同,原因:
28、,1、总体不同,2、同一总体,存在系统误差,原因:,同一总体,精密度不同,标准正态分布曲线,令:,正态分布函数转换成标准正态分布函数:,令:,可变为:,标准正态分布曲线N(0,1)就是以为原点,u为单位的曲线,它对于不同的和的任何测量值都是通用的(上图)。,随机误差的区间概率 正态分布曲线与横坐标-到+之间所夹的面积代表所有数据出现概率的总和,其值应为1,即概率P为:,对于N(0,1),测量值的随机误差在某一区间内出现的概率(不同u值所占的面积)已用积分法求得,列于表。表中所列之值为单边值。,由此可见,在一组测量值中,随机误差超过1的测量值出现的概率为31.7%随机误差超过2的测量值出现的概率
29、为4.5%,随机误差超过3的测量值出现的概率很小,仅为0.3%。所以,在实际工作中,如果多次重复测量中的个别数据的误差 的绝对值大于3,则这个极端值可以舍去(见4d法)。,随机误差 测量值出现的区间 概率出现的区间(以为单位)u=1 x=1 68.3%u=1.96 x=1.96 95.0%u=2 x=2 95.5%u=2.58 x=2.58 99.0%u=3 x=3 99.7%,例题:已知某试样中Co质量分数的标准值为1.75%,=0.10%,又 已知测量时没有系统误差存在,求:(1)分析结果落在(1.750.15)%范围内的概率。(2)分析结果大于2.00%的概率。解(1)查表:u=1.5
30、时,概率为:2 0.4332=0.866=86.6%解(2)属于单边检验问题。查表:u 2.5 时,概率为:0.4938。整个正态分布曲线右侧的概率为1/2,即为0.5000,故u 2.5的概率为0.5000 0.4938=0.0062,即分析结果大于2.00%的概率为0.62%。,等于真值,例 求测量值落在区间2+0.6内的概率。思路 给出了区间,求该区间包括的面积。由于所给的区间不对称,因此应分别将它们的面积(概率)计算出来,再相加。解 已知x1=2,x2=+0.6,则 u1=(x1-)/=-2,u2=(x2-)/=0.6 查表得u为2和0.6时的概率分别为0.477和0.2285,所以P
31、=0.477+0.228570.016%.,例 对某含铁试样进行了多次分析(130次),已知分析结果符合正态分布,N(55.20,0.202),求分析结果大于55.6%的最大可能出现的次数。思路:一定区间内出现的次数与相应的区间概率有关,因此,应计算区间概率,而求概率需要知道u值,所以先要根据题中给出的数据计算u值。,u=,=,查表得P=0.4733,因此,测量值大于55.61%的概率为0.5-0.4473=0.0227,出现的次数为0.02271303次。,解:由N(55.20,0.202)知,=55.20,=0.20,而 x=55.60%,则,N(,2),1.对一个样品进行无限次测定,可以
32、得到 和,测量值和随机误差遵从正态分布规律。2.若用 u 表示随机误差,可得到一个随机误差的标准正态分布.3.根据随机误差的标准正态分布,可求得随机误差出现在某一区间的概率,根据u 的定义,也可求出x出现在某一区间的概率。,随机误差,3.3.2 少量数据的统计处理,t 分布曲线平均值的置信区间,正态分布是无限次测量数据的随机误差的分布规律,而在实际分析工作中,测量次数都是有限的,其随机误差的分布不服从正态分布。如何以统计的方法处理有限次测量数据,使其能合理地推断总体的特征?,t 分布曲线,用s代替,误差大 所以用t代替。,无限次测量 正态分布有限次测量 t 分布,t分布曲线与正态分布曲线相似,
33、只是t分布曲线随自由度f而改变。在f20时,与正态分布曲线很近似;当f 时,t分布曲线与正态分布严格一致。,自由度f(f=n-1)t分布曲线与正态分布曲线相似,只是t分布曲线随自由度f而改变。当f趋近时,t分布就趋近正态分布无限次测量,u一定,就一定;有限次测量,t一定,随自由度f不同而不同置信度P 在某一t值时,测定值落在(ts)范围内的概率。,置信水平在某一t值时,测定值落在(ts)范围以外的概率(lP)ta,f:t值与置信度P及自由度f关系。例:t005,10表示置信度为95%,自由度为10时的t值。t001,5表示置信度为99%,自由度为5时的t值。,平均值的置信区间当n趋近时:单次测
34、量结果若以样本平均值来估计总体平均值可能存在的区间:,对于少量测量数据,即当 n有限时,必须根据t分布进行统计处理:,它表示在一定置信度下,以平均值为中心,包括总体平均值的范围。这就叫平均值的置信区间。,正确理解:在47.50%0.10%的区间内包括总体平均值的概率为95%。错误理解;a:未来测定的实验平均值有95%落在47.50%0.10%区间内 b:真值落在47.50%0.10%区间内的概率为95%。(因为是客观存在的,没有随机性),例题,分析铁矿中的铁的质量分数,得到如下数据:37.45,37.20,37.50,37.30,37.25(%)。求置信度分别为95%和99%的置信区间。,解:
35、,置信度为95%,即1-=0.95,=0.05,查表,t 0.05,4=2.78,的置信区间:,置信度为99%,即1-=0.99,=0.01,查表,t 0.01,4=4.60,的置信区间:,结论,置信度高,置信区间大,即所估计的区间包括真值的可能性也就越大。在实际工作中,置信度不能定得过高或过低,若置信度过高会使置信区间过宽,这就失去意义;置信度定得太低使置信区间过窄,其判断可靠性就不能保证了。在分析化学中,一般将置信度定在95或90,3.显著性检验,(1)对含量真值为T 的某物质进行分析,得到平均值,(2)用两种不同的方法、或两台不同的仪器、或两个不同的实 验室对同一样品进行分析,得到平均值
36、,问题:是由随机误差引起,或存在系统误差?,显著性差异,非显著性差异,校正,正常,显著性检验,但,但,1.平均值与标准值的比较(t检验法),1)根据公式算出t 值;,2)查表得,3)将计算出的t 值与表上查得的t值进行比较,若,表示 落在 为中心的某一指定概率之外。在一次测定中,这样的几率是极小的,故认为是不可能的,拒绝接受。,根据,计算出的t 值应落在指定的概率区间里。否则,假设不满足,表明存在着显著性差异。,例题,某化验室测定CaO的质量分数为30.43%的某样品中CaO的含量,得如下结果:,问此测定有无系统误差?(给定=0.05%),解,查表,比较:,说明 和T 有显著差异,此测定有系统
37、误差。,假设:=T,例题:P63:例11,2、两组平均值的比较(先用法,再用t法),两个实验室对同一标样进行分析,得到:,和,假设不存在系统误差,那么:,是由于随机误差引起的,应满足自由度 f=(n1+n2 2)的 t 分布,,两组平均值的比较的方法,1)先用F 检验法检验两组实验数据S小和S大之间有无显著差异:,精密度有显著差异。,精密度无显著差异。则s大s小再用t检验法,f大指s大的自由度f小指s小的自由度,s大指s大s小指s小,置信度95%时部分F值(单边)置信度90%时部分F值(双边)见P65,2)若无显著性差异再用t 检验确定两组平均值之间有无显著性差异,则无显著性差异,无系统误差,
38、Ss,则有显著性差异,有系统误差,例 为提高光度法测定微量Pd的灵敏度,改用一种新的显色剂,设同一溶液用原显色剂测定4次,吸光度为0.112、0.128、0.120、0.119,用新显色剂测定3次,吸光度为0.170、0.180、0.220。试判断新显色剂测定Pd的灵敏度是否有明显提高?思路 此为两种方法的检验,应采用t检验法,若检出有显著性差异,表明新方法比旧方法有明显改进,反之则无。用t法检验前,先应用F 检验法检查其精密度是否有差异。解 先用F 检验新旧方法的精密度有无显著差异。,F计=(2.610-2)2/(6.610-3)15.5 而F 表 19.2,即F t表,故置信度为95%时,
39、新方法灵敏度有明显提高。,原方法,新方法,例题(P65:例13,14),作业:(P75:9,12),.异常值的检验,在实验中,当对同一试样进行多次平行测定时,常常发现某一组测量值中,往往有个别数据与其它数据相差较大,这一数据称为可疑值。如果确定这是由于过失造成的,则可以弃去不要,否则不能随意舍弃或保留,应该用统计检验的方法,确定该可疑值与其它数据是否来源于同一总体,以决定取舍。,(1)将可疑值除外,求其余数据的平均值和平均偏差;,(2)求可疑值x与平均值 之间的差的绝对值,(3)判断,舍弃。,根据正态分布规律,偏差超过3的测量值的概率小于0.3%,故这一测量值可以舍去。而 0.80,4 3,即
40、偏差超过4 的测量值可以舍去。对于少量实验数据,可以用s代替,用 代替。,保留。,特点:简单,不用查表,但不够准确,当与其它检验法矛盾时,应以其它方法为准。,.Q 检验法,(1)将测量的数据按大小顺序排列。,(2)若异常值为xn,则 若异常值为x1,则,(3)查表得Q值:Q表=Qn,P,(4)比较:,舍弃。,保留。,3、格鲁布斯Grubbs)法,(1)将测量的数据按大小顺序排列,求,(2)设第一个数据可疑,计算,或 设第n 个数据可疑,计算,(3)查表:T表=T,n,(4)T计算 T表,舍弃。,T计算 T表,保留。,包括可疑值在内,.回归分析,一、一元线性回归方程,分析化学中经常用工作曲线来获
41、取未知物的量,A与C的关系是否为线性关系(各实验点是否全部落在一条直线上?)用数字统计方法找出各实验点误差最小的直线 回归分析,1.回归方程,截距:,斜率:,和 分别为x和y的平均值,当回归系数a,b确定后,回归直线就确定下来了,a.从一组数据出发确定这些变量间的定量关系-回归方程的建立,b.评价和度量变量间的关系的密切程度-相关系数检验,c.应用回归方程,从一些变量值去估计另一变量值,d.对回归方程的主要参数作进一步评价和比较-回归曲线的检验,2.回归方程的意义和用途,二.相关系数,1.r值计算,判断y与x之间的相关性好坏的尺度,2.r值的物理意义,当 都在回归线上时,r=1 完全相关当y与x无相关性时,r=0r在01之间时,y与x有相关性,r愈接近1,相关性愈好,3.相关系数的显著性检验,求r值在一定置信度下,当,则x和y相关,所拟合的回归曲线有意义,否则x与y不相关,所得回归方程不可靠,作业:,P20:20,