第四章误差和分析数据的处理选编课件.ppt

上传人:牧羊曲112 文档编号:3946849 上传时间:2023-03-28 格式:PPT 页数:100 大小:3.50MB
返回 下载 相关 举报
第四章误差和分析数据的处理选编课件.ppt_第1页
第1页 / 共100页
第四章误差和分析数据的处理选编课件.ppt_第2页
第2页 / 共100页
第四章误差和分析数据的处理选编课件.ppt_第3页
第3页 / 共100页
第四章误差和分析数据的处理选编课件.ppt_第4页
第4页 / 共100页
第四章误差和分析数据的处理选编课件.ppt_第5页
第5页 / 共100页
点击查看更多>>
资源描述

《第四章误差和分析数据的处理选编课件.ppt》由会员分享,可在线阅读,更多相关《第四章误差和分析数据的处理选编课件.ppt(100页珍藏版)》请在三一办公上搜索。

1、第四章 误差和分析数据的处理,分析测试过程是获取准确量的过程!,教学要求:1、了解误差、偏差的意义;掌握误差和偏差 的表示方法2、了解定量分析数据处理的一般规则3、掌握有效数字的表示方法和运算规则4、强化对分析结果准确度提高的认识,重点、难点:误差及偏差的表示方法、随机误差的正态分布有效数字及运算规则,本章的教学要求及重、难点,几个概念:1、误差(Error 简写为E):误差是指测定值x与待测组分真实值T之差。2、真值(Truth 简写为T):某测定试样客观、真实存在的确定含量(或物理量),用T表示。一般真值是未知的,但以下可以认为是已知的。1)计量学约定的真值:元素的相对原子量、容量瓶和移液

2、管的容积、砝码的质量等。,第一节 误差的基本概念,2)理论真实值:某些化合物的理论组成,如NaCl,H2O以及由此而写出的反应式。3)相对真值:认定精确度高一个数量级的测定值作为低一级的测量值的真值,是相对比较而言的。如标准试样及管理试样中某组分的含量;权威机构发布的标准参考物质等。,误差分为两类:系统误差和随机误差。,2 特点:a.单向性(大小、正负一定)b.重现性、恒定性(相同条件重复测定,重复出现)c.可测性(原因固定)d.影响准确度,不影响精密度,一).系统误差,1 概念:系统误差(systematic error)又称可测误差。是由于分析过程中某些确定的、经常存在的原因对分析结果造成

3、的影响。它比较固定。,产生的原因?,3 产生的原因,a.方法误差选择的分析方法不够完善 例:重量分析中沉淀的溶解损失;滴定分析中反应不完全,滴定终点与计量点不吻合。,包括个人误差(主观误差)操作人员主观因素造成 例:对指示剂颜色辨别习惯偏深或偏浅;滴定管读数习惯地偏高或偏低。,c.操作误差操作方法与正确的有出入。(如使用淀粉指示剂时,有人常在碘的黄色很浓时加入),b.仪器、试剂误差仪器本身不够准确或未经校正、试剂不纯 例:天平两臂不等,砝码未校正;滴定管,容量瓶未校正。例:去离子水不合格;试剂纯度不够(含待测组份或干扰离子)。,消除系统误差的方法?加校正值的方法,指示剂选择 不当,二).随机误

4、差(偶然误差),1、概念 又称不可测误差。是分析过程中某些偶然的、不确定的原因造成的。对分析结果的影响不 固定。2、产生的原因 偶然因素的变化引起,如温度、湿度、气压的变化,仪器波动等 3、特点 a.不具单向性(大小、正负不定)b.不可消除,但可减小 c.分布服从统计规律(正态分布)d.影响分析结果的准确度和精密度,减小方法:增加平行测定次数,系统误差与随机误差的比较,三).过失误差,由粗心大意引起,可以避免;造成大误差的重要因素。,重 做!,例:损失试样,加错试剂,记录错误,用错指示剂等。,一、准确度与误差accuracy and error,准确度:测定值与“真值”T接近的程度。准确度的高

5、低用误差的大小来衡量;误差一般用绝对误差和相对误差来表示。绝对误差:相对误差:,统计学证明,平均值是最可信赖的值,它反应了该组数据的集中趋势,因此常用平均值表示测定结果。=(x1+x2+x3+xn)/n=xi/n(i=1,2,3,.n),为全部测定结果的算术平均值,例1:滴定的体积误差,对25mL的滴定管:滴定剂体积应为2025mL,称量误差,称样质量应大于0.2g,例2 测定含铁样品中w(Fe),比较结果的准确度。,A.铁矿中,,B.Li2CO3试样中,A.,B.,由上述分析可知,两种物质的分析结果绝对误差相等或甚至小,但他们的相对误差并不相同。当被测定的量较大时,相对误差就比较小,测定结果

6、的准确度就比较高。因此,用相对误差来比较各种测定结果的准确度,更为确切些。,二、精密度与偏差 precision and deviation,精密度几次平行测定结果相互接近程度,它反应了测定结果的再现性。精密度的高低取决于随机误差的大小,用偏差来衡量。偏差个别测定值与平均值之间的差值。可用绝对偏差、平均偏差、相对平均偏差及标准偏差等方法来表示。,与真实值有无关系?,(一)偏差、平均偏差、相对平均偏差,偏 差:,平均偏差:,相对平均偏差:,特点:简单 缺点:大偏差得不到应有反映。例:1.230,1.241,1.231,1.232,1.233,1.233,1.230,1、总体和样本,在分析化学中,

7、将一定条件下无限多次测定数据的全体,称为总体(或母体)。自总体中随机抽出一组测量值称为样本(或子样),样本中所含测量值的数目,称为样本大小(或容量)。,(二)标准偏差和相对标准偏差,设样本容量为n,则其平均值为:,当测定次数无限多时,所得的平均值称为总体平均值。,数理统计证明,在消除系统误差且测定次数无限多时(实际上n30),总体平均值即为待测组分的真实值T。,(1)当测定次数趋于无穷大时总体标准偏差,总体标准偏差,表示了各测定值xi对总体平均值的偏离程度,2、标准偏差:计算分两种情况,计算标准偏差时,强调了大偏差数据的作用,因此能更准确、更灵敏地反映测定的精密度。,已知,(2)有限测定次数(

8、20次)-样本标准偏差 和 相对标准偏差,表示了各测定值xi对样本平均值 的偏离程度,标准偏差:,未知,方差(2,s2),例3:用丁二酮肟重量法测定钢铁中Ni的百分含量,结果为10.48%,10.37%,10.47%,10.43%,10.40%;计算单次分析结果的平均偏差,相对平均偏差,标准偏差和相对标准偏差。,解:,n=8 d1=0.28 s1=0.38,n=8 d2=0.28 s2=0.29d1=d2,s1s2,(三)、平均值的标准偏差,m个样本的n次平行测定的平均值:,由关系曲线,当n 大于5时,S S 变化不大,实际测定5次即可。,由统计学可得:,由s s n 作图:,与测量次数呈反比

9、,三、准确度与精密度的关系,1.准确度和精密度分析结果的衡量指标。(1)准确度分析结果与真实值的接近程度 准确度的高低用误差的大小来衡量;误差一般用绝对误差和相对误差来表示。,(2)精密度几次平行测定结果相互接近程度 精密度的高低用偏差来衡量,偏差是指个别测定值与平均值之间的差值。,2.两者的关系 精密度是保证准确度的先决条件;精密度高不一定准确度高。,准确度反应的是测定值与真实值的符合程度。精密度反应的则是测定值与平均值的偏离程度;准确度高精密度一定高;精密度高是准确度高的前提,但精密度高,准确度不一定高。随机误差如何评价?怎样知道它的大小?,小结:,分析方法的种类与划分系统误差与随机误差的

10、含义与判断误差的表示与计算方法准确度与精密度的含义与区别偏差的表示与计算,考点:,如何判断误差是系统误差或随机误差如何评价一个分析方法或分析结果的误差与偏差的大小,课后练习题:,1.多次分析结果的重现性愈,则分析的精密度愈。2.减少随机误差的办法是。3.定量分析工作要求测定结果的误差()A.愈小愈好 B.等于零 C.没有要求 D.在允许的范围内4.评价分析结果的准确度时用 表示最好。5.半微量分析的试样取用量一般为()A 1g左右 B 0.11g C 0.010.1g D 0.0010.01g6.下列可减少测量过程中的偶然误差的方法是()(A)进行对照实验(B)进行空白实验(C)校正仪器(D)

11、增加平行实验的次数,复习:,1、误差及其分类 系统误差、随机误差产生的原因及特点2、准确度及误差3、精密度与偏差 标准偏差(总体、样本s、平均值的标准偏差)方差(2,s2),相对标准偏差(变异系数RSD=s/x)。,引题:,随机误差如何评价?怎样知道它的可靠程度?,第二节 随机误差的正态分布,目的:评价随机误差的大小的可靠程度及随机误差的消除研究方法:以数学统计学提供的方法研究某一测定值、真值或平均值被包含在某一个区间的区间范围及其几率。,(一)极差(R):又称全距,是测定数据中最大值与最小值之差,其值越大表明测定数据越分散。例如:100个测定值:(R=1.92-1.63=0.29)(二)确定

12、组数和组距 组数:组数的多少视样本容量而定,例如分成10组 组距:相邻数据组的差值,极差/组数 0.29/10=0.03 组界数据的精确度比测定值多取一位,以保证每个数据只落在一个组内。(三)统计频数和相对频数 频数:测定值落在每组内的个数 频率(相对频数):频数与样本容量之比,一、频数分布,频数分布表,(四)绘制频数分布直方图(1),测量次数趋近于无穷大时的频率分布?,测量次数少时的频率分布?,某段频率分布曲线下的面积具有什么意义?,问题:,频率分布曲线下的面积具有统计意义,是这一区间面积占总区间面积的概率。,频率分布图,频数分布图(2),频率分布曲线下的面积如何计算?,二、偶然误差的正态分

13、布,正态分布的概率密度函数式(高斯方程),x 表示测量值,y 为测量值出现的概率密度;x-为偶然误差,为无限次测量的总体均值,表示无限个数据的集中趋势(无系统误差时即为真值);是总体标准差,表示数据的离散程度。和是正态分布的两个重要参数,单峰性 x=时,y 最大大部分测量值集中在算术平均值附近 对称性 曲线以x=点垂直x轴的直线为对称正负误差出现的概率相等,讨论,三、标准正态分布曲线,以u y作图,注:u 是以为单位来表示随机误差 x-,四、随机误差的区间概率,正态分布曲线与横坐标之间所加的面积,就等于概率密度函数从-到+的积分值,它表示来自同一总体的全部测定值或随机误差在上述区间出现的概率总

14、和为1。,如何求测定值或随机误差在某区间的概率?,偶然误差的区间概率P用一定区间的积分面积 表示范围内测量值出现的概率,1.求测量值出现在某区间的概率P,2、测量值与随机误差的区间及其概率,练习,例:已知某试样中Co的百分含量的标准值为1.75%,=0.10%,又已知测量时无系统误差,求分析 结果落在(1.750.15)%范围内的概率。,解:,练习,例:同上题,求分析结果大于2.0%的概率。,解:,练习:,(1)解,查表:u=1.5 时,概率为:2 0.4332=0.866=86.6%,(2)解,查表:u 2.5 时,概率为:0.5 0.4938=0.0062=0.62%,一样品,标准值为1.

15、75%,测得=0.10,求结果落在(1)(1.750.15)%概率;(2)测量值大于2%的概率。,86.6%,P,a,a,P+a=1,a 显著性水平 P 置信度,本一节课小结,第三节 有限测量数据的统计处理一、置信度与的置信区间 在一定概率下,根据有限次的测定结果与它的标准偏差(s),估算真值的取值范围在统计学上称为置信区间。这一概率称为置信概率或置信度,用P表示。(一)已知总体标准偏差时,则,单次测定值估计总体平均值可能存在的区间,样本平均值估计总体平均值可能存在的区间,称为置信区间界限,(二)已知样本标准偏差时的置信区间,实际分析工作中通常是以样本标准偏差来表示正态分布的,但这样会于总体标

16、准偏差形成的分布图有差异。1908年,英国统计学与化学家戈赛特提出了t值代替u值,定义为 叫t 分布,二、正态分布与 t 分布区别,1正态分布描述无限次测量数据 t 分布描述有限次测量数据 2正态分布横坐标为 u,t 分布横坐标为 t,3两者所包含面积均是一定范围内测量值出现的概率P 正态分布:P 随u 变化;u 一定,P一定 t 分布:P 随 t 和f 变化;t 一定,概率P与f 有关,,二、正态分布与 t 分布区别(续),4t 分布的应用,置信度(置信水平)P与显著性水平:,置信度(置信水平)P:某一 t 值时,测量值出现在 t s范围内的概率,显著性水平:落在此范围之外的概率,t值的查法

17、:见下面或57页表,表 t 值表(t.某一置信度下的几率系数),讨论:1.置信度不变时:n 增加,t 变小,置信区间变小;2.n不变时:置信度增加,t 变大,置信区间变大;置信度真值在置信区间出现的几率;置信区间以平均值为中心,真值出现的范围;,三、平均值的精密度和平均值的置信区间,1平均值的精密度(平均值的标准偏差),注:通常34次或59次测定足够,例:,总体均值标准差与测量值标准差的关系,有限次测量均值标准差与测量值标准差的关系,复习:,将以上u、t、s引入:,2平均值的置信区间,(1)由单次测量结果估计的置信区间(2)由多次测量的样本平均值估计的置信区间(3)由少量测定结果均值估计的置信

18、区间,练习,例2:对某未知试样中Cl-的百分含量进行测定,4次结果 为47.64%,47.69%,47.52%,47.55%,计算置信度 为90%,95%和99%时的总体均值的置信区间,解:,四、定量分析数据的评价,解决两类问题:(1)可疑数据的取舍 过失误差的判断 方法:Q检验法;格鲁布斯(Grubbs)检验法。确定某个数据是否可用。(2)分析方法的准确性 系统误差的判断 显著性检验:利用统计学的方法,检验被处理的问题是否存在统计上的显著性差异。方法:t 检验法和F 检验法;确定某种方法是否可用,判断实验室测定结果准确性。,(一)、可疑数据的取舍 过失误差的判断,1 Q 检验法步骤:(1)数

19、据排列 X1 X2 Xn(2)求极差 Xn X1(3)求可疑数据与相邻数据之差 Xn Xn-1 或 X2 X1(4)计算:,(5)根据测定次数和要求的置信度,(如90%)查表:,表1-2 不同置信度下,舍弃可疑数据的Q值表 测定次数 Q90 Q95 Q99 3 0.94 0.98 0.99 4 0.76 0.85 0.93 8 0.47 0.54 0.63,(6)将Q与QX(如 Q90)相比,若Q QX 舍弃该数据,(过失误差造成)若Q QX 不舍弃该数据,(偶然误差所致)当数据较少时 舍去一个后,应补加一个数据。,2 格鲁布斯(Grubbs)检验法,(4)由测定次数和要求的置信度,查表得G

20、表(5)比较 若G计算 G 表,弃去可疑值,反之保留。由于格鲁布斯(Grubbs)检验法引入了标准偏差,故准确性比Q 检验法高。,基本步骤:(1)排序:1,2,3,4(2)求和标准偏差S(3)计算G值:,练习,例:测定某药物中钴的含量,得结果如下:1.25,1.27,1.31,1.40g/g,试问1.40这个数据是否应该保留?,解:,五、分析方法准确性的检验-系统误差的判断,b.由测定次数和要求的置信度,查表,得:t表 c.比较 t计 t表,表示有显著性差异,存在系统误差,被检验方法需要改进。t计 t表,表示无显著性差异,被检验方法可以采用。,1.平均值与标准值()的比较 t 检验法a.计算t

21、值,(1)检验法,查表(表),比较:当计表时,不存在1与2间的显著性差异,需做检验。否则,不做。,计算值:,2.两组数据的平均值比较(同一试样),步骤:先用检验法进行偶然误差,即精密度检验,再进行系统误差检验,即 t检验,查表(自由度 f f 1 f 2n1n22),比较:t计 t表,表示有显著性差异,计算值:,新方法-经典方法(标准方法)两个分析人员测定的两组数据 两个实验室测定的两组数据a求合并的标准偏差:,(2)t 检验法,练习,例:用两种不同方法测定合金中铌的百分含量 第一法 1.26%1.25%1.22%第二法 1.35%1.31%1.33%1.34%试问两种方法是否存在显著性差异(

22、置信度90%)?,解:,续前,练习,例:采用某种新方法测定基准明矾中铝的百分含量(10.77%),得到以下九个分析结果,10.74%,10.77%,10.77%,10.77%,10.81%,10.82%,10.73%,10.86%,10.81%。试问采用新方法后,是否引起系统误差?(P=95%),解:,练习,例:采用不同方法分析某种试样,用第一种方法测定 11次,得标准偏差s1=0.21%;第二种方法测定9次 得到标准偏差s2=0.60%。试判断两方法的精密度间 是否存在显著差异?(P=90%),解:,小结,1.比较:t 检验检验方法的系统误差 F 检验检验方法的偶然误差 G 检验异常值的取舍

23、,小结:,1.准确度与精密度的含义与区别、偏差的表示与计算、2.正态分布图的绘制与意义 标准正态分布曲线 随机误差的区间概率:u的取值,积分结果P的意义。有关计算3.比较:t 检验检验方法的系统误差 F 检验检验方法的偶然误差 G 检验异常值的取舍,异常值的取舍,精密度显著性检验,准确度或系统误差显著性检验,课后练习题:,1.衡量样本平均值的离散程度时,应采用()A 标准偏差 B 相对标准偏差 C 极差 D平均值的标准偏差 2.某次测量结果平均值的置信区间表示为:xt 0.01,6 s/=10.79%0.02%,它表示置信度为;测量次数为;最高值为 _。3.有一组平行测定所得的分析数据,要判断

24、其中是否有异常值,应采用-()A t检验 B 格努布斯检验 C F检验 D 方差检验 4.当置信度为0.95时,测得Al2O3的置信区间为(35.210.10)%,其意义是()A 在所测定的数据中有95%在此区间内;B 若再进行测定,将有95%的数据落入此区间;C 总体平均值落入此区间的概率为95%;D 在此区间内包含值的概率为0.95;5.下列可减少测量过程中的偶然误差的方法是()(A)进行对照实验(B)进行空白实验(C)校正仪器(D)增加平行实验的次数,课后练习题(续):,6、下列数据各包括了4位有效数字的是,包括了两位有效数字的是。A、0.0330 B、10.030 C、0.01020

25、D、8.710-5 E、pKa=4.74 F、pH=10.007、下列情况将对分析结果产生何种影响:A.正误差,B.负误差,C.无影响,D.结果混乱。a.标定HCl溶液浓度时,使用的基准物Na2CO3中含有少量NaHCO3;b.用递减法称量试样时,第一次读数时使用了磨损的砝码;c.加热使基准物溶解后,溶液未经冷却即转移至容量瓶中并稀释至刻度,摇匀,马上进行标定;d.配制标准溶液时未将容量瓶内溶液摇匀;e.用移液管移取试样溶液时事先未用待移取溶液润洗移液管;f.称量时,承接试样的锥形瓶潮湿。,8、简答题:A、叙述两位同学用不同方法对同一分析对象进行分析,各得到了三次测量结果。如何评价这两位同学所

26、用的方法是否具有显著性差异?写出评价步骤。B、下列各分析纯物质,用什么方法将它们配制成标准溶液?如需标定,应该选用哪些相应的基准物质?H2SO4,KOH,邻苯二甲酸氢钾,无水碳酸钠。C、什么是滴定度?0.002345mol/L的K2Cr2O7标准溶液,其对Fe的滴定度是多少?D、符合什么条件的物质才能用作基准试剂?E、用作滴定分析的反应应具备什么条件?9、计算题:用两种不同方法测定合金中铌的百分含量 第一法 1.26%1.25%1.22%第二法 1.35%1.31%1.33%1.34%试问两种方法是否存在显著性差异(置信度95%)?,课后练习题(续):,1、正态分布函数中的y、x、P和u 各代

27、表什么?P具有什么意义?P和u有什么关系?2、标准正态分布函数与分布函数的区别是什么?3、如何利用u值计算或查得某值的概率P?4、通常真值是不知道的,如何利用有限次测定值去估计真值的取值范围?,复习引题:,1、什么叫做置信度,什么叫做置信区间?它与 x、t、s有什么关系?如何计算置信区间?2、如何判断一组测量值中的个别数据可以取舍?如何评价两个同学做同一测定所得结果的精密度?3、当你创造出了新方法,如何评价你的方法可靠?4、定量分析的目的是要得到准确的测定结果,如何从数据的纪录上消除误差?,复习引题:,第四节、误差的消除-提高分析结果准确度的方法,系统误差的检验(contrast test):

28、对照试验:选择测量组分的标准试样(或管理样等),采用与测量组分相同的测量条件进行测量的方法。1、用标准试样对照 方法及结果评价:用标样做实验,用t法进行检验。2、用标准方法进行对照:适用于新方法检验 3、用标准加入法或回收法对照 在测试样品的溶液中加待测组分的已知量组分,与含有待测组分相同条件下进行的测量。计算回收率。扣除测试结果中的试样测试值后,可得加入组分的测试值。再计算回收率。回收率应该在99%-101%(误差1%),在95%-105%(误差5%)。该法现不推荐。,第四节、误差的消除-提高分析结果准确度的方法(续),系统误差的消除:选择合适的分析方法、对仪器进行校正、选择测量操作、进行空

29、白试验。空白试验:不加待测组分时与含有待测组分相同条件下进行的测量。用来检验试剂、溶剂带来的系统误差。将测试结果的校正扣除空白实验值,可得真实值。,随机误差的消除:增加试验次数 对测量数据进行统计分析正确结果的表示:20.02%0.05%或 19.97%20.07%,第四章 定量分析中的误差与数据评价,第五节 有效数字及其运算规则,一、有效数字 二、有效数字运算规则,一、有效数字,1实验过程中常遇到的两类数字(1)数目:如测定次数;倍数;系数;分数(2)测量值或计算值。数据的位数与测定准确度有关。记录的数字不仅表示数量的大小,而且要正确地反映测量的精确程度。结果 绝对偏差 相对偏差 有效数字位

30、数 0.51800 0.00001 0.002%5 0.5180 0.0001 0.02%4 0.518 0.001 0.2%3,2数据中零的作用,数字零在数据中具有双重作用:(1)作普通数字用,如 0.5180 4位有效数字 5.180101(2)作定位用:如 0.0518 3位有效数字 5.18102,3改变单位,不改变有效数字的位数,如:24.01mL 24.01103 L 4注意点(1)容量器皿;滴定管;移液管;容量瓶;4位有效数字(2)分析天平(万分之一)取4位有效数字(3)标准溶液的浓度,用4位有效数字表示:0.1000 mol/L(4)pH 4.34,小数点后的数字位数为有效数字

31、位数 对数值,lgX=2.38;lg(2.4102),二、运算规则,1.加减运算 结果的位数取决于绝对误差最大的数据的位数 例:0.0121 绝对误差:0.0001 25.64 0.01 1.057 0.001,26.7091,2.乘除运算时,有效数字的位数取决于相对误差最大的数据的位数 例:(0.0325 5.103 60.0)/139.8=0.071179184 0.0325 0.0001/0.0325 100%=0.3%5.103 0.001/5.103 100%=0.02%60.06 0.01/60.06 100%=0.02%139.8 0.1/139.8 100%=0.07%,3.注

32、意点,(1)分数、比例系数、实验次数等不记位数;(2)第一位数字大于8时,多取一位,如:8.48,按4位算;(3)四舍六入五留双;(4)先修约,后计算(5)注意pH计算,H+=5.0210-3;pH=2.299;有效数字按小数点后的位数计算。,第四章 分析化学中的误差与数据评价,第六节 Excel在分析化学中的应用 标准偏差等运算作图函数库的应用,标准偏差等运算,第四章 分析化学中的误差与数据评价,化学计量学的初步知识1、化学计量学的含义 2、化学计量学的历史、现状及其教学 3、化学计量学的内容:着重介绍一元回归分析,附加内容:回归分析法(标准曲线的线形方程拟合),一、化学计量学的初步知识,化

33、学计量学(chemometrics)的含义:Chemometrics is the chemical discipline that uses mathe-matical and statistical methods(a)to design or select op-timal measurement procedures and experiment and(b)to provide maximum chemical information by analyzing chemical data.In the field of analytical chemistry,chem-ometri

34、cs is the chemical discipline that uses mathematical and statistical methods to obtain in an optimal way relev-ant information about material systems.,化学计量学的历史、现状及教学:化学计量学的内容:1.评估和解释化学数据或分析数据;2.优化和设计化学或分析过程及实验;3.从实验测量数据中提取最大限度的化学信息和分析信息。本节课学习的是:内容1中的初步知识-一元回归分析,是将统计学、数学和计算机科学应用于化学的一门新兴的交叉学科,是化学领域的一个

35、重要分支。,化学计量学(chemometrics)的含义:,二、一元回归分析 1.最小二乘法拟合的统计学原理,一元线性:y=a0+a1x 实验点:(yi,xi)(i=1,2,3,.,m)实验点数 m未知数个数,矛盾 方程组,假设求得:a0;a1 代入 yi=a0+a1xi 得直 线方程。实测值yi与计算值 yi之间偏差越小,拟合的越好,偏差 平方和最小。,2.最小二乘法,含义:若y值存在偏差,使实验点和计算所得直线在y方向的偏差最小。偏差有正负,故取残差平方和趋于最小,称为最小二乘法(least squares),将实验数据代入,即可求得 a0,a1;y=a0+a1x;,例1 对凹凸棒石进行改

36、性,以提高其对棕榈油的脱色效果。在1千克凹土中加入具有强路易斯酸性的金属离子进行了10次脱色试验,结果见下表,试找出加入金属离子的量与脱色率的关系。,1 2 3 4 5 6 7 8 9 10 76.0 79.1 77.8 77.2 72 69 71.8 70 67.9 64.1,加入金属离子量/g脱 色 率/%,1 2 3 4 5 6 7 8 9 10,序 号,解 按照以上推出的公式得,3、相关系数 R(correlation coefficient)任何n对数据都可以用最小二乘法得到回归直线。但求出的回归直线是否可靠,就需要对其进行显著性检验。检验方法叫相关系数R,意义:R=1;存在线性关系

37、,无实验误差;R=0;毫无线性关系;R的绝对值在01之间时,可查与测量次数和置信度有关的相关系数检验表来判断 y与x有无相关关系。RjRb,有;RjRb,无。以上例R=0.908,n=10,a=0.01,查表得Rb=0.765,RRb,故有线性关系。,三、最小二乘线性拟合程序,编程变量:,线性拟合程序,INPUT MFor I=1 to m INPUT X1;Y1 X1=X1+X(I):X2=X2+X(I)2:Y1=Y1+Y(I)Y2=Y2+Y(I)2 XY=XY+X(I)*Y(I)NEXT IXM=X1/M:YM=Y1/MLX=X2-XM*M:LY=Y2-YM*M:LZ=XY-M*XM*YMa1=LZ/LX:a0=YM-a1*XM:R=LZ/(LX*LY)2,本次教学内容小结:,有效数字的纪录及其计算 误差的消除一元回归分析作业:一套练习题(必须抄写题目,保留好此作业题),人有了知识,就会具备各种分析能力,明辨是非的能力。所以我们要勤恳读书,广泛阅读,古人说“书中自有黄金屋。”通过阅读科技书籍,我们能丰富知识,培养逻辑思维能力;通过阅读文学作品,我们能提高文学鉴赏水平,培养文学情趣;通过阅读报刊,我们能增长见识,扩大自己的知识面。有许多书籍还能培养我们的道德情操,给我们巨大的精神力量,鼓舞我们前进。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号