《误差分析和数据处理.ppt》由会员分享,可在线阅读,更多相关《误差分析和数据处理.ppt(42页珍藏版)》请在三一办公上搜索。
1、2023/6/25,误差分析和数据处理,主讲:仵博万 博士,教授电话:,祝大家学习愉快,天天进步!,物理化学实验讲座,2023/6/25,1.3 误差分析和数据处理,1 绪论 1.3 误差分析和数据处理,2023/6/25,1.3 误差分析和数据处理,物理化学实验是研究物质的物理性质以及这些物理性质与其化学反应间关系的一门实验科学。在实验研究工作中,一方面要拟定实验的方案,选择一定精度的仪器和适当的方法进行测量;另一方面必须将测得的数据加以整理归纳、科学地分析,并寻求被研究体系变量间的关系规律。但由于仪器和感觉器官的限制,实验测得的数据只能达到一定程度的准确性。因此,在着手实验之前了解测量所能
2、达到的准确度,以及在实验以后合理地进行数据处理,都必须具有正确的误差,2023/6/25,1.3.有关数据处理的基本概念,概念。在此基础上通过误差分析,寻找适当的实验方法,选用最适合的仪器及量程,得出测量的有利条件。1.3.1 有关数据处理的基本概念 1.3.1.1 测量值、真值和平均值通过仪器测量某种物理量,仪器所示值即为测量值,在一定条件下,被测物理量客观存在的值成为真实值(真值)。真值在不同场合下有不同的含义。包括理论真值、规定真值和相对真值。,2023/6/25,1.3.有关数据处理的基本概念,对于被测物理量,真值通常是个未知量,由于误差的客观存在,真值一般是无法测得的。测量次数无限多
3、时,根据正负误差出现的概率相等的误差分布定律,在不存在系统误差的情况下,它们的平均值极为接近真值。故在实验科学中真值的定义为无限多次观测值的平均值。但实际测定的次数总是有限的,由有限次数求出的平均值,只能近似地接近于真值,可称此平均值为最佳值(或可靠值)。,2023/6/25,1.3.有关数据处理的基本概念,常用的平均值有下面几种:设x1、x2、xn为各次的测量值,n 代表测量次数。(1)算术平均值 这种平均值最常用。,(1-1),2023/6/25,1.3.有关数据处理的基本概念,(2)均方根平均值,(1-2),2023/6/25,1.3.有关数据处理的基本概念,(3)几何平均值,(1-3)
4、,2023/6/25,1.3.有关数据处理的基本概念,(4)加权平均值,(1-4),2023/6/25,1.3.1.误差的产生,1.3.2 误差的产生 测量值与真值之间的差值称为测量误差(简称误差),误差的产生来自于以下几个方面:(1)系统误差 系统误差是由某些固定不变的因素引起的,这些因素影响的结果永远朝一个方向偏移,其大小及符号在同一组实验测量中完全相同。实验条件一经确定,系统误差就是一个客观上的恒定值,多次测量的平均值也不能减弱它的影响。误差随实验条件的改变按一定规律变化。,2023/6/25,1.3.1.误差的产生,系统误差主要是因为实验方法本身的限制,使用的仪器不够精确以及实验者个人
5、的习惯所引起的主观误差等因素所造成的,通过改进仪器和实验装置,以及提高测试技能等方法可以减小系统误差。(2)随机误差 它是由某些不能预料的因素所造成的。在相同条件下做多次测量,其误差数值是不确定的,时大时小,时正时负,没有确定的规律,这类误差称为随机误差或偶然误差。这类误差产生原因不明,因而无法控制和补偿。,2023/6/25,1.3.1.误差的产生,若对某一量值进行足够多次的等精度测量,就会发现随机误差服从统计规律,这种规律可用正态分布曲线表示。如图1-2所示。随着测量次数的增加,随机误差的算术平均值趋近于零,所以多次测量结果的算术平均值将更接近于真值。,图1-2 误差的正态分布曲线,202
6、3/6/25,1.3.1.误差的产生,(3)过失误差 过失误差是一种与实际事实明显不符的误差,过失误差明显地歪曲试验结果。误差值可能很大,且无一定的规律。它主要是由于实验人员粗心大意、操作不当造成的,如读错数据,记错或计算错误操作失误等。在测量或实验时,只要认真负责是可以避免这类误差的。存在过失误差的观测值在实验数据整理时应该剔除。,2023/6/25,1.3.1.3 精密度和准确度,1.3.1.3 精密度和准确度 测量的质量和水平可以用误差概念来描述,也可以用准确度来描述。为了指明误差来源和性质,可分为精密度和准确度。精密度:在测量中所测得的数值重现性的程度。它可以反映随机误差的影响程度,随
7、机误差小,则精密度高。准确度:测量值与真值之间的符合程度。它是测量中所有系统误差和随机误差的综合影响结果。,2023/6/25,1.3.1.3 精密度和准确度,根据误差表示方法的不同,有绝对误差和相对误差。(1)绝对误差绝对误差是指测量值与真值之差:绝对误差=测量值-真值对于多次测量的结果,使用平均误差的概念:,(1-5),2023/6/25,1.3.1.3 精密度和准确度,绝对误差能表示测量的数值是偏大还是偏小以及偏离程度,但不能确切地表示测量所达到的准确程度。准确程度可以用相对误差来表示。(2)相对误差相对误差是指绝对误差与被测真值的比值:相对误差=绝对误差/真值X100%同样对于多次测量
8、,相对平均偏差:,(1-6),2023/6/25,1.3.1.3 精密度和准确度,用数理统计方法处理实验数据时,常用标准误差(均方根误差)来衡量精密度。标准误差:,(1-7),2023/6/25,1.3.2 误差分析,一切物理量的测定,可分为直接测量和间接测量两种。直接表示所求结果的测量称为直接测量,如用天平称量物质的质量,用量筒测量液体的体积等。若所求结果为数个测量值以某种公式计算而得,则这种测量称为间接测量。在间接测量中,每个直接测量值的准确度都会影响最后结果的准确性。通过误差分析,我们可以查明直接测量的误差对结果的影响情况,从而找出误差的主要来源,以便于选择适当的实验方法,合理配置仪器;
9、寻求测量的有利条件。,2023/6/25,1.3.2.1 仪器的精密度,1.3.2.1仪器的精确度 误差分析限于对结果的最大可能误差的估计,因而对各直接测量的量只要预先知道其最大误差范围就够了。当系统误差已经校正,而操作控制又足够精密时,通常可以用仪器读数精密度来表示测量误差范围。如果没有精度表示,对于大多数仪器来说,最小刻度的1/5可以看作其精密度,如玻璃温度计、液柱式压力(压差)计等。,2023/6/25,1.3.2.1 误差传递,1.3.2.2 误差传递(1)平均误差与相对平均误差的传递设有物理量N,由直接测量值u1,u2,.un决定:N=f(u1,u2,.un)直接测量值的平均误差为:
10、u1,u2,.un,那么N可求得。,(1-8),2023/6/25,1.3.2.1 误差传递,用各自变量的平均误差ui代替dui,并考虑最不利的情况下,直接测量的误差不能抵消,从而引起误差的累积,故取绝对值。上式变为:,(1-9),上式两边同除以N得:,(1-10),2023/6/25,1.3.2.1 误差传递,运用上式可以讨论直接测量值与结果的不同函数关系时,误差的传递的计算。加、减法:N=u1u2u3.,(1-11),乘、除法:N=u1.u2或N=u1/u2,(1-12),2023/6/25,1.3.2.1 误差传递,乘方、开方:N=un,(1-13),(2)间接测量结果的标准误差估计设函
11、数为u=f(,.),式中,的标准误差分别是,.,则u的标准误差应为:,2023/6/25,1.3.2.1 误差传递,(),2023/6/25,1.3.3.1 实验数据的记数法和有效数字,1.3.3.1 实验数据的记数法和有效数字 实验测量中所使用的仪器仪表只能达到一定的精度,因此测量或运算的结果不可能也不应该超越仪器仪表所允许的精度范围。通常称所有确定的数字(不包括表示小数点位置的“”)和最后不确定的数字一起为有效数字。有效数字只能具有一位可疑值。,2023/6/25,1.3.3.1 实验数据的记数法和有效数字,例如:用最小分度为cm的标尺测量两点间的距离,得到:9140 mm、914.0 c
12、m、9.140 m、0.009140 km,其精确度相同,但由于使用的测量单位不同,小数点的位置就不同。有效数字的表示应注意非零数字前面和后面的零。0.009140km前面的三个零不是有效数字,它与所用的单位有关。非零数字后面的零是否为有效数字,取决于最后的零是否用于定位。,2023/6/25,1.3.3.1 实验数据的记数法和有效数字,有效数字的运算规则:1)加、减法运算有效数字进行加、减法运算时,各数字小数点后所取的位数位数与其中位数最小的相同。2)乘、除法运算两个量相乘(相除)的积(商),其有效数字位数与各因子中有效数字位数最少的相同。3)乘方、开方运算,2023/6/25,1.3.3.
13、1 实验数据的记数法和有效数字,其结果可比原数多保留一位有效数字。4)对数运算对数的有效数字的位数应与其真数相同。在所有计算式中,常数,e的数值的有效数字位数,认为是无限制,需要几位就取几位。表示精度时,一般取一位有效数字,最多取两位有效数字。,2023/6/25,1.3.3.1 实验数据的记数法和有效数字,数值取舍规则(有时称之为“四舍六入五留双”),常用的“四舍五人”的方法对数值进行取舍,得到的均值偏大。而用上述的规则,进舍的状况具有平衡性,变大的可能性与变小的可能性是一样的。,2023/6/25,1.3.3.2 实验数据处理方法,实验数据中各变量的关系的表示可为列表法,图示法和经验公式法
14、。列表法:将实验数据制成表格。它显示了各变量间的对应关系,反映出变量之间的变化规律。它是进一步处理数据的基础。图示法:将实验数据绘制成曲线,它直观地反映出变量之间的关系,而且为整理成数学模型(方程式)提供了必要的函数形式的直观表达。经验公式法:借助于数学方法将实验数据按一定函数形式整理成方程,即数学模型。,2023/6/25,1.3.3.2 实验数据处理方法,(1)列表法在科学试验中一系列测量数据都是首先列成表格,然后再进行其他的处理。表格法简单方便,但要进行深入的分析,表格就不能胜任了。首先,尽管测量次数相当多,但它不能给出所有的函数关系;其次,从表格中不易看出自变量变化时函数的变化规律,而
15、只能大致估计出函数是递增的、递减的或是周期性变化的等。列成表格是为了表示出测量结果,或是为了以后的计算方便,同时也是图示法和经验公式法的基础。,2023/6/25,1.3.3.2 实验数据处理方法,列表法的基本要求:a.应有简明完备的名称、数量单位和因次;b.数据排列整齐(小数点),注意有效数字的位数;c.选择的自变量如时间,温度、浓度等,应按递增排列;d.如需要,将自变量处理为均匀递增的形式,这需找出数据之间的关系,用拟合的方法处理。,2023/6/25,1.3.3.2 实验数据处理方法,(2)图示法图示式的最大优点是一目了然,即从图形中可非常直观地看出函数的变化规律,如递增性或递减性,是否
16、具有周期性变化规律等,也可从图上获得如:最大值、最小值,作出切线,求出曲线下包围的面积等。但是,从图形上只能得到函数变化关系而不能进行数学分析。图解的基本要点为:a.在直角坐标系中绘制测量数据的图形时,应以横坐标为自变量,纵坐标为对应的函数量。,2023/6/25,1.3.3.2 实验数据处理方法,b.坐标纸的大小与分度的选择应与测量数据的精度相适应。分度过粗时,影响原始数据的有效数字,绘图精度将低于试验中参数测量的精度;分度过细时会高于原始数据的精度。坐标分度值不一定自零起,可用低于试验数据的某一数值作起点和高于试验数据的某一数值作终点,曲线以基本占满全幅坐标纸为宜,直线应尽可能与坐标轴成4
17、50角。横坐标与纵坐标的实际长度应基本相等。c.坐标轴应注明分度值的有效数字和名称、单位,必要时还应标明试验条件,坐标的文字书写方向应与该,2023/6/25,1.3.3.2 实验数据处理方法,坐标轴平行,在同一图上表示不同数据时应该用不同的符号加以区别。d.实验点的标示可用各种形式,如点、圆、矩形、叉等,但其大小应与其误差相对应。e.曲线平滑方法。由于每一个测点总存在误差,按带有误差的各数据所描的点不一定是真实值的正确位置。根据足够多的测量数据,完全有可能作出一光滑曲线。决定曲线的走向应考虑曲线应尽可能通过或接近所有的点,顾及到所绘制的曲线与实测值之间的误差的平方和最小,此时曲线两边的点数接
18、近于相等。,2023/6/25,1.3.3.2 实验数据处理方法,作图完成后,可以通过图形进行进一步的分析和处理了。(3)经验公式法测量数据不仅可用图形表示出数据之间的关系,而且可用与图形对应的一个公式(解析式)来表示所有的测量数据,当然这个公式不可能完全准确地表达全部数据。因此,常把与曲线对应的公式称为经验公式,在回归分析中则称之为回归方程。,2023/6/25,1.3.3.2 实验数据处理方法,把全部测量数据用一个公式来代替,不仅有紧凑扼要的优点,而且可以对公式进行必要的数学运算,以研究各自变量与函数之间的关系。建立公式的步骤大致可归纳如下:a.描绘曲线。用图示法把数据点描绘成曲线。b.对
19、所描绘的曲线进行分析,确定公式的基本形式。c.曲线化直。如果测量数据描绘的曲线被确定为某种类型的曲线,尽可能地将该曲线方程变换为直线方程,2023/6/25,1.3.3.2 实验数据处理方法,,然后按一元线性回归方法处理。d.确定公式中的常量。代表测量数据的直线方程或经曲线化直后的直线方程表达式为y=a+bx,可根据一系列测量数据用各种方法确定方程中的常量a和b。e.检验所确定的公式的准确性,即用测量数据中自变量值代人公式计算出函数值,看它与实际测量值是否一致,如果差别很大,说明所确定的公式基本形式可能有错误,则应建立另外形式的公式。如果测量曲线很难判断属何种类型,则可按多项式回归处理。,20
20、23/6/25,1.3.3.2 实验数据处理方法,(4)回归分析的基本原理和方法 若两个变量x和y之间存在一定的关系,并通过试验获得x和y的一系列数据,用数学处理的方法得出这两个变量之间的关系式,这就是回归分析,也称拟合。所得关系式称为经验公式,或称回归方程、拟合方程。如果两变量x和y之间的关系是线性关系,就称为一元线性回归或称直线拟合。如果两变量之间的关系是非线性关系,则称为一元非线性回归或称曲线拟合。这里只介绍一元线性回归的原理和方法,对于非线性拟合的方法在“Matlab处理实验数据”中介绍。,2023/6/25,1.3.3.2 实验数据处理方法,直线拟合即是找出x和y的函数关系y=a+b
21、x中的常数a,b。通常粗略一点可用作图法、平均值法,准确的作法是采用最小二乘法计算或应用计算机软件处理。a.作图法 把实验点绘到坐标纸上,根据实验点的情况画出一条直线,尽量让实验点与此直线的偏差之和最小,然后在图上得到直线的斜率b和截距a。计算斜率量要尽可能从直线两端点求得。这种方法显然有相当的随意性。,2023/6/25,1.3.3.2 实验数据处理方法,b.平均值法当有6个以上比较精密的数据时,结果比作图法好。将实验数据代入方程:yi=a+bxi,把这些方程尽量平均地分为两组,每组中各方程相加成一个方程,最后成一个二元一次方程组,可解得a和b。c.最小二乘法计算这是最准确的处理方法,其根据是残差平方和最小。这种方法需要7个以上的数据,计算量比较大。,2023/6/25,1.3.3.2 实验数据处理方法,d.计算机软件应用 随着计算机的广泛使用,用计算机处理数据已经是必然的趋势。实现最小二乘法的程序和软件已经广运用于数据处理中,现在比较常用的是使用Excel和Matlab通用软件,也有些用专用的实验数据处理程序来处理。由于数据处理与图形的结合,使我们的实验数据处理变得非常方便,而且获得的结果更为客观。而对于不易变换为线性关系的实验数据,能很方便地用多项式拟合出解析式,以便于进一步处理,或得出经验公式。在我们今后的实验中将学习并初步掌握Matlab的使用,会用它去处理实验数据。,