《数据处理方法(1).docx》由会员分享,可在线阅读,更多相关《数据处理方法(1).docx(32页珍藏版)》请在三一办公上搜索。
1、数据处理方法数据 数据处理是指从获得的数据得出结果的加工过程,包括记录,整理,计算,分析等处理方法。用简明而严格的方法把实验数据所代表的事物内在的规律提炼出来,就是数据处理。正确处理实验数据是实验能力的基本训练之一。根据不同的实验内容,不同的要求,可采用不同的数据处理方法。本章介绍物理实验中较常用的数据处理方法。 1 列表法 获得数据后的第一项工作就是记录,欲使测量结果一目了然,避免混乱,避免丢失数据,便于查对和比较,列表法是最好的方法。制作一份适当的表格,把被测量和测量的数据一一对应地排列在表中,就是列表法。 一、列表法的优点 1 能够简单地反映出相关物理量之间的对应关系,清楚明了地显示出测
2、量数值的变化情况。 2 较容易地从排列的数据中发现个别有错误的数据。 3 为进一步用其他方法处理数据创造了有利条件。 二、列表规则 1 用直尺划线打表,力求工整。 2 对应关系清楚简洁,行列整齐,一目了然。 3 表中所列为物理量的数值,因此表的栏头也应是一纯数,即物理量的符号除以单位的符号, 例如: /ms、I /10A等,其中物理量的符号用斜体字,单位的符号用正体字。为避免手写正、斜体混乱,本课程规定手写时物理量用汉字表示,例如:加速度/ms、电流强度/10A。 4 提供必要的说明和参数,包括表格名称、主要测量仪器的规格、有关的环境参数、引用的常量和物理量等。 三、应用举例 例1 用列表法报
3、告测得值。 列表法还可用于数据计算,此时应预留相应的格位,并在其标题栏中写出计算公式。 表1 用伏安法测量电阻 伏特计1.0级,量程15V,内阻15k 毫安表1.0级,量程20mA,内阻1.20 测量序号 电压 电流 U k / V I k / mA k 1 2 3 4 5 0 2.00 4.00 6.00 8.00 0 3.85 8.15 12.05 15.80 6 10.00 19.90 四、列表常见错误 1 没有提供必要的说明或说明不完全,造成后续计算中一些数据来源不明,或丢失了日后重复实验的某些条件。 2 横排数据,不便于前后比较。 3 栏头概念含糊或错误,例如将U k / V写成U
4、k (V)或U k,V等。 4 数据取位过少,丢失有效数字,给继续处理数据带来困难。 5 表格断成两截,达不到一目了然。 要按照列表规则养成良好的列表习惯,避免出现以上的错误。 列表法是最基本的数据处理方法,一个好的数据处理表格,往往就是一份简明的实验报告,因此,在表格设计上要舍得下功夫。 . 2 作图法 在研究两个物理量之间的关系时,把测得的一系列相互对应的数据及变化的情况用曲线表示出来,这就是作图法。 一.作图法的优点 1 能够形象、直观、简便地显示出物理量的相互关系以及函数的极值、拐点、突变或周期性等特征。 2 具有取平均的效果。因为每个数据都存在测量不确定度,所以曲线不可能通过每一个测
5、量点。但对于曲线,测量点时靠近和匀称分布,故曲线具有多次测量取平均的效果。 3 有助于发现测量中的个别错误数据。 虽然曲线不可能通过所有的数据点,但不在曲线上的点都应是靠近曲线才合理。如果某一个点离曲线明显的远了,说明这个数据错了,要分析产生错误的原因,必要时可重新测量或剔除该测量点的数据。 4 作图法时一种基本的数据处理方法,不仅可以用于分析物理量之间的关系,求经验公式,还可以求物理量的值。但受图纸大小的限制,一般只有34位有效数字,且连线具有较大的主观性。所以用作图法求值时,一般不再计算不确定度。 在报告实验结果时,一条正确的曲线往往胜过百个文字的描述,它能使实验中各物理量间的关系一目了然
6、,所以只要有可能,实验结果就要用曲线表达出来。 二.作图规则 1 列表 按列表规则,将作图的有关数据列成完整的表格,注意名称、符号及有效数字的规范使用。 2 选择坐标纸 作图必须用坐标纸。根据物理量的函数关系选择合适的坐标纸,最常用的是直角坐标纸,此外还有对数坐标纸、半对数坐标纸、极坐标纸等。本节以直角坐标为例介绍作图法,其他坐标可参考本节原则进行。 坐标纸的大小要根据测量数据的有效位数和实验结果的要求来决定,原则是以不损失实验数据的有效数字和能包括全部实验点作为最低要求,即坐标纸的最小分格与实验数据的最后一位准确数字相当。在某些情况下例入数据的有效位太少使得图形太小,还要适当放大以便与观察,
7、同时也有利于避免由于作图而引入附加的误差;若有效位数多,又不宜把该轴取得过长,则应适当牺牲有效位,以求纵横比适度。 3 标出坐标轴的名称和标度 通常的横轴代表自变量,纵轴代表因变量,在坐标轴上表明所代表物理量的名称和单位,标注方法与表的栏头相同,即量的符号除以单位的符号。横轴和纵轴的标度比例可以不同,其交点的标度值不一定是零。选择原点的标度值来调整图形的位置,使曲线不偏于坐标的一边或一角;选择适当的分度比例来调整图形的大小。使图形充满纸。分度比例要便于换算和描点,例如,不要用4个格代表1或用1格代表3一般取1,2,5,10标度值按整数等间距标在坐标纸上。 3 描点和连线 根据测量数据,用削尖的
8、铅笔在坐标图纸上用“+”或“x”标出各测量点,使各测量数据坐落在“+”或“x”的交叉点上。同一图上的不同曲线应当用不同的符号,如“x”、“+”、“”、“”、“”等。 用透明的直尺或曲线板把数据点连成直线或光滑曲线。连线应反映出两物理量关系的变化趋势,而不应强求通过每一个数据点,但应使在曲线两旁的点有较匀称的分布,使曲线有取平均的作用。用曲线板连线的要领是:看准四个点,连中间两点间的曲线,依次后移,完成整个曲线。 5. 在图上空旷位置,写出完整的图名、绘制人姓名及绘制日期,所标文字应当用仿宋体。 三、 求直线的斜率和截距 直线时,其方程具有形式yb0 + b1x。只要求出斜率b1和截距b0,就可
9、以得到关于物理量x,y的经验公式。在许多实验中也通过求斜率或截距来求得物理量。 例2.测定有一固定转轴的刚体的转动惯量J,该刚体受到动力矩M和阻力矩M的作用,根据转动定律M - M =J,写成M =M + J,设阻力矩为常量,这就是一个直线方程。改变动力矩M,测得一系列相应的角加速度,作M曲线,求出斜率和截距,就得到了转动惯量和阻力矩。 1 求斜率 直线方程 yb0 + b1x 在曲线上取p1(x1,y2)和p2(x2,y2)两点代入式,即可求得斜率。求斜率时要注意: p1、p2必须是直线上的点,且不可取测量点; p1、p2在测量范围以内,且相距尽量远; p1、p2用不同于作图描点的符号标出,
10、例如用或,标上字母符号p1或p2及坐标值。读数和计算时注意正确使用有效数字; 在实验报告上写出计算斜率的完整过程。 2 求截距 截距b0是对应于x=0的y值。在曲线上另取一点p3(x3,y3),将x3、y3的值和式,代入直线方程,求得 b1y3y2xy1x.x321 如果作图时x轴标度从零开始,截距b0也可以从图上直接读出。 四、应用举例 例3. 以例1伏安法测电阻为例,用作图法求电阻R。 表2 作图数据列表 x y U k (V) I k ( mA) 测量序号 k 1 2 3 4 5 0 2.00 4.00 6.00 8.00 0 385 815 1205 1580 6 10.00 1990
11、 在直角坐标纸上建立坐标,在横轴右端标上“电压/V”,以1mm代表0.1V,原点标度值为0,每隔20mm依次标出2.00,4.00,6.00,8.00,10.00;在纵轴上端标上电流/mA,以1mm代表0.2mA,原点标度值为0,每隔25mm依次标出5.00,10.00,15.00,20.00。如图1。 削尖铅笔,按照表2的数据,用符号“+”描出各测量点,然后用透明的直尺划一条直线,连线时注意使6个测量点靠近直线且匀称地分布在该直线的两侧。 在曲线上方空白处写上图名“电阻的伏安性曲线”。 为求斜率,在曲线上取两点用“”标出,并在旁边写上符号和坐标值p1 (1.00,2.02) 和p2 (9.0
12、0,17.98) 图1 电阻的伏安特性曲线 17.982.02斜率 电阻 9.001.00=1.995五、曲线改直 按相关物理量作成曲线虽然直观,但要判断具体函数关系却比较困难。通过适当的变换,将曲线改成直线,再作图分析就方便得多,而且容易求得有关的参数。 例4 带等量异号电荷的无线长同轴圆柱面之间的静电场中,某点A的电场强度E的大小和A点到轴线的距离r成反比。现用实验来验证E。实验中不能直接测电场强度,只能测得A点的电位U,根据场强和电位的关系EdU/dr,从E可推出Uln(r)。实验数据处理时作r U图线,得到一条曲线,很难看出他们有怎样的函数关系。若仍以U为横轴,而已ln为纵轴,则图线为
13、一条直线,这就证明了U ln(r),从而严正了Ea 的关系。 r-U曲线 (b)lnr-U曲线 图2 曲线改直 六、作图中的常见错误 1 原点标度不当,图形偏于一边或一角;坐标比例不当,图形太小或部分实验点超出图纸而丢失。 2 在坐标轴上标出了测量值或在实验点旁标出其坐标值。 3 用“”作为描点的符号;用圆珠笔作图或者没有把铅笔削尖;徒手连线或者用直尺连曲线。 4 求斜率,截距使用了测量电。应注意,即使曲线通过了测量点,该点也不可用来求斜率和截距。 最后应该指出,不要以为作图法仅仅是做完实验之后处理数据的一种方法,从分析实验任务设计方案时就可以运用作图法的思想。例3就巧妙地绕开了阻力矩地影响求
14、得了转动惯量。作图法适用于物理实验的全过程。在教学中,作图法对于物理思维,实验方法和技能的训练有着特殊的地位和作用。 3 逐差法 当两物理量成线性关系时,常用逐差法来计算因变量变化的平均值;当函数关系为多项式形式时,也可用逐差法来求多项式的系数。逐差法也成为环差法。 一、 逐差法的优点 1 充分利用测量数据,更好地发挥了多次测量取平均值的效果。 2 绕过某些定值未知量。 3 可验证表达式或求多项式的系数。 二、 逐差法的适用条件 1 两物理量x,y之间的关系可表达为多项式形式。 例如: yb0 + b1x yb0 + b1x + b 2x yb0 + b1x + b 2x + b 3x 2 变
15、量x必须是等间距变化,且较因变量y有更高的测量准确度,以致通常x的测量不确定度忽略不计 三、 逐项逐差 逐项逐差就是把因变量y的测量数据逐项相减,用来检查y对于x是否成线性关系,否则用多次逐差来检查多项式的幂次。 1 一次逐差 若yb0 + b1x,测得一系列对应的数据 x1,x2,xk ,xn y1,y2,yk ,yn 逐项逐差,得到: y2y1y1 y3y2y2 yk1ykyk 因为y对于x成线性关系,且x为等间距变化,故yk常量。所以,若对实验测量值进行逐项逐差,得到 yk常量 则证明y对于x成线性关系。 2 二次逐差 若yb0 + b1xb2x,则逐项逐差后所得结果yk常量,遂将yk再
16、作一次逐项逐差 y2y1y1 y3y2y2 yk1ykyk 同理,若二次逐差结果yk常量,则可证明y对于x为二次幂的关系。依此类推,还可以进行三次逐差或更高次逐差。 四、 分组进行逐差求多项式的系数 用逐差法来求因变量变化的平均值,或求多项式的系数时,不能用逐项逐差,而是把n项测量值分为上、下两组,用下组中的每一个数据与上组中对应的数据一一相减。 1 当y对于x为线性关系yb0 + b1x时,用一次逐差即可求系数b0和b1。 求系数b1 测得值如式,共有n项对应值。分为上、下两组,每组有ln/2项。隔l项相减作逐差: ykb0 + b1xi yk1b0 + b1xkl 两式相减得到 yk1yk
17、b1 上式左边为因变量隔l项得逐差值,记为lyk;右边括号中为l倍自变量间隔,记为l,则上式写为 lykb1l 从k1到kl共可得到l个lyi值,取平均记为ly 。代入式,求得系数b1得值 l.x2x1 求系数b0 将系数b1值代入式,有 y1b0 + b1x1 y2b0 + b1x2 一共n个yk,每个yk都可以求出一个b0,n个b0取平均,即为所求系数b0得值: b1dlyb01.nnykk=1nb1xkb01.nyk1b1.nnxkk=1k=1byb1.x 0 2 若y b0 + b1x + b 2x,求系数时,则须将第一次逐差得到的lyk再分成上、下两组,进行第二次逐差,从而求得系数b
18、 2,然后依次求出b1 和b0。 由此类推,也可以进行多次逐差求高次项的系数,但实际上很少使用。 3系数b1和 b0的标准偏差 b1的标准偏差 根据式,b1由ly而来,故通常用于求多次测量平均值标准偏差的公式 SxS(x)n 求出ly的标准偏差s,再用不确定度传播公式yf求得系数b1的标准偏差s。 b0的标准偏差 由式可见,b0的标准偏差由y 和b1的标准偏差合成 dyui(y)uxidxi得到。如前所述,计算过程中x的测量不确定度忽略不计。 五、 应用举例 例5 仍以伏安法测电阻为例,用逐差法求电阻R。 Ib0 b1U ,R=1/ b1; 共6项,n6,ln/23,故隔3项逐差,3I k =
19、I k3Ik。 表3 用逐差法处理数据 序号k I/10A Ik3/ 10A 3I k/10A 1 2 3 0 385 815 1205 1580 1990 1205 1195 1175 平均d3l11.917b1dlU21b13IU1=11.9176=1.986求系数b1: R503.5W=0.5035kW 求被测量R: 32dsdI3k=13kId1)3I求b的标准偏差sb1s.dlU23l(lI=0.08820.08823.20.0147求R的标准偏差 s(R)RU1=sb1b1=0.01471.9860.00740 s(R)=503.5*0.740%=3.7 六、 逐差法中常见错误 1
20、 求系数时使用了逐项逐差 上例中,若用逐项逐差求电流变化的平均值,则算式为I2I1I3I25.I6I5I65I1显然,中间各测量值都被抵消掉了,只用了第一次和最后一次测量值,失去了多次测量取平均值的意义。 2 奇数项失,上组少分一项 假设上例中共测了9次,n9,应分为上组5项,下组4项,隔5项逐差后得到4项,若按上组少分一项分组,则是隔4项逐差,似乎最后可多得到一项为I9I5。但仔细考察可见,该项和第一项I5I1的I5抵消掉了,仍旧是没有利用I5。所以,凡n为奇数时,应上组多一项,作隔In1/项逐差。 3 列表表达不清楚 表中应表达出是隔几项逐差,反映出l、yk、yk1、lyk之间的对应关系。
21、 4 最小二乘法和一元线性回归 从测量数据中寻求经验方程或提取参数,称为回归问题,是实验数据处理的重要内容。用作图法获得直线的斜率和截距就是回归问题的一种处理方法,但连线带有相当大的主观成分,结果会因人而异;用逐差法求多项式的系数也是一种回归方法,但它又受到自变量必须等间距变化的限制。本节介绍处理回归问题的又一种方法最小二乘法。 一、 拟合直线的途径 1 问题的提出 假定变量x和y之间存在着线性相关的关系,回归方程为一条直线 y b0 + b1x 由实验测得的一组数据是xk、yk,我们的任务是根据这组数据拟合出式的直线,即确定其系数b0 、b1。 我们讨论最简单的情况,假设 系统误差已经修正;
22、 n次测量的条件相同,所以其误差符合正态分布,这样才可以使用最小二乘法原理; 只有yk存在误差,即把误差较小的最为变量x,使不确定度的计算变得简单。 2 解决问题的途径最小二乘法原理 由于测量的分散性,实验点不可能都落在一条直线上,如图3。相对于我们所拟合的直线,某个测量值yk在y方向上偏离了vk,vk就是残差 vkyky y 联想到贝塞尔公式 1.n1nxkk=1nS(x)21nnxkk=12 如果k=1的值小,那么标准偏差s就小,能够使s最小的直线就是我们所要拟 合的直线。这就是最小二乘原理。 最小二乘原理:最佳值乃是能够使各次测量值残差的平方和为最小值的那个值。 由式可见,b0和b1决定
23、vk的大小,能够使k=1系数。 二回归方程的系数 1用最小二乘原理求回归方程的系数 nvk2V2kVn2k为最小值的b0、b1值就是回归方程的nykb0b1xk2k=1 k=1 使v k为最小值,极小值条件是一级导数等于零和二级导数大于零。这里xk、yk是测量值,变量b0和b1,式分别对b0和b1求偏导数 dnnvk2.k=1n (11) db02k=1nykb0b1xk.xk=0d.k=1db0vk22k=1ykb0b1xk.xk=0整理后得 (12) 其中x1nn.k=1xkyxb12xb1b0yxb0xy1nn.k=1xk21.nnykk=1x2xy1nn.k=1xkyk,,x.y2,
24、解联立方程,得到 b1xyxb1x2xb0yn式对b0和b1 再求一次导数,得到 2 的二阶导数大于零。这样和 vkk=1n2式给出的b0和b1对应于 vk的极小值,即为回归直线的斜率和截距的最佳 k=1估计值,于是就求得了回归方程。 2为了便于记忆和用计算器或计算机编程计算,引入符号 nLxyxkn=1nxyk2yLxxxkx (15) Lyyk=1nykk=1y2 很容易证明 于是 b1LxyLxx3测量点的重心 (17) 由式,得到 0 ,y 点。点 称为的 y bb1x ,可见回归直线通过 xx ,y重心。理解这点,有助于用作图法处理数据时的连线。 三、回归方程系数的标准偏差 1 yk
25、的标准偏差 由式,我们很容易求得yk的标准偏差 (18) 式中分母n2是自由度,可以作如下解释:两点决定一条直线,只需测量两个点,即可解出直线的斜率和截距,现在多测了n2个点,所以n2是自由度。 s(y)是因变量yk的标准偏差,在满足本节开始的三个假设的条件下,我们可以对照测量列的标准偏差的意义来理解s(y):对于自变量的某一个取值,因变量是直线上相应的一个点,在重复条件下作任意次测量,实测点落在与直线上相应的距离在s(y)范围以内的概率是68。3。s(y)描述了测量点对于直线的分散性。 2 回归方程系数的标准偏差 b1的标准偏差s 我们的任务是从s(y)求出b0和b1的标准偏差,所以首先要找
26、到b1和yk之间的关系。由 nvkk=1n0b1LxyLxxxkxykyn=k=1nxkk=1x2xknx2=k=1ykxxkk=1按照不确定度的传播与合成的方法,可求b1的标准偏差。注意到式,b1由多项带有系数的yk求和得到,所以,s具有方和根的形式,方差s为 ns2b1k=1db1dyk2.s2(y)将式代入上式,整理后开方得到 sb1s(y)Lxxb0的标准偏差s sb0x.sb1同理可推导出 3讨论 s是截距b0的标准偏差。如果得到s0,则b10,回归直线的斜率为正,称为正相关:r0,则b10.917,表明I与U显著相关,即回归直线的直线性很好。 2求系数 3求系数的标准偏差 sb10
27、.01694求电阻及其标准偏差 5说明:在相关性很好的情况下,r接近于1,则式中分子(1/r)1为零,以致不能计算出s和s。所以表5中的各项计算求和、平方、平均等要保留到比r值所含的“9”的个数还要多23位数字。例6中r0.999 856,小数点连续有3个“9”,故求回归方程系数的运算取56位数字。中间运算过程亦如此,直到计算出合成不确定度或扩展不确定度之后,再把不确定度取为2位有效数字,以及把测量结果修约到与不确定度的末位对齐。 参考资料 附录1. 美国斯坦福仪器厂生产的数字锁定放大器使用说明书。 附录2、3. 浙江大学科教仪器厂制作的“激光实验仪使用说明光盘”。 附录4. 傅思镜编 赖天树校,光电专门实验,中山大学教材科,1995 附录5. 金重、刘金环 等编著,大学物理实验教程,南开大学出版社,2000, P30-44,