最小二乘拟合直线.docx

上传人:小飞机 文档编号:3578819 上传时间:2023-03-14 格式:DOCX 页数:14 大小:40.17KB
返回 下载 相关 举报
最小二乘拟合直线.docx_第1页
第1页 / 共14页
最小二乘拟合直线.docx_第2页
第2页 / 共14页
最小二乘拟合直线.docx_第3页
第3页 / 共14页
最小二乘拟合直线.docx_第4页
第4页 / 共14页
最小二乘拟合直线.docx_第5页
第5页 / 共14页
亲,该文档总共14页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《最小二乘拟合直线.docx》由会员分享,可在线阅读,更多相关《最小二乘拟合直线.docx(14页珍藏版)》请在三一办公上搜索。

1、最小二乘拟合直线最小二乘拟合 在物理实验中经常要观测两个有函数关系的物理量。根据两个量的许多组观测数据来确定它们的函数曲线,这就是实验数据处理中的曲线拟合问题。这类问题通常有两种情况:一种是两个观测量x与y之间的函数形式已知,但一些参数未知,需要确定未知参数的最佳估计值;另一种是x与y之间的函数形式还不知道,需要找出它们之间的经验公式。后一种情况常假设x与y之间的关系是一个待定的多项式,多项式系数就是待定的未知参数,从而可采用类似于前一种情况的处理方法。 一、最小二乘法原理 在两个观测量中,往往总有一个量精度比另一个高得多,为简单起见把精度较高的观测量看作没有误差,并把这个观测量选作x,而把所

2、有的误差只认为是y的误差。设x和y的函数关系由理论公式 yf 给出,其中c1,c2,cm是m个要通过实验确定的参数。对于每组观测数据i1,2,N。都对应于xy平面上一个点。若不存在测量误差,则这些数据点都准确落在理论曲线上。只要选取m组测量值代入式,便得到方程组 yif 式中i1,2,m.求m个方程的联立解即得m个参数的数值。显然Nm的情况下,式成为矛盾方程组,不能直接用解方程的方法求得m个参数值,只能用曲线拟合的方法来处理。设测量中不存在着系统误差,或者说已经修正,则y的观测值yi围绕着期望值 摆动,其分布为正态分布,则yi的概率密度为 2()y-fx;c,c,.,c1ii12mp(yi)=

3、exp-22s2psii, 式中i是分布的标准误差。为简便起见,下面用C代表。考虑各次测量是相互独立的,故观测值的似然函数 sL=(21Nyi-f(x;C)exp-N22si=1i2ps1s2.sN. )1取似然函数L最大来估计参数C,应使 2()y-fx;C=mins2iii=1iN1取最小值:对于y的分布不限于正态分布来说,式称为最小二乘法准则。若2w=1/sii为正态分布的情况,则最大似然法与最小二乘法是一致的。因权重因子,故式表明,用最小二乘法来估计参数,要求各测量值yi的偏差的加权平方和为最小。 根据式的要求,应有 ck从而得到方程组 Nsyi=12iN1i-f(xi;C)2c=c=

4、0(k=1,2,.,m)f(x;C)()(k=1,2,.,m)y-fx;C=0s2iic=cC1i=1ik解方程组,即得m个参数的估计值1,c2,.,cmc,从而得到拟合的曲线方程21,c2,.,cm)f(x;c。 然而,对拟合的结果还应给予合理的评价。若yi服从正态分布,可引入拟合的x量, 把参数估计x=2i=1N1si2()y-fx;Cii2=(c1,c2,.,cm)c2代入上式并比较式,便得到最小的x值 x2min=i=1N1si2()y-fx;cii2222xm可以证明,in服从自由度vN-m的x分布,由此可对拟合结果作x检验。 22xxminm由x分布得知,随机变量的期望值为N-m。

5、如果由式计算出in接近N-m222x-N-m2,则认为xN-mmin,则认为拟合结果是可接受的;如果拟合结果与观测值有显著的矛盾。 二、直线的最小二乘拟合 曲线拟合中最基本和最常用的是直线拟合。设x和y之间的函数关系由直线方程 ya0+a1x (0-0-7) 给出。式中有两个待定参数,a0代表截距,a1代表斜率。对于等精度测量所得到的N组数据,i1,2,N,xi值被认为是准确的,所有的误差只联系着yi。下面利用最小二乘法把观测数据拟合为直线。 1直线参数的估计 前面指出,用最小二乘法估计参数时,要求观测值yi的偏差的加权平方和为最小。对于等精度观测值的直线拟合来说,由式可使 i=1 最小即对参

6、数a最佳估计,要求观测值yi的偏差的平方和为最小。 根据式的要求,应有 y-(aiN0+a1xi)2a=aa0a1y-(aii=1NN0+a1xi)+a1xi)2a=a0-a1xi)=0,=-2(yi-ai=1NNy-(aii=12a=a00-a1xi)=0.=-2(yi-ai=1整理后得到正规方程组 0N+a1xi=yi,a2ax+ax=xiyi.0i1i 解正规方程组便可求得直线参数a0和a1的最佳估计值0aa和1。即 ii20a(x)(y)-(x)(xy)=N(x)-(x) N(xy)-(x)(y)=aN(x)-(x) 2iii2iiiiii12i2i2拟合结果的偏差 1是根据有误差的观

7、测数据点计算出来的,它们不可避免由于直线参数的估计值0和a地存在着偏差。同时,各个观测数据点不是都准确地落地拟合线上面的,观测值yi与对应于拟合直线上的aiy这之间也就有偏差。 首先讨论测量值yi的标准差S。考虑式,因等精度测量值yi所有的可用yi的标准偏差S来估计,故该式在等精度测量值的直线拟合中应表示为 si都相同,x2min1=2SNy-(aii=1N01x).+a222xm已知测量值服从正态分布时,in服从自由度vN-2的x分布,其期望值 x2min1=2Sy-(aii=101xi)+a2=N-2.2由此可得yi的标准偏差 S=这个表示式不难理解,它与贝塞尔公式是一致的,只不过这里计算

8、S时受到两参数1N0+a1xi).yi-(aN-2i=10a和1估计式的约束,故自由度变为N-2罢了。 a式所表示的S值又称为拟合直线的标准偏差,它是检验拟合结果是否有效的重要标志。如果xy平面上作两条与拟合直线平行的直线 0+a1x-S,y=a0+a1x+S,y=a 如图0-0-1所示,则全部观测数据点的分布,约有68.3%的点落在这两条直线之间的范围内。图0-0-1 拟合直线两侧数据点的分布 下面讨论拟合参数偏差,由式和可见,直线拟合的两个参数估计1是yi的函数。因为假定xI是精确的,所有测量误差只有yi有关,故两个估计参数值0和a的标准偏差可利用不确定度传递公式求得,即 aSa00a=y

9、S;Sa1=i=1iN21ai=1yiNS. 2把式与分别代入上两式,便可计算得 Sa0=SSa1=SN(x)-(x)2ii2xi2;NN(x)-(xi)2i2.三、相关系数及其显著性检验 当我们把观测数据点作直线拟合时,还不大了解x与y之间线性关系的密切程度。为此要用相关系数来判断。其定义已由式给出,现改写为另一种形式,并改用r表示相关系数,得 r=(xii-x)(yi-y)1/222()()x-xx-yiiii式中x和y分别为x和y的算术平均值。r值范围介于-1与+1之间,即-1r1。当r0时直线的斜率为正,称正相关;当r0时直线的斜率为负,称负相关。当|r|1时全部数据点都落在拟合直线上。若r0则x与y之间完全不相关。r值愈接近1则它们之间的线性关系愈密切。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号