Excel回归分析结果的详细阐释.docx

上传人:小飞机 文档编号:3156828 上传时间:2023-03-11 格式:DOCX 页数:11 大小:40.27KB
返回 下载 相关 举报
Excel回归分析结果的详细阐释.docx_第1页
第1页 / 共11页
Excel回归分析结果的详细阐释.docx_第2页
第2页 / 共11页
Excel回归分析结果的详细阐释.docx_第3页
第3页 / 共11页
Excel回归分析结果的详细阐释.docx_第4页
第4页 / 共11页
Excel回归分析结果的详细阐释.docx_第5页
第5页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《Excel回归分析结果的详细阐释.docx》由会员分享,可在线阅读,更多相关《Excel回归分析结果的详细阐释.docx(11页珍藏版)》请在三一办公上搜索。

1、Excel回归分析结果的详细阐释Excel回归分析结果的详细阐释 利用Excel的数据分析进行回归,可以得到一系列的统计参量。下面以连续XX年积雪深度和灌溉面积序列为例给予详细的说明。 图1 连续XX年的最大积雪深度与灌溉面积 回归结果摘要如下: 图2 利用数据分析工具得到的回归结果 第一部分:回归统计表 这一部分给出了相关系数、测定系数、校正测定系数、标准误差和样本数目如下: 表1 回归统计表 1 逐行说明如下: Multiple对应的数据是相关系数(correlation coefficient),即R=0.989416。 R Square对应的数值为测定系数(determination

2、coefficient),或称拟合优度(goodness of fit),它是相关系数的平方,即有R2=0.9894162=0.978944。 Adjusted对应的是校正测定系数(adjusted determination coefficient),计算公式为 (n-1)(1-R2)Ra=1- n-m-1式中n为样本数,m为变量数,R2为测定系数。对于本例,n=10,m=1,R2=0.978944,代入上式得 Ra=1-(10-1)(1-0.978944)=0.976312 10-1-11SSe n-m-1标准误差对应的即所谓标准误差,计算公式为 s=这里SSe为剩余平方和,可以从下面的方

3、差分析表中读出,即有SSe=16.10676,代入上式可得 s=1*16.10676=1.418924 10-1-1最后一行的观测值对应的是样本数目,即有n=10。 第二部分,方差分析表 方差分析部分包括自由度、误差平方和、均方差、F值、P值等。 表2 方差分析表 逐列、分行说明如下: 第一列df对应的是自由度,第一行是回归自由度dfr,等于变量数目,即dfr=m;第二行为残差自由度dfe,等于样本数目减去变量数目再减1,即有dfe=n-m-1;第三行为总自由度dft,等于样本数目减1,即有dft=n-1。对于本例,m=1,n=10,因此,dfr=1,dfe=n-m-1=8,dft=n-1=9

4、。 第二列SS对应的是误差平方和,或称变差。第一行为回归平方和或称回归变差SSr,即有 i-yi)2=748.8542 SSr=(yi=1n它表征的是因变量的预测值对其平均值的总偏差。 第二行为剩余平方和或称剩余变差SSe,即有 i)2=16.10676 SSe=(yi-yi=1n 2 它表征的是因变量对其预测值的总偏差,这个数值越大,意味着拟合的效果越差。上述的y的标准误差即由SSe给出。 第三行为总平方和或n称总变差SSt,即有 SSr=(yi-yi)2=764.961 i=1它表示的是因变量对其平均值的总偏差。容易验证748.8542+16.10676=764.961,即有 SSr+SS

5、e=SSt 而测定系数就是回归平方和在总平方和中所占的比重,即有 R2=SSr748.8542=0.978944 SSt764.961显然这个数值越大,拟合的效果也就越好。 第四列MS对应的是均方差,它是误差平方和除以相应的自由度得到的商。第一行为回归均方差MSr,即有 MSr=第二行为剩余均方差MSe,即有 SSr748.8542=748.8542 dfr1MSe=SSe16.10676=2.013345 dfe8显然这个数值越小,拟合的效果也就越好。 第四列对应的是F值,用于线性关系的判定。对于一元线性回归,F值的计算公式为 F=R21(1-R2)n-m-1dfeR2= 21-R式中R2=

6、0.978944,dfe=10-1-1=8,因此 F=8*0.978944=371.9453 1-0.978944第五列Significance F对应的是在显著性水平下的F临界值,其实等于P值,即弃真概率。所谓“弃真概率”即模型为假的概率,显然1-P便是模型为真的概率。可见,P值越小越好。对于本例,P=0.00000005420.0001,故置信度达到99.99%以上。 第三部分,回归参数表 回归参数表包括回归模型的截距、斜率及其有关的检验参数。 表3 回归参数表 第一列Coefficients对应的模型的回归系数,包括截距a=2.356437929和斜率b=1.812921065,由此可以

7、建立回归模型 i=2.3564+1.8129xi y或 3 yi=2.3564+1.8129xi+ei a或sb表示)第二列为回归系数的标准误差。 不常使用标准误差的原因在于:其统计信息已经包含在后述的t检验中。 第三列t Stat对应的是统计量t值,用于对模型参数的检验,需要查表才能决定。t值是回归系数与其标准误差的比值,即有 ta=根据表3中的数据容易算出: ab,tb= bassta=1.8129212.356438=19.28588 =1.289167,tb=0.0940021.827876对于一元线性回归,t值可用相关系数或测定系数计算,公式如下 t=R1-Rn-m-12将R=0.9

8、89416、n=10、m=1代入上式得到 t=0.9894161-0.98941610-1-12=19.28588 对于一元线性回归,F值与t值都与相关系数R等价,因此,相关系数检验就已包含了这部分信息。但是,对于多元线性回归,t检验就不可缺省了。 第四列P value对应的是参数的P值。当P0.05时,可以认为模型在=0.05的水平上显著,或者置信度达到95%;当P0.01时,可以认为模型在=0.01的水平上显著,或者置信度达到99%;当P0.001时,可以认为模型在=0.001的水平上显著,或者置信度达到99.9%。对于本例,P=0.00000005420.0001,故可认为在=0.000

9、1的水平上显著,或者置信度达到99.99%。P值检验与t值检验是等价的,但P值不用查表,显然要方便得多。 最后几列给出的回归系数以95%为置信区间的上限和下限。可以看出,在=0.05的显著水平上,截距的变化上限和下限为-1.85865和6.57153,即有 -1.85865a6.57153 斜率的变化极限则为1.59615和2.02969,即有 1.59615b2.02969 第四部分,残差输出结果 这一部分为选择输出内容,如果在“回归”分析选项框中没有选中有关内容,则输出结果不会给出这部分结果。 i表示)残差输出中包括观测值序号,因变量的预测值以及标准残差。 表4 残差输出结果 4 预测值是

10、用回归模型 i=2.3564+1.8129xi y计算的结果,式中xi即原始数据的中的自变量。从图1可见,x1=15.2,代入上式,得 1=2.3564+1.8129x1=2.3564+1.8129*15.2=29.91284 y其余依此类推。 残差ei的计算公式为 i ei=yi-y从图1可见,y1=28.6,代入上式,得到 1=28.6-29.91284=-1.31284 e1=y1-y其余依此类推。 标准残差即残差的数据标准化结果,借助均值命令average和标准差命令stdev容易验证,残差的算术平均值为0,标准差为1.337774。利用求平均值命令standardize(残差的单元格

11、范围,均值,标准差)立即算出表4中的结果。当然,也可以利用数据标准化公式 zi*=zi-zvar(zi)=zi-zsi逐一计算。将残差平方再求和,便得到残差平方和即剩余平方和,即有 i)2=16.10676 SSe=e=(yi-y2ii=1i=1nn利用Excel的求平方和命令sumsq容易验证上述结果。 以最大积雪深度xi为自变量,以残差ei为因变量,作散点图,可得残差图。残差点列的分布越是没有趋势,回归的结果就越是可靠。 i为因变量,作散点图,可得线性拟合图用最大积雪深度xi为自变量,用灌溉面积yi及其预测值y。 5 最大积雪深度x(米) Residual Plot3210-1-2-3最大

12、积雪深度x(米)图3 残差图 051015202530最大积雪深度x(米) Line Fit Plot605040302010001020最大积雪深度x(米)30图4 线性拟合图 灌溉面积y(千亩)预测 灌溉面积y(千亩)第五部分,概率输出结果 在选项输出中,还有一个概率输出表。第一列是按等差数列设计的百分比排位,第二列则是原始数据因变量的自下而上排序选中图1中的第三列数据,用鼠标点击自下而上排序按钮,立即得到表5中的第二列数值。当然,也可以沿着主菜单的“数据(D)排序(S)”路径,打开数据排序选项框,进行数据排序。 用表5中的数据作散点图,可以得到Excel所谓的正态概率图。 表5 概率输出表 6 Normal Probability Plot60504030201000204060Sample Percentile图5 正态概率图 80100第一, 多元线性回归与一元线性回归结果相似,只是变量数目m1,F值和t值等统计量与R值也不再等价,因而不能直接从相关系数计算出来。 第二, 利用SPSS给出的结果与Excel也大同小异。当然,SPSS可以给出更多的统计量,如DW值。在表示方法上,SPSS也有一些不同,例如P Value用 Sig.表征,因为二者等价。只要能够读懂Excel的回归摘要,就可以读懂SPSS回归输出结果的大部分内容。 更多相关资料,请参考 7

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号