《ass课件教程第五章相关分析和回归分析.ppt》由会员分享,可在线阅读,更多相关《ass课件教程第五章相关分析和回归分析.ppt(48页珍藏版)》请在三一办公上搜索。
1、第五章 回归分析与相关分析,第一节 回归和相关的概念,回归分析内容,相关分析,5.1 下表为青海一月平均气温与海拔高度及纬度的数据,试分析一月平均气温与海拔高度,一月平均气温与纬度是否存在线性关系(计算一月气温分别与海拔高度和纬度的简单相关系数)。,从上表可知,一月气温与海拔高度和纬度的相关系数分别为-0.728和-0.186,说明一月气温与海拔高度和纬度均呈负相关关系;进一步对照其所对应的显著性分别为0.0070.05,表明一月气温与海拔高度的相关性显著,而一月气温与纬度的相关性不显著。,5.1 下表为青海一月平均气温与海拔高度及纬度的数据,试分析一月平均气温与海拔高度和纬度的偏相关系数(因
2、为第三个变量纬度(海拔)的存在所起的作用,可能会影响纬度(海拔)与一月平均温度之间的真实关系)。,将-0.728与-0.941对照;同时再与前面讲的例子对照看有什么不同,从表中可知-0.728是一月温度和海拔高度的简单相关系数;而-0.941是一月气温与海拔高度的偏相关系数,将-0.186与-0.875对照;同时再与前面讲的例子对照看有什么不同,5.2 一条河流流经某地区,其降水量X(mm)和径流量Y(mm)多年观测数据如表所示。试建立Y与X的线性回归方程,并根据降水量预测径流量。,回归分析(一元线性回归),从表中可知FF0.01(p0.01),说明方程通过了显著性检验,说明径流量与降水量之间
3、存在着极显著的直线回归关系,方程检验表,从表中可知tt0.01(p0.01),说明方程中的回归系数通过了显著性检验,说明径流量与降水量之间有真实的直线回归关系。,系数检验表,5.3 随机抽测某渔场16次放养记录,结果如表(投饵量,放养量,鱼产量)。试求鱼产量对投饵量、放养量的多元回归方程。(要求进行方程和系数的显著性检验),回归分析(多元线性回归),方程检验表,从表中可知FF0.01(p0.01),说明方程通过了显著性检验,说明鱼产量依投饵量、放养量的二元线性回归达到显著水平,系数检验表,从表中可知X1和X2对应的t均大于t0.01(p0.01),说明投饵量和放养量对鱼产量的偏回归系数达极显著
4、水平,偏回归系数通过显著性检验,即鱼产量与投饵量、放养量之间存在真实的多元线性关系。因此,所建方程为Y=-4.349+0.584X1+2.964X2,7.3 一个地区的地理要素Y的变化可能受到地理因素X1,X2,X3,X4,X5,X6的综合影响,请根据样本观测数据,分析Y与X之间是否存在线性关系,并建立其逐步回归方程(最优回归方程)。,逐步回归分析(最优回归),方程检验表,从表中可知,方程最多引入变量X6、X2、X5时其对应的F值大于F0.01(p0.01),说明方程通过了显著性检验,说明地理要素Y依地理因素X6、X2、X5的逐步线性回归达到显著水平,系数检验表,从表中可知引入自变量变量X6、
5、X2、X5对应的t均大于t0.01(p0.01),说明地理因素Y对地理要素X6、X2、X5的偏回归系数达极显著水平即通过显著性检验;而其它的X1、X3、X4的偏回归系数没有通过显著性检验,所以被剔除。则所见最优(逐步)回归方程为6-0.362X2-0.419X5,7.5 下表给出山脉南侧一组测站年降水量随海拔高度变化的观测值,试建立年降水量依海拔高度的非线性回归方程(一元非线性回归问题)。,一元非线性回归分析,线性:Y=b0b1X二次曲线:Y=b0+b1X2复合曲线:Y=b0b1X或lnY=lnb0+Xlnb1增长:Y=exp(b0+b1X)拟合对数:Y=b0+b1lnX三次(立方)模型:Y=
6、b0+b1X+b2X2+b3X3S:Y=exp(b0+b1X)拟合指数方程:Y=b0+eb1X倒数(逆模型):Y=b0+b1/X拟合乘幂曲线:Y=b0Xb1Logisti:Y=I/(1/u)+b0b1X),11种曲线形式,曲线回归,MODEL:MOD_3.Independent:年降水量 Dependent Mth Rsq d.f.F Sigf b0 b1 b2 b3 海拔高度 LIN.462 10 8.60.015-780.60 2.0951 海拔高度 LOG.484 10 9.39.012-10241 1672.91 海拔高度 INV.477 10 9.13.013 2504.03-1.E
7、+06 海拔高度 QUA.506 9 4.60.042-2676.6 6.9415-.0029 海拔高度 CUB.559 8 3.39.074 5011.03-23.623.0356-2.E-05 海拔高度 COM.665 10 19.85.001 63.4154 1.0030 海拔高度 POW.710 10 24.54.001 6.7E-05 2.4296 海拔高度 S.719 10 25.64.000 8.9234-1781.4 海拔高度 GRO.665 10 19.85.001 4.1497.0030 海拔高度 EXP.665 10 19.85.001 63.4154.0030,检验结果
8、和系数,曲线形式,多元非线性回归,7.6 某变量受其它两个变量的影响,其中X、Y这两个变量对y影响的函数表达式为Z=a+bX+cX2+dY+eY2+fXY,根据下面的数据计算这个关系式(不可直线化的多元非线性回归,已知曲线的形式)注:多元多项式回归也用此方法,Nonlinear Regression Summary Statistics Dependent Variable Z Source DF Sum of Squares Mean Square Regression 6 57582.84980 9597.14163 Residual 23 7.46820.32470 Uncorrecte
9、d Total 29 57590.31800(Corrected Total)28 731.25559 R squared=1-Residual SS/Corrected SS=.98979 Asymptotic 95%Asymptotic Confidence Interval Parameter Estimate Std.Error Lower Upper a-106.3101780 34.167696857-176.9914441-35.62891183 b 171.99713390 325.14423560-500.6149636 844.60923136 c 289.56749562 756.29038887-1274.938373 1854.0733642 d 409.25962991 408.66543346-436.1292291 1254.6484890 e 721.82981869 1179.6036046-1718.366155 3162.0257927 f-1378.903174 1889.5079318-5287.648137 2529.8417894,