回归分析与协方差分析ppt课件.ppt

上传人:小飞机 文档编号:1916887 上传时间:2022-12-25 格式:PPT 页数:50 大小:1,000KB
返回 下载 相关 举报
回归分析与协方差分析ppt课件.ppt_第1页
第1页 / 共50页
回归分析与协方差分析ppt课件.ppt_第2页
第2页 / 共50页
回归分析与协方差分析ppt课件.ppt_第3页
第3页 / 共50页
回归分析与协方差分析ppt课件.ppt_第4页
第4页 / 共50页
回归分析与协方差分析ppt课件.ppt_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《回归分析与协方差分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《回归分析与协方差分析ppt课件.ppt(50页珍藏版)》请在三一办公上搜索。

1、9,回归分析与协方差分析,内容,9.1 一元线性回归,学习目标,散点图, 回归系数, 正规方程, 经验回归方程;回归平方和,剩余平方和,相关系数, 显著性检验.,不确定关系,人的身高,体重,农作物的单位面积产量,施肥量,9.1 一元线性回归,1. 一元线性回归的基本概念,线性模型,例 为了研究弹簧悬挂不同重量(单位:克力)x时长度(单位:厘米)y的关系。通过试验得到一组数据。,重量xi 5 10 15 20 25 30 长度yj 7.25 8.12 8.95 9.90 10.90 11.80,把这些数据点(xi, yj )画在xoy坐标系中,图形称为散点图。,*,*,*,*,*,*,L,散点图

2、,记L为,进行n次独立试验,测得数据如下:,我们的问题是,如何根据这些观测值用“最佳的”形式来表达变量Y与X之间的相关关系?,一般而言,在变量x取值以后,若Y所取的值服从N (+x,2)分布,当、及2未知时,根据样本(x1,Y1),(x2,Y2),(xn,Yn)的观测值(x1,y1),(x2,y2),(xn,yn) 对未知参数、及2所作的估计与检验称为一元线性回归分析,而称为截距,称为回归系数, E(Y)+x 称为回归方程。,由回归方程可以推出,根据样本及其观测值可以得到、及2的估计量及估计值,得到回归方程的估计式或经验回归方程,最常用的是最小二乘法,即求出,的值最小,所求出的a称为经验截距,

3、简称为截距,b称为经验回归系数,简称为回归系数,而,2. 总体中未知参数的估计,根据最小二乘法的要求由,得到一元线性回归的正规方程组,并求出,建立一元线性回归方程的具体步骤:,(3)计算b和a,写出一元线性回归方程。,与上述a和b相对应的Q的数值又记作SSE,称为剩余平方和。,将a、b和SSE以及 和 看作是统计量,它们的表达式分别为,这些统计量之间以及它们与总体参数之间有以下的内在联系:,为提高a的估计精度,最理想的选择是使 0,其绝对值越小越好;,为提高b的估计精度,应该使lxx 取较大的数值,x1、x2、xn越分散越好; 观测值的个数n不能太小。,3. 线性回归方程的显著性检验,因此,必

4、须对回归方程的拟合情况或效果作显著性检验。,其理论基础就是总平方和的分解,即,表示n个y1、y2、yn与之间的差异,当各个yi已知时,它是一个定值,称为总平方和,记作SST。,通过回归已经达到了最小值,称为剩余平方和,记作SSE。,称为回归平方和,记作SSR。,因此,SSTSSE+SSR。,如果SSR的数值较大,SSE的数值便比较小,说明回归的效果好;如果SSR的数值较小,SSE的数值便比较大,说明回归的效果差。,如果|r|较大,SSE的数值便比较小,说明回归的效果好或者说x与Y的线性关系密切;如果|r|较小,SSE的数值便比较大,说明回归的效果差或者说x与Y的线性关系不密切;因此称r为x与Y

5、的观测值的相关系数。 又由r及回归系数的计算公式,可以推出:r0时b0,x增加时Y的观测值呈增加的趋势;r0时称x与Y正相关,r0时称x与Y负相关。,综上所述,如果设H0为0,也就是假设x与Y不是线性关系,则可以用以下三种实质相同的方法检验线性回归方程的显著性,且当检验的结果显著时x与Y的线性关系显著,回归方程可供应用;当检验的结果不显著时x与Y的线性关系不显著,回归方程不可应用。, F检验法:,当H0为真时,,且SSR与SSE相互独立;因此,当H0为真时,,当FF1-(1,n-2)时应该放弃原假设H0。,(2)t检验法:,当H0为真时,,当|t|t1-0.5(n-2)时应该放弃原假设H0。,

6、(3)r检验法:,根据x与Y的观测值的相关系数,可以推出,当H0为真时,,当FF1-(1,n-2)或|r|r(n-2)时应该放弃原假设H0,式中的,可由r检验用表中查出。,因此,r常常用来表示x与Y的线性关系在x与Y的全部关系中所占的百分比,又称为x与Y的观测值的决定系数。,4. 利用回归方程进行点预测和区间预测,若线性回归作显著性检验的结果是放弃H0,也就是放弃回归系数0的假设,便可以利用回归方程进行点预测和区间预测,这是人们关注线性回归的主要原因之一。, 当xx0时,,Y0的观测值y0的点预测是无偏的。, 当xx0时,用适合不等式PY0(G,H)1-的统计量G和H所确定的随机区间(G,H)

7、预测Y0的取值范围称为区间预测,而(G,H)称为Y0的1-预测区间。,若Y0与样本中的各Yi相互独立,则根据ZY0-(a+bx0)服从正态分布,E(Z)0,,Z与SSE相互独立,,可以导出,因此,Y0的1-预测区间为 a+bx0(x0),,例1.1吸附方程某种物质在不同温度下可以吸附另一种物质,如果温度x(单位:)与吸附重量Y(单位:mg)的观测值如下表所示:,温度x1.5 1.8 2.4 3.0 3.5 3.9 4.4 4.8 5.0,重量y4.8 5.7 7.0 8.3 10.9 12.4 13.1 13.6 15.3,试求线性回归方程并用三种方法作显著性检验,若x02,求Y0的0.95预

8、测区间。,解:根据上述观测值得到n9,,所求的线性回归方程为,显著性检验方法 F检验法:SSTlyy114.516, SSRblxy112.485,SSESST-blxy2.031,n-27,F0.99(1,7)12.2,,所以回归方程极显著;, t检验法:,所以回归方程极显著;,(3) r检验法:,所以回归方程极显著.,Y0的0.95预测区间为(4.09,8.15)。 这说明当温度为2时,应该预测吸附另一种物质的重量在4.09至8.15之间,并且预测100次将有95次是正确的。,例1.2植物保护一些夏季害虫的盛发期与春季温度有关,现有1956-1964年间3月下旬至4月中旬旬平均温度的累计数

9、x和一代三化螟蛾盛发期Y(以5月10日为0)的观测值如下:,温度x 35.5 34.1 31.7 40.3 36.8 40.2 31.7 39.2 44.2,盛发期y 12 16 9 2 7 3 13 9 -1,试求线性回归方程并用三种方法作显著性检验,若x040,求Y0的0.95预测区间。,解:根据上述观测值得到n9,,所求的线性回归方程为,显著性检验方法 F检验法:SSTlyy249.5556,SSRblxy174.8886,SSESST-blxy74.6670,n-27,F0.99(1,7)12.2,,所以回归方程极显著;, t检验法:,所以回归方程极显著;,(3) r检验法:,所以回归方程极显著.,Y0的0.95预测区间为(-3.80,12.92)。,这说明当3月下旬至4月中旬旬平均温度的累计数为40时,应该预测一代三化螟蛾盛发期为5月6日至5月23日之间,并且预测100次将有95次是正确的。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号