《3.1.1(线性回归思想.ppt》由会员分享,可在线阅读,更多相关《3.1.1(线性回归思想.ppt(26页珍藏版)》请在三一办公上搜索。
1、2023/9/15,郑平正 制作,3.1回归分析的基本思想及其初步应用(一),高二数学 选修2-3,2023/9/15,郑平正 制作,复习一 变量之间的关系 1 确定性的函数关系 2 不确定性的相关关系:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系,相关关系是一种非确定的关系,2023/9/15,郑平正 制作,.,年龄,脂肪,23,9.5,27,17.8,39,21.2,41,25.9,45,49,27.5,26.3,50,28.2,53,29.6,54,30.2,56,31.4,57,30.8,年龄,脂肪,58,33.5,60,35.2,61,34.6,如上
2、的一组数据,你能分析人体的脂肪含量与年龄 之间有怎样的关系吗?,二 线性回归分析的步骤:,2023/9/15,郑平正 制作,下面我们以年龄为横轴,脂肪含量为纵轴建立直角坐标系,作出各个点,称该图为散点图。,如图:,O,20,25,30,35,40,45,50,55,60,65,年龄,脂肪含量,5,10,15,20,25,30,35,40,1 画散点图,将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图像叫散点图,2023/9/15,郑平正 制作,从刚才的散点图发现:年龄越大,体内脂肪含量越高,点的位置散布在从左下角到右上角的区域。称它们成正相关。但有的两个变量
3、的相关,如下图所示:,如高原含氧量与海拔高度的相关关系,海平面以上,海拔高度越高,含氧量越少。作出散点图发现,它们散布在从左上角到右下角的区域内。又如汽车的载重和汽车每消耗1升汽油所行使的平均路程,称它们成负相关.,注:可考虑让学生思考书P77的思考.,O,(1)正相关,负相关,2023/9/15,郑平正 制作,我们再观察它的图像发现这些点大致分布在一条直线附 近,像这样,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相 关关系,这条直线叫做回归直线,该直线叫回归方程。,那么,我们该怎样来求出这个回归方程?请同学们展开讨论,能得出哪些具体的方案?,20,25,
4、30,35,40,45,50,55,60,65,年龄,脂肪含量,0,5,10,15,20,25,30,35,40,(2)线性相关,2023/9/15,郑平正 制作,我们上面给出的几种方案可靠性都不是很强,人们经过长期的实践与研究,已经找到了计算回归方程的斜率与截距的一般公式:,以上公式的推导较复杂,故不作推导,但它的原理较为简单:即各点到该直线的距离的平方和最小,这一方法叫最小二乘法。(参看如书P80),2 回归方程的求解,线性回归分析的步骤:,1、画散点图,4、用回归直线方程进行预报,3、求回归直线方程,2、求,最小二乘估计公式:,称为样本点的中心。,三 描述两个变量之间线性相关关系的强弱的
5、相关系数,r,课前检测:假设关于某设备的使用年限x和所支出的维修费用 y(万元),有如下的统计资料。,若由资料知,y对x呈线性相关关系。试求:(1)线性回归方程 的回归系数;()估计使用年限为10年时,维修费用是多少?,使用年限为10年时,维修费用是:12.38万元,2008年5月,中共中央国务院关于加强青少年体育、增强青少年体质的意见指出城市超重和肥胖青少年的比例明显增加.“身高标准体重”该指标对于学生形成正确的身体形态观具有非常直观的教育作用.“身高标准体重”从何而来?我们怎样去研究?,创设情境:,例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。,求根据女大学生的身高
6、预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。,问题呈现:女大学生的身高与体重,解;1.由于问题中要求根据身高预报体重,因此选取身高为自变量x,体重为因变量y,3.回归方程:,2.散点图;,4.本例中,r=0.7980.75这表明体重与身高有很强的线性相关关系,从而也表明我们建立的回归模型是有意义的。,探究:身高为172cm的女大学生的体重一定是60.316kg吗?如果不是,你能解析一下原因吗?,答:身高为172cm的女大学生的体重不一定是60.316kg,但一般可以认为她的体重接近于60.316kg。,例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示
7、。,女大学生的身高与体重,我们可以用下面的线性回归模型来表示:y=bx+a+e,(3)其中a和b为模型的未知参数,e称为随机误差。,在线性回归模型(4)中,随机误差e的方差 越小,通过回归直线(5)预报真实值y的精度越高。,随机误差是引起预报值 与真实值y之间的误差的原因之一,其大小取决于随机误差的方差。,另一方面,由于公式(1)和(2)中 和 为截距和斜率的估计值,它们与真实值a和b之间也存在误差,这种误差是引起预报值与真实值y之间误差的另一个原因。,假设 1:身高和随机误差的不同不会对体重产生任何影响,,怎样研究随机误差?,假设2:随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么
8、散点图中所有的点将完全落在回归直线上。,怎样研究随机误差?,例如,编号为6的女大学生,计算随机误差的效应(残差)为:,如何衡量预报的精度?,显然,R2的值越大,说明残差平方和越小,也就是说模型拟合效果越好。,如果某组数据可能采取几种不同回归方程进行回归分析,则可以通过比较R2的值来做出选择,即选取R2较大的模型作为这组数据的模型。,学以致用:,1、在对两个变量,进行线性回归分析时有下列步骤:对所求出的回归方程作出解释,收集数据(,)求线性回归方程,求相关系数,根据所搜集的数据绘制散点图如果根据可靠性要求能够作出变量,具有线性相关结论,则在下列操作顺序中正确的是(),学以致用:,2、对于相关指数,下列说法正确的是(),、的取植越小,模型拟合效果越好、的取值可以是任意大,且取值越大拟合效果越好、的取值越接近,模型拟合效果越好、以上答案都不对,学以致用:,3、甲、乙、丙,丁四位同学各自对,两变量的线性相关性做实验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:,则哪位同学的实验结果体现,两变量有更强的线性相关性甲乙丙丁,学以致用:,()则y对x的线性回归方程是()相应于各样本点的残差(i=1,2,3,4)分别是,,课堂总结:,1、线性回归分析的步骤2、回归模型的建立3、随机误差的研究,知识小节:,数学思想小结:,1、最小二乘法思想2、函数与方程的思想3、数形结合,