选修2 3.3.1回归分析的基本思想及其初步应用ppt课件.ppt

上传人:小飞机 文档编号:1445369 上传时间:2022-11-25 格式:PPT 页数:66 大小:3.15MB
返回 下载 相关 举报
选修2 3.3.1回归分析的基本思想及其初步应用ppt课件.ppt_第1页
第1页 / 共66页
选修2 3.3.1回归分析的基本思想及其初步应用ppt课件.ppt_第2页
第2页 / 共66页
选修2 3.3.1回归分析的基本思想及其初步应用ppt课件.ppt_第3页
第3页 / 共66页
选修2 3.3.1回归分析的基本思想及其初步应用ppt课件.ppt_第4页
第4页 / 共66页
选修2 3.3.1回归分析的基本思想及其初步应用ppt课件.ppt_第5页
第5页 / 共66页
点击查看更多>>
资源描述

《选修2 3.3.1回归分析的基本思想及其初步应用ppt课件.ppt》由会员分享,可在线阅读,更多相关《选修2 3.3.1回归分析的基本思想及其初步应用ppt课件.ppt(66页珍藏版)》请在三一办公上搜索。

1、3.1 回归分析的基本思想及其初步应用,高二数学 选修2-3 第三章 统计案例,2022/11/25,1,v:pzyandong,问题1:正方形的面积y与正方形的边长x之间的函数关系是,y = x2,问题2:某水田水稻产量y与施肥量x之间是否有一个确定性的关系?,变量之间的两种关系,2022/11/25,2,v:pzyandong,10 20 30 40 50,500450400350300,施化肥量,水稻产量,2022/11/25,3,v:pzyandong,自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.,定义:,(1)相关关系是一种不确定性关系;,(2)对具

2、有相关关系的两个变量进行统计分析的方法叫回归分析.,2022/11/25,4,v:pzyandong,现实生活中存在着大量的相关关系 如:人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入,等等.,探究1:水稻产量y与施肥量x之间大致有何规律?,2022/11/25,5,v:pzyandong,10 20 30 40 50,500450400350300,发现:图中各点,大致分布在某条直线附近.,探究2:在这些点附近可画不止一条直线,哪条直线最能代表x与y之间的关系呢?,散点图,施化肥量,水稻产量,2022/11/25,6,v:pzyandong,最小二乘估计下

3、的线性回归方程:,回归直线必过样本点的中心,2022/11/25,7,v:pzyandong,例1 从某大学中随机选出8名女大学生,其身高和体重数据如下表所示,解:由于问题中要求根据身高预报体重,因此选取身高为自变量x,体重为因变量y.作散点图,2022/11/25,8,v:pzyandong,由散点图可知,身高和体重有比较好的线性相关关系,设回归直线方程为y=bx+a,由系数公式得,所以回归方程为,求根据女大学生的身高预报体重的回归方程,并预报一名身高为172的女大学生的体重.,0.84917285.71260.316(kg),探究 身高为172cm的女大学生的体重一定是60.316kg吗?

4、如果不是,你能解析一下原因吗?,2022/11/25,9,v:pzyandong,1.确定变量;,2.作散点图,判断相关关系;,3.设回归方程;,4.求回归方程;,5.根据回归方程作出预报.,解答步骤:,2022/11/25,10,v:pzyandong,对于一组具有线性相关的数据,其回归直线方程为,线性回归模型,(x1, y1), (x2, y2), (xn, yn),y=bx+a,y=bx+a+e,2022/11/25,11,v:pzyandong,其中a和b为模型的未知参数,e称为随机误差.,线性回归模型,2022/11/25,12,v:pzyandong,线性回归模型,其中,a和b是模

5、型的未知参数.,通常e为随机变量,称为随机误差.,2022/11/25,13,v:pzyandong,当变量x取xi(i=1,2,n)时,回归方程的i与实际收集到的yi之间的偏差是yii=yi(bxi+a),2022/11/25,14,v:pzyandong,残差,数据点和它在回归直线上相应位置的差异 i=yii 称为相应于点(xi,yi)的残差。,例:编号为6的女大学生,计算随机误差的效应(残差),残差平方和,把每一个残差所得的值平方后加起来,用数学符号表示为:,称为残差平方和,2022/11/25,15,v:pzyandong,下图列出了女大学生身高和体重的原始数据以及相应的残差数据。,残

6、差分析与残差图的定义:,2022/11/25,16,v:pzyandong,残差图的制作及作用。 若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域;对于远离横轴的点,要特别注意。,身高与体重残差图,几点说明: 第一个样本点和第6个样本点的残差比较大,需要确认在采集过程中是否有人为的错误。 另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型计较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。,2022/11/25,17,v:pzyandong,显然,R2的值越大,说明残差平方和越小,也就是说模型拟合效果越好。,R2越接近1,表示回归的效果越好(因

7、为R2越接近1,表示解析变量和预报变量的线性相关性越强)。,如果某组数据可能采取几种不同回归方程进行回归分析,则可以通过比较R2的值来做出选择,即选取R2较大的模型作为这组数据的模型。,总的来说:相关指数R2是度量模型拟合效果的一种指标。在线性模型中,它代表自变量刻画预报变量的能力。,2022/11/25,18,v:pzyandong,R2,1.反映回归直线的拟合程度2.取值范围在 0 , 1 之间3. R2 1,说明回归方程拟合的越好;R20,说明回归方程拟合的越差,的含义,2022/11/25,19,v:pzyandong,练习1 在一段时间内,某中商品的价格x元和需求量y件之间的一组数据

8、为:,求出y对的回归直线方程,并说明拟合效果的好坏。,解:,2022/11/25,20,v:pzyandong,练习1 在一段时间内,某中商品的价格x元和需求量Y件之间的一组数据为:,求出Y对的回归直线方程,并说明拟合效果的好坏。,列出残差表为,0.994,因而,拟合效果较好。,0,0.3,-0.4,-0.1,0.2,4.6,2.6,-0.4,-2.4,-4.4,2022/11/25,21,v:pzyandong,案例2 一只红铃虫的产卵数y和温度x有关。现收集了7组观测数据列于表中:,(1)试建立产卵数y与温度x之间的回归方程;并预测温度为28oC时产卵数目。(2)你所建立的模型中温度在多大

9、程度上解释了产卵数的变化?,非线性回归问题,2022/11/25,22,v:pzyandong,假设线性回归方程为 :=bx+a,选 模 型,由计算器得:线性回归方程为y=19.87x-463.73相关指数R2=r20.8642=0.7464,估计参数,解:选取气温为解释变量x,产卵数为预报变量y。,所以,一元线性模型中温度解释了74.64%的产卵数变化。,探索新知,方案1,分析和预测,当x=28时,y =19.8728-463.73 93,一元线性模型,2022/11/25,23,v:pzyandong,方案2,选用y=bx2+a ,还是y=bx2+cx+a ?如何求a、b ?,二次函数模型

10、,2022/11/25,24,v:pzyandong,方案2解答,平方变换:令t=x2,产卵数y和温度x之间二次函数模型y=bx2+a就转化为产卵数y和温度的平方t之间线性回归模型y=bt+a,作散点图,并由计算器得:y和t之间的线性回归方程为y=0.367t-202.543,相关指数R2=0.802,将t=x2代入线性回归方程得: y=0.367x2 -202.543当x=28时,y=0.367282-202.5485,且R2=0.802,所以,二次函数模型中温度解释了80.2%的产卵数变化。,2022/11/25,25,v:pzyandong,产卵数,气温,指数函数模型,方案3,2022/

11、11/25,26,v:pzyandong,方案3解答,相关指数R2=0.98,当x=28oC 时,y 44 ,指数回归模型中温度解释了98.5%的产卵数的变化,由计算器得:z关于x的线性回归方程为,对数变换:在 中两边取常用对数得,令 ,则 就转换为z=bx+a.,2022/11/25,27,v:pzyandong,最好的模型是哪个?,线性模型,二次函数模型,指数函数模型,2022/11/25,28,v:pzyandong,比一比,最好的模型是哪个?,2022/11/25,29,v:pzyandong,作业: 假设关于某设备的使用年限x和所支出的维修费用 y(万元),有如下的统计资料。,若由资

12、料知,y对x呈线性相关关系。试求:(1)线性回归方程 的回归系数 ;(2)求残差平方和;(3)求相关系数 ;(4)估计使用年限为10年时,维修费用是多少?,2022/11/25,30,v:pzyandong,知识点一回归分析的概念回归分析是对具有_的两个变量进行统计分析的一种常用方法知识点二线性回归模型(1)由散点图易发现,样本点散布在某一条直线附近,而不是一条直线上,不能用一次函数ybxa描述它们之间的关系,因此用线性回归模型ybxae来表示,其中a,b为未知参数,e为_.,相关关系,随机误差,2022/11/25,31,v:pzyandong,2022/11/25,32,v:pzyando

13、ng,(3)解释变量和预报变量线性回归模型与一次函数模型的不同之处是增加了随机误差项e,因变量y由_和_共同确定,即自变量x只解释部分y的变化,在统计中,我们也把自变量x称为解释变量,因变量y称为预报变量,自变量x,随机误差e,2022/11/25,33,v:pzyandong,2022/11/25,34,v:pzyandong,知识点三刻画回归效果的方式,残差,样本编号,身高数据,体重估计值,2022/11/25,35,v:pzyandong,越小,解释,预报,【想一想】 2.在线性回归模型ybxae中,e的作用是什么?提示:e的作用是提供选择模型的准则,以及在模型合理的情况下探究最佳估计值

14、a,b的工具,2022/11/25,36,v:pzyandong,知识点四非线性回归分析(1)非线性相关关系:样本点分布在某一条曲线的周围,而不是一条直线附近,我们就称这两个变量之间不具有线性相关关系,而是非线性相关关系,(2)非线性回归方程线性化yaxn(其中a,x,y均为正值)(幂函数型函数)lg ylg anlg x,令ulg y,vlg x,blg a,则unvb,图象为一条直线ycax(a0,c0)(指数型函数)lg yxlg alg c,令ulg y,blg c,dlg a,则udxb,图象为一条直线,2022/11/25,37,v:pzyandong,(1)在分析两个变量的相关关

15、系时,可根据样本数据散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程,求线性回归方程,2022/11/25,38,v:pzyandong,2022/11/25,39,v:pzyandong,解:(1)散点图如图:,2022/11/25,40,v:pzyandong,2022/11/25,41,v:pzyandong,规律方法求线性回归方程的三个步骤(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系(2)求回归系数:若存在线性相关关系,则求回归系数(3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明,2022/11/25,42,v:pzya

16、ndong,1某工厂18月份某种产品的产量与成本的统计数据见下表:,以产量为x,成本为y.(1)画出散点图;(2)y与x是否具有线性相关关系?若有,求出其回归方程,2022/11/25,43,v:pzyandong,解:(1)由表画出散点图,如图所示,2022/11/25,44,v:pzyandong,(2)从上图可看出,这些点基本上散布在一条直线附近,可以认为x和y线性相关关系显著,下面求其回归方程,首先列出下表.,2022/11/25,45,v:pzyandong,2022/11/25,46,v:pzyandong,1由线性回归方程给出的是一个预报值而非精确值2随机误差的主要来源:(1)线

17、性回归模型与真实情况引起的误差;(2)省略了一些因素的影响产生的误差;(3)观测与计算产生的误差3残差分析是回归分析的一种方法4用相关指数R2来刻画回归效果R2越大,意味着残差平方和越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差,线性回归分析,2022/11/25,47,v:pzyandong,为研究重量x(单位:g)对弹簧长度y(单位:cm)的影响,对不同重量的6个物体进行测量,数据如下表所示:(1)作出散点图,并求线性回归方程;(2)求出R2;(3)进行残差分析,2022/11/25,48,v:pzyandong,解:(1)散点图如图所示:,2022/11/25

18、,49,v:pzyandong,2022/11/25,50,v:pzyandong,(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高由以上分析可知,弹簧长度与重量成线性相关关系,2022/11/25,51,v:pzyandong,残差图也是用来刻画拟合效果的,判断依据是残差点比较均匀地分布在水平的带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预报精度越高,2022/11/25,52

19、,v:pzyandong,2022/11/25,53,v:pzyandong,2022/11/25,54,v:pzyandong,2022/11/25,55,v:pzyandong,2022/11/25,56,v:pzyandong,非线性回归分析,2022/11/25,57,v:pzyandong,在一次抽样调查中测得样本的5个样本点,数值如下表:试建立y与x之间的回归方程,解:作出变量y与x之间的散点图如图所示由图可知变量y与x近似地呈反比例函数关系,2022/11/25,58,v:pzyandong,作出y与t的散点图如图所示,2022/11/25,59,v:pzyandong,2022

20、/11/25,60,v:pzyandong,规律方法求非线性回归方程的步骤(1)确定变量,作出散点图(2)根据散点图,选择恰当的拟合函数(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程(4)分析拟合效果,通过计算相关指数或画残差图来判断拟合效果(5)根据相应的变换,写出非线性回归方程,2022/11/25,61,v:pzyandong,3某地区对本地的企业进行了一次抽样调查,表中是这次抽查中所得到的各企业的人均资本x(单位 万元)与人均产值y(单位 万元)的数据,(1)设y与x之间具有近似关系yaxb (a,b为常数),试根据表中数据估计a和b的值;(2)估计企业人均资本为16万元时的人均产值(精确到0.01)解:(1)在yaxb的两边取常用对数,可得lg ylg ablg x,设lg yz,lg aA,lg xX,则zAbX.,2022/11/25,62,v:pzyandong,相关数据计算如下表所示.,2022/11/25,63,v:pzyandong,2022/11/25,64,v:pzyandong,2022/11/25,65,v:pzyandong,2022/11/25,66,v:pzyandong,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号