《我的变量间的相关关系.ppt》由会员分享,可在线阅读,更多相关《我的变量间的相关关系.ppt(30页珍藏版)》请在三一办公上搜索。
1、2.3变量间的相关关系,1、相关关系,自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.,一般情况下两个变量之间的相关关系成正相关或负相关,类似于函数的单调性.,不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系.,2、相关关系与函数关系的异同点:,相同点:均是指两个变量的关系,3、散点图,在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.,知识探究(一):回归直线,思考1:一组样本数据的平均数是样本数据的中心,那么散点图中样本点的中心如何确定?它一定是散点图中的点吗?,思考2:在各种各样的散点图中,有些散点图中的点是杂乱分布的,
2、有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?,这些点大致分布在一条直线附近.,思考3:如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.,只有散点图中的点呈条状集中在某一直线周围的时候,才可以说两个变量之间具有线性关系,才有两个变量的正线性相关和负线性相关的概念,才可以用回归直线来描述两个变量之间的关系,知识探究(二):回归方程,在直角坐标系中,任何一条直线都有相应的方程,回归直线的方程称为回归方程.对一组具有线性相关关系的样本数据,如果能够求出它的回归方程,那么我们就可以比较具
3、体、清楚地了解两个相关变量的内在联系,并根据回归方程对总体进行估计.,思考1:回归直线与散点图中各点的位置应具有怎样的关系?,整体上最接近,整体上最接近,方案一:采用测量的方法:先画一条直线,测量出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测量出此时直线的斜率和截距,就得到回归方程。,三、如何具体的求出这个回归方程呢?,方案二:在图中选取两点画直线,使得直线两侧的点的个数基本相同。,三、如何具体的求出这个回归方程呢?,方案三:在散点图中多取几组点,确定几条直线的方程,分别求出各条直线的斜率和截距的平均数,将这两个平均数作为回归方程的斜率和截距。,三、如何具体的求出这个回归方程
4、呢?,设已经得到具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),(xn,yn)当变量x取x1,x2,xn时,可以得到:它与实际收集得到的 之间偏差是:,这样,用这n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的。,设所求的回归直线方程为 其中a,b是待定系数。,这n个偏差的和:,为了方便运算,人们更喜欢用:,最小二乘法的步骤:,(1)收集样本数据,(xi,yi).,(2)作散点图,确定x、y具有线性相关关系.,例2、(07广东)下表提供了某厂节油降耗技术发行后生产甲产品过程中记录的产量(吨)与相应的生产能耗y(吨标准煤)的几组对应数据.X 3 4 5 6y2.5 3
5、4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:32.5+43+54+64.566.5),求样本数据的线性回归方程,可按下列步骤进行:,第一步,计算平均数,第二步,求和,第三步,计算,第四步,写出回归方程,练习2-1、观察两相关量得如下数据:,求两变量间的回归方程.,解:列表:,计算得:,所求回归直线方程为,注意:求回归直线方程的步骤:,第一步:列表,第二步:计算:,第三
6、步:代入公式计算b,a的值,第四步:列出直线方程。,练习2-2、:给出施化肥量对水稻产量影响的试验数据:,(1)画出上表的散点图;(2)求出回归直线并且画出图形.,从而得回归直线方程是,解:(1)散点图(略)(2)表中的数据进行具体计算,列成以下表格,(图形略),故可得到,4、利用回归直线方程对总体进行估计,练习2-3、炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系。如果已测得炉料熔化完毕时,钢水的含碳量X与冶炼时间y(从炉料熔化完毕到出刚的时间)的一列数据,如下表所示:,(1)作出散点图,找规律。(2)求回归直线方程。(3)预测当钢水含碳
7、量为160时,应冶炼多少分钟?,解:(1)作散点图.从图可以看出,各点分布在一条直线附近,即它们线形相关.,(2)列出下表,并计算,设所求的回归直线方程为,其中a,b的值使,的值最小.,所以回归直线的方程为,(3)当x=160时,1.267.160-30.51=172,归纳:,1.求样本数据的线性回归方程,可按下列步骤进行:,第一步,计算平均数,第二步,求和,(列表),第三步,计算,第四步,写出回归方程,2.回归方程被样本数据惟一确定,各样本点大致分布在回归直线附近.对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有随机性.,3.对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程.,基础知识框图表解,变量间关系,