《统计学教案(第7章相关与回归分析).docx》由会员分享,可在线阅读,更多相关《统计学教案(第7章相关与回归分析).docx(8页珍藏版)》请在三一办公上搜索。
1、统计学授课题目第7章相关与回归分析课次第10-11次授课方式讲授课时安排第10教学周-第11教学周,共4课时教学目的:通过本章的学习,要求掌握相关的意义,现象相关的主要形式以及相关分析的基本内容相关系数的涉及原理,怎样利用相关系数来判断相关的密切程度回归和相关的区别与联系,建立回归方程的依据,回归方程的参数估计标准误的分析。教学重点及难点提示:相关系数的涉及原理,回归方程的原理,估计标准误差案例导入:银行不良贷款的成因教法提示:新课导入:在前面章节中,我们已经学习了分析总体特征的一些方法,通过指标可以说明总体的具体数量特征,用抽样估计解决了无法进行全面调查统计的难题。但是在一项统计活动中,我们
2、不但要了解某个总体或某些总体的特征,还要了解一些总体之间的联系以及互相影响的程度。如下例:第一节相关分析一、相关分析的含义对总体中确实具有联系的标志进行分析,其主体是对总体中具有因果关系标志的分析。有两种类型的分析:多媒体教学案例教学列举法1.函数关系:这是一个典型的数学概念,反映的是一个变量数值随着另一个变量的给定也确定下来(完全依存关系)。如:C=2兀R只要知道圆的半径R的值(R=3),则马上可知道该圆周长(C=6n)o额为25元。M=PXQ设一条毛巾价格为5元/条,则销售5条的销售2 .相关关系:是一种不完全确定的随机关系。如:设一块田的面积,长度是固定的1,如果每株的间隔是变量X,则一
3、列栽苗的株数则是间隔变量的函数:n=lx但是一株苗的粮食产量则不是间隔变量的一个函数,不能随机被确定,但是又受它的影响,这种变量之间的关系则称相关关系。3 .函数关系与相关关系的关系1)区别:定义上的区别。一个是完全的依存关系,一个则是不完全依存关系2)联系:相关关系是相关分析的研究对象,函数关系是相关分析的工具二、相关的种类1 .按相关的程度分为完全相关和不完全相关,不相关2 .按相关的方向分为正相关和负相关3 .按相关的形式分为线性相关和非线性相关。对应数值的图形近似一条直线4 .按影响因素的多少可分为单相关和复相关。特别强调:关于相关的种类,在考试中出题经常出现,大家一方面要掌握不同种类
4、的名称,另外,还要判断相关的类型。(见指导书判断题2、5题,单选6题)三、相关分析的主要内容研究两个变量之间的密切程度,将定性定量,包括如下几个环节:1 .确定相关关系的存在,相关关系的形态和方向。2 .确定相关关系的数学表达式。将两个变量用一个近似的方程来表示,这就是本章第一重点回归分析。3 .确定因变量估计值误差的程度。既然在(2)中提到,用一个近似方程来定义两变量的关系,坡就表明用方程确定出来的数侑与实际数侑方间仍有来检验方程的代表程度。(请同学们联系第五章的内容。)四、相关图表1 .相关表的编制。可以直观地判断现象之间大致呈何种关系形式。(1)简单相关表:未分组的相关表,把因素标志X)
5、按照从小到大的顺序并配合结果标志(因变量y)一对应而平行排列起来。(2)分组相关表:2 .相关图的编制。将(x,y)实际数值放于指教坐标系中去,结合各有序实数所对应的点形成的大致图象来判断相关密切程度、相关方向。五、相关系数1.相关系数的基本公式r=四八表明度量x、y关系主要是通过两个变量的变异程度来说明的。oxoy此公式中包括这几个方面:结合P271讲。(O2勺协方差OXX的标准差oyy的标准差一.犷0或r0(正、负)(2)0纱协方差对相关系数的影响,决定:皿,或E:正负一,数值的大小2 .相关系数的性质(1) r取值范围:r(zl-l/-0表明两变量成正相关。厂0成负相关r=0不相关(4)
6、 5-1存在着一定的线性相关;旧绝对值越,相关程度越高。, 微弱相关,低度相关,尸|显著相关,L Ki高度相关。3 .相关系数的简化式:&乙XZJn变形:分子分母同时除以2年一忘ifz八y/xy-xx_yx2-(x*4y25x5y(yJE一3一第二节回归分析一、回归分析的含义及与相关分析的联系1 .回归分析:对具有相关关系的两个或两个以上变量之间的数量变化的一般关系进行确立一个相应的数学表达式,以便从一个己知量来推测另一个未知量,为估算提供一个重要的方法。(一元,多元,)2 .相关分析与回归分析的联系:广义的相关分析实际上包括了相关、回归分析两个范畴,具体而言,相分析是回归分析的基础,而回归分
7、析则是认识变量之间相关程度的具体形式。二、简单回归方程(线性)1 .作为考纲要求,我们分析的是两变量(X,y)的变化规律呈一条直线,也就是在画相关图时,将变量实数点(x,y)放在直角坐标系上.为了达到用已知量去估计未知的因变量数值,我们必须将两变量的数学关系式建立起来,用一个近似方程式表示:=tz+推导原理:最小平方法,(最小二乘法)确定待定系数a,bExyxzy=xy-Xy_Xy-X-yb=Exi-zq-Xia=ybX=一brin2 .方程参数。表示当自变量数值为O时,因变量的取值。历又称回归系数。表示当X每变动一个单位,因变量平均来说变动多少。表示增加平均数所以我们可以通过回归系数力来确定
8、的符号,从而来判断相关的方向。b0表示减少平均数。3 .b(回归系数)与(相关系数)xy-XXyr=-6Qx-运用数学等量关系式r=b:客通过上式可以看出:1因为6小6),均是正值所以匕与尸的符号是一致的,28与尸的大小成正比例,所以还可以利用来说明相关程度。4 .例题:根据某企业产品销售额(万元)和销售利润率(%)资料计算出如下数据:n=7ZJ=1890Zy=Z工2=535500Zya=Zxy=9318要求:(1)确定以利润率为因变量的直线回归方程。)(2) 解释式中回归系数的经济含义。(3) 当销售额为500万元时,利润率为多少解:(1)销售额为自变量X,利润率为因变量A则设y倚X的直线方
9、程y=a%+b展9-ZxZy9318x7-1890x31.1b=V二nZix-(Zx)27x535500-(1890)23111890a=y-bx=-t与二-0.0365=n77则利润率倚销售额的回归方程为:y二-(2)回归系数b的经济含义:当销售额每增加一万元,销售利润率增加国(3)计算预测值,将已知x=500代入回归方程,则yc=X=即当x=500万元时,利润率为5.总结回归分析的特点(同时比较它与相关分析的区别)P286起。(1)回归分析是研究两变量之间的因果关系,所以必须通过定性分析来确定哪个是自变量,哪个是因变量;相关分析则是两变量之间的关系,没有自变量和因变量之分。(2) 回归分析
10、是研究两变量具有因果关系的数学形式,自变量不是随机变量,应是一个给定的具体数值,因变量则是随机的;而相关分析则涉及的变量都是随机变量。(3)回归分析对于因果关系不甚明确,或可以互为自变量的两个变量,可以求出y倚X的回归方程,还可求出X倚y的回归方程;而相关分析中两个变量的相关程度指标,相关系数是唯一的。(4) 回归方程在进行预测估计时,只能给出自变量的数值求因变量的可能值。即只能由X推出y的估计值y,而不能据y逆推X。6.估计标准误(1)根据回归方程得出因变量的估计值。这个数值和实际数值之间就可能会产生误差额,这就是估计值对于实际值的误差,在统计学当中,我们用标准差指标来反映误差值(第四章、第
11、五章都用过),在这一章中,我们也用这样的计算原理来计算:-y#X方程的估计标准误n2分母减少,误差值增大,主要是因为在方程中a、b两数都是估计量。(2)估计标准误和相关系数的关系总误差y-y-(y-y)+(y-y)估计误差回归误差该节内容P292293,要求学员掌握上面两个基本公式即可。综合例题:(练习题)根据某部门8个企业产品销售额和销售利润的资料得出以下计算结果:=189127X2=2969700(单位:万元)要求:(1)计算产品销售额与利润额的相关关系;(2)建立以利润额为因变量的直线回归方程,并说明回归系数的经济意义;(3)设销售额为500万元时,该部门的销售利润是多少(4)计算估计标准差。解:(1)求相关系数。nflxy.ryLLv2-(.r)21y2-(nyJ8x189127-4290x260.18x2969700429028x12189.11-260.kI=nxy一xy建立回归方程,将500代入方程。