《《统计学》课件第8章相关回归分析不用.ppt》由会员分享,可在线阅读,更多相关《《统计学》课件第8章相关回归分析不用.ppt(67页珍藏版)》请在三一办公上搜索。
1、第八章 相关与回归分析,第八章 相关与回归分析,1 相关分析的意义、内容 2 简单线性相关分析 3 回归分析 4 估计标准误差,第一节 相关分析的意义和内容,一、相关关系的概念,(一)函数关系,它反映着现象之间存在着严格的依存关系,也就是具有确定性的对应关系,这种关系可用一个数学表达式反映出来。,(二)相关关系,它是现象之间相互关系的一种形式。是指现象之间确实存在但关系数值不严格的相互依存关系。,1.现象之间确实存在数量上的依存关系,即某一社会经济现象变化要引起另一社会经济现象的变化;,2.现象之间的这种依存关系是不严格的,即无法用数学公式表示。,这种关系有二个明显特点:,二、相关关系的种类,
2、单相关 复相关,2.按相关关系的性质来分,可分为:正相关 负相关,1.按相关关系涉及的因素多少来分,可分为:,4.按相关程度分,可分为:完全相关、不完全相关 完全不相关,3.按相关关系的形式来分,可分为:直线相关 曲线相关,种类,一元相关,多元相关,负相关,正相关,线性相关,曲线相关,x,y,正 相 关,x,y,负 相 关,x,y,曲线相关,x,y,不 相 关,三、相关分析的任务和内容,相关分析的主要任务:,1.研究现象之间关系的密切程度,即相关分析;,2.研究自变量与因变量之间的变动关系,即回归分析。,相关分析的主要内容:,1.判断社会经济现象之间是否存在相互依存的关系,是直线相关,还是曲线
3、相关,这是相关分析的出发点;,2.确定相关关系的密切程度;,3.测定两个变量之间的一般关系值;,4.测定因变量估计值和实际值之间的差异,用以反映因变量估计值的可靠程度;,5.相关系数的显著性检验。,第二节 简单线性相关分析,一、相关表和相关图,相关图,也称散布图(或散点图)。,简单相关表和相关图的编制方法:某市1996年 2003年的工资性现金支出与城镇储蓄存款余额的资料,分组相关表和相关图的编制方法:,二、相关系数,相关系数是在直线相关条件下,表明两个现象之间相关关系的方向和密切程度的统计指标。用符号r表示。,(一)概念,(二)作用:,1.用来反映现象之间相关关系的性质.,2.用来反映现象之
4、间相关关系的密切 程度.,(三)r的测定方法:(简单相关表),以上例1资料计算r:,以上例1资料计算r:,以上例1资料计算r:,计算表明该市工资性现金支出与城镇储蓄存款余额之间存在着高度正相关。,r的特点:,(1)r取正值或负值决定于分子协方差;(2)r的绝对值,在0与1之间;(3)r的绝对值大小,可说明现象之间相关关系的紧密程度。,2.简捷法,以上例1资料计算r:,以上例1资料计算r:,以上例1资料计算r:,以上例1资料计算r:,计算表明该市工资性现金支出与城镇储蓄存款余额之间存在着高度正相关。,三、简单线性相关分析的特点,2.相关关系中只能计算出一个相关系数r。,相关关系中,两个变量不必定
5、出哪个是自变量,哪个是因变量,因此,相关的两个变量都是随 机变量;,第三节 回归分析,在回归分析中,两个变量之间的回归称为简单回归,两个以上变量之间的回归称为复回归。无论是简单回归还是复回归,数学模型均有线性(直线)回归和非线性(曲线)回归之分。,简单直线回归分析的主要特点:,1.直线回归分析时,要根据研究目的,在两个变量之间确定哪个是自变量,哪个是因变量。,2.在两个现象互为根据的情况下,可以有两个回归方程:yc=a+bx 称y倚x回归直线 xc=c+dy 称x倚y回归直线,一、直线回归分析,(一)简单直线回归分析,简单直线回归方程的一般形式为:yc=a+bx,yc 因变量的估计值;x 自变
6、量;a 回归直线在y轴上的截距;b 回归直线的斜率,称回归系数,表明x每增加 一个单位,因变量yc的平均变化值 b0,x与y为正相关 b0,x与y为负相关,例:某企业的某种产品月产量与单位成本的关系呈直线关系,用直线回归方程表示是:yc,其中,x表示月产量(千件)y表示单位成本(元);,a=77.36,表示生产这种产品在单位成本方面的条件;b=-1.818,表示月产品每增加1000件,单位成本平均降低1.818元。,方程的求解:最小平方法,即(y-yc)2=最小值。,仍用上例1资料得到:,yc=-199.5+0.5858x,表明该市工资性现金支出每增加1万元,储蓄存款余额就增加0.5858万元
7、。,(二)多元线性回归分析,多元线性回归分析可以看作是一元线性回归分析的扩展。现以二元线性回归模型进行回归分析,其方程式为:,以某地19932003年11年笔记本电脑价格和销售量的实际资料为例,拟合一元线性回归方程为:yc=9643-65x b表明,笔记本平均价格每降低1百元/台,销售量约平均增长65台。一元线性回归模型只列入了笔记本平均价格对销售量的影响,而忽略了居民收入这一很重要的因素,因此,现对此资料补入同期居民人均货币收入资料,将原来的一元线性回归模型扩展为二元线性回归模型进行回归分析。,b1表明在笔记本平均价格固定时,人均货币收入每增加百元,销售量平均增长18.6368台;b2表明在
8、人均货币收入固定时,笔记本平均价格每上升百元/台,销售量平均减少8.0328台。这里的b2比原一元线性回归模型中的同一回归系数b=-65要大得多,是因为一元线性回归模型只列入了笔记本平均价格对销售量的影响而忽略了居民收入这一很重要的因素,在笔记本平均价格的影响中渗入了居民收入的影响。,二、曲线回归,拟合方法:统计上通常采用变量代换法把非线性形式转换为线性形式处理,使线性回归分析的方法也能适用于非线性回归问题的研究。,某商店各个时期的商品流通费率和商品零售额资料如下:,双曲线方程为:,第四节 估计标准误差,一、估计标准误差的概念和作用,(一)概念用来说明回归方程推算结果的准确程度的统计分析指标。
9、用Syx表示,也可用Sy表示。(二)作用1、以绝对值表示。其数值越小,说明推算结果的准确程度越高,回归直线的代表性也越大。2、反映变量间相关关系的密切程度。,二、估计标准误差的计算方法,仍用前例资料计算Sy:,计算结果表明,城镇储蓄存款余额的实际值和估计值是有差距的,这个差距有的大,有的小,平均起来是33.22万元。,三、回归方差,即Sy2,Sy和r的异同点:,相同点:都具有说明相关关系密切程度的作用;,不同点:(1)r越大越好,而Sy越小越好;(2)r用相对数表现,密切程度的概念比较明确 Sy用绝对数表现,关系密切的程度表示得 不那么明显;(3)r能说明正、负相关,Sy不能说明。,例:某市抽
10、查10户家庭,资料如下:要求:()计算相关系数()建立直线回归方程()计算估计标准误差()在的概率保证下,考虑S,第11户家庭若人均月收入为1550元时,人 均月支出的区间范围。,(1),(3),例:某地区有下表资料,已知人均月收入的长期趋势为直线,人均月收入与储蓄存款额为直线相关。要求:,()计算相关系数()建立直线回归方程(3)根据2006年人均月收入的预测值推算 2006年储蓄存款额的可能值。,(1)r=0.961,b=0.24 a=-27.34 yc=-27.34+0.24x,(3),三、判断,一、名词解释,二、简答,相关关系,2、若直线回归方程yc=1702.5x,则变量x和y之间
11、存在着负的相关关系。(),相关系数,什么是相关分析法?相关分析的主要内容包括哪些?,1、相关系数r有正负、有大小,因而它反映的是两现象之间具体的数量变动关系。(),3、在回归分析中,要求自变量是非随机的,因变量是随机的。(),三、选择,1、可用来判断现象之间相关方向的指标有()。A、估计标准误差 B、相关系数 C、回归系数 D、两个变量的协方差 E、两个变量的标准差,2、企业工人工资(元)倚年劳动生产率(千元/人)变动的回归方程为 yc=10+70 x,这意味着年劳动生产率每提高一千元时,工人工资平均()A、增加70元 B、减少70元 C、增加10元 D、减少10元,3、回归分析中的两个变量()。A、都是随机变量 B、关系是对等的 C、都是给定的量 D、一个是自变量,一个是因变量,End of Chapter 8,