《相关与回归》PPT课件.ppt

上传人:牧羊曲112 文档编号:5558024 上传时间:2023-07-20 格式:PPT 页数:97 大小:733KB
返回 下载 相关 举报
《相关与回归》PPT课件.ppt_第1页
第1页 / 共97页
《相关与回归》PPT课件.ppt_第2页
第2页 / 共97页
《相关与回归》PPT课件.ppt_第3页
第3页 / 共97页
《相关与回归》PPT课件.ppt_第4页
第4页 / 共97页
《相关与回归》PPT课件.ppt_第5页
第5页 / 共97页
点击查看更多>>
资源描述

《《相关与回归》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《相关与回归》PPT课件.ppt(97页珍藏版)》请在三一办公上搜索。

1、1,第一节 相关分析,第二节 简单线性回归模型,第三节 利用回归模型预测与控制,第六章 相关与回归,2,联系与相互影响是普遍的现象,3,事物相互间关系的量的分析:两变量或多变量间的数量关系。在可以解释的质的关系基础上进行相关分析和回归分析,事物相互间关系的质的解释:自然的、社会的、经济的、心理的,4,相关分析,第一节 相关分析,社会经济现象中,一些现象与另一些现象之间往往存在着依存关系,当我们用变量来反映这些现象的的特征时,便表现为变量之间的依存关系。,在分析变量的依存关系时,我们把变量分为两种:,自变量,因变量,引起其它变量发生变化的量。,受自变量的影响发生相应变化的量,5,现象之间的相互关

2、系,可以概括为两种不同的类型:,(一)函数关系(二)相关关系,例如:家庭收入决定消费支出,收入的变化必然引起消费支出的变化,这两个变量中收入是自变量,而消费支出则是因变量。,6,函数关系可以用一个确定的公式,即函数式,来表示。,或:,7,例2、根据消费理论,商品需求量Q与商品价格P、居民收入I之间具有相关关系:,相关关系可用统计模型:,或:,式中,为影响 的除 外的其它随机因素。,8,单相关,是两个变量之间存在的相关关系,即一个因变量与一个自变量之间的依存关系。因此也称为一元相关。,相关关系的种类:,1、按相关关系涉及变量的多少可分为:,9,相关关系的种类:,2、按相关关系形式可分为:,10,

3、相关关系的种类:,3、按相关的方向可分为:,11,线性正相关,12,线性负相关,非线性相关,13,无(不)相关,14,相关关系的种类:,4、按相关关系的密切程度分为:,完全相关,因变量完全随自变量变动而变动,存在着严格的依存关系。即变量间的关系为函数关系。,不完全相关,变量之间存在着不严格的依存关系,即因变量的变动除了受自变量变动的影响外,还受其他因素的影响。它是相关关系的主要表现形式。,完全不相关,自变量与因变量彼此独立,互不影响,其数量变化毫无联系。,15,(1)确定现象之间有无相关关系,以及相关关系的表现形态。(2)确定相关关系的密切程度。,相关分析的主要内容包括:,16,相关关系的测定

4、,定性分析,是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断,定量分析,在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数与判定系数等方法,来判断现象之间相关的方向、形态及密切程度,17,在直线相关的条件下,用以反映两变量间线性相关密切程度的统计指标,用r表示,相关系数,其基本算法是英国统计学家皮尔逊所创的乘积动差法,简称积差法。,相关关系的测定,18,相关系数r的取值范围:-1r1,0|r|1表示存在不同程度线性相关:0|r|0.4 为低度线性相关;0.4|r|0.7为显著性线性相关;0.7|r|1.0为高度显著性线性相关。,r0 为正相关,r

5、 0 为负相关;|r|=0 表示不存在线性关系;|r|1 表示完全线性相关;,19,【例】计算工业总产值与能源消耗量之间的相关系数 资料,结论:工业总产值与能源消耗量之间存在高度的正相关关系,能源消耗量x的变化能够解释工业总产值y变化的95.2。,相关系数的计算,20,资料,21,正态总体相关系数的显著性检验,正态总体相关系数的检验(t检验法),提出假设:,目的,检验两正态总体两变量间线性相关性是否显著,步骤,构造检验统计量:,22,相关系数的显著性检验(t检验法),根据给定的显著性水平,确定临界值;,计算检验统计量并做出决策。,确定原假设的拒绝规则:,若,则接受H0,表示总体两变量间线性相关

6、性不显著;,若,则拒绝H0,表示总体两变量间线性相关性显著,步骤,23,24,【例】学生身高与体重的数据如 P23,已知学生身高与体重都服从正态分布,试在显著性水平0.05下检验学生身高与体重是否存在显著性线性相关关系。,解 由条件有,问题便是检验:,25,检验统计量落入拒绝域中,故拒绝原假设,接受备择假设。即可以认为 明显地不等于零,相关关系是显著的。,选取统计量,在 成立的条件下,,查表得,26,当 成立时,则统计量,27,相关关系不等于因果关系;相关系数只度量变量间的线性关系,因此,弱相关不一定表明变量间没有关系;极端值可能影响相关系数。注意相关关系成立的数据范围。警惕虚假相关,使用相关

7、系数时应注意的问题:,28,第二节 简单线性回归模型,回归分析,通过一个变量 或一些变量 的变化解释另一变量 的变化.即根据相关关系的数量表达式(回归方程式)与给定的自变量,揭示因变量 在数量上的平均变化和求得因变量的预测值的统计分析方法,回归:退回regression,回归方程,回归模型,反映自变量和因变量之间数学联系的表达式。,某一类回归方程的总称。,29,自变量(independent variable):解释变量,给定的或可以控制的、用来解释、预测应变量的变量。因变量(dependent variable):响应变量,由自变量来解释其变化的变量。,X,Y,30,回归分析的内容和步骤,1

8、、根据已有的理论和对问题的分析判断,区分自变量和因变量;,2、设法找出适合的数学方程式(即 回归模型)描述变量间的关系,3、对回归模型进行统计检验;,4、统计检验通过后,利用回归模型,根据解释变量去估计,预测 因变量。,31,回归分析的分类,根据变量的多少分为:,简单回归,多元回归,只有一个自变量和一个因变量的回归,自变量数目在两个或两个以上,根据建立的回归模型形式分为:,线性回归,非线性回归,从所拟合的回归模型来看,一变量表现为其它变量的线性组合。,从所拟合的回归模型来看,一变量表现为其它变量的非线性组合,32,回归分析与相关分析,理论和方法具有一致性;无相关就无回归,相关程度越高,回归越好

9、;相关系数和回归系数方向一致,可以互相推算。,联系:,33,相关分析中x与y对等,回归分析中x与y要确定自变量和因变量;相关分析中x、y均为随机变量,回归分析中只有y为随机变量;相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。,回归分析与相关分析,区别:,34,简单线性回归模型,指根据成对的两个变量的数值,配合直线方程式,根据自变量的变动,来推算因变量发展变动趋势的方法,其模型为:,其中:表示因变量Y在总体中某一个具体的观察值;表示在研究总体中自变量X的具体观察数值;与 是参数,称为回归系数;是一个随机变量,其平均数为0,方差为.,总体回归模型,35,总体一元线性回归模型:,误差

10、项,假定:E()=0,总体一元线性回归方程:,36,简单线性回归模型的假设,1、正态性假定,3、线性假定,2、同方差假定,4、独立性假定,当确定某一个Xi时,相应的Y就有许多Yi值与之对应。Yi是一个随机变量,这些Yi构成一个在X取值为Xi条件下的条件分布、并假设其服从正态分布。,假定所有Yi这一条件分布的方差是相等的。,假定所有Yi这一条件分布的平均数位于一条直线上,这条直线为,假定Yi之间是独立的,也就是说抽样时,Y的值在每取一个X值的条件分布相互独立。,37,一元线性回归模型的假定,38,在实际应用中,我们对X和Y所代表的总体往往不可能全面的观察和了解,而只能从中抽取部分资料作为样本,并

11、通过样本提供的信息来认识总体,找出总体回归模型的估计式,其估计式的方程式可写为:,简单线性回归模型,其中:a,b和 分别为 及 的估计量。,由于抽样的随机性,使样本回归线不可能与总体回归完全重合,从而会出现样本回归函数高估或低估总体回归函数的情况,我们能做的就是设法使样本回归函数尽可能接近总体回归函数,也就是说要使回归方程参数的估计值a、b尽量接近总体真实参数。,样本回归模型,39,一元线性回归方程的几何意义,回归直线的拟合,40,总体一元线性回归方程:,样本一元线性回归方程:,以样本统计量估计总体参数,斜率(回归系数),截距a 表示在没有自变量x的影响时,其它各种因素对因变量y的平均影响;回

12、归系数b 表明自变量x每变动一个单位,因变量y平均变动b个单位。,41,42,残差(Residual):e,43,一元线性回归方程中参数a、b的确定:,最小二乘法,基本要求:,44,整理得到由两个关于a、b的二元一次方程组成的方程组:,进一步整理,有:,45,46,【分析】因为工业总产值与能源消耗量之间存在高度正相关关系(),所以可以拟合工业总产值对能源消耗量的线性回归方程。,【例】建立工业总产值对能源消耗量的线性回归方程 资料,47,即线性回归方程为:,计算结果表明,在其他条件不变时,能源消耗量每增加一个单位(十万吨),工业总产值将增加0.7961个单位(亿元)。,48,最小二乘法估计的优良

13、性质,残差之和为零所拟合直线通过样本散点图的重心误差项与解释变量不相关a与b分别是总体回归系数的无偏估计量a与b均为服从正态分布的随机变量,49,b与r的关系:,50,相对均值的偏差,回归偏差,残差或剩余,总偏差平方和的分解,51,误差平方和,回归平方和,总离差平方和,52,总偏差(SST)=回归偏差(SSR)+剩余偏差(SSE),r2表示全部偏差中有百分之几的偏差可由x与y的回归关系来解释,数量关系及意义,53,回归模型的检验,1、拟合优度检验,确定回归直线后,需要评价这一直线方程是否有效地反映了这两变量之间的关系。评价回归方程拟合好坏的一个主要指标是判定系数(或称确定系数),是相关系数的平

14、方,用 表示;用来衡量回归方程对y的解释程度。,判定系数取值范围:,越接近于1,表明x与y之间的相关性越强;越接近于0,表明两个变量之间几乎没有直线相关关系.,判定系数,54,判定系数与相关系数的关系,55,56,例 求学生体重偏差中能够被身高与体重回归关系解释的百分比。,解 由条件可得,57,判定系数与相关系数的区别:,判定系数无方向性,相关系数则有方向,其方向与样本回归系数 b 相同;判定系数说明变量值的总离差平方和中可以用回归关系来解释的比例,相关系数只说明两变量间关联程度及方向;相关系数有夸大变量间相关程度的倾向,因而判定系数是更好的度量值。,58,总离差平方和,回归平方和,误差平方和

15、,59,回归分析中我们最关心的是:X 与 Y 是否有真正的线性相关关系。即检验假设:,60,回归系数的检验,提出假设;确定检验统计量;给定显著性水平,确定临界值;确定原假设的拒绝规则;计算检验统计量并做出决策。,61,统计理论已经证明,62,63,由于 未知,且,故取,64,65,例 数据如上,试在显著性水平0.05下检验学生身高与体重是否显著线性相关。,解 由题设条件可得,66,67,检验统计量落入拒绝域中,故拒绝原假设,接受备择假设。即可以认为 明显地不等于零,X 与 Y 是显著的。,问题便是要检验假设:,选取统计量,在原假设成立时,而,68,F检验是基于F分布进行的,是方差分析内容之一。

16、,均方回归,均方误差,69,故拒绝原假设,接受备择假设,即认为相关关系是显著的。,故原假设的拒绝域为:,原问题便是要检验假设,选取统计量,查表得,而,70,估计的前提:回归方程经过检验,证明 X 和 Y 的线性关系在统计上是显著的。,回归分析的点估计:对于给定的 X 值,求出 Y 平均值的一个估计值或 Y 的一个个别值。,若 x=169,则:,71,利用点估计得到的Y平均值的点估计值和Y的一个个别值其结果是相同的。点估计不能提供估计量的精确度。在样本自变量取值范围之外进行预测要特别谨慎。,使用点估计应注意的问题:,72,第三节 利用回归方程预测与控制,估计的前提:回归方程经过检验,证明 X 和

17、 Y 的关系在统计上是显著线性相关的。,对于给定的 X 值,求出 Y 平均值的一个估计值或 Y 的一个个别值的预测值。,对于给定的 X 值,求出 Y 的平均值的置信区间或 Y 的一个个别值的预测区间。,点估计,区间估计,73,回归分析的区间估计:对于给定的 X 值,求出 Y 的平均值的置信区间或 Y 的一个个别值的预测区间。,74,Y 的平均值的置信区间估计,总体的回归模型,样本回归方程,如果样本回归方程通过检验,则:,如果给定 x=x0,则有:,分布形态?,75,可以证明,0 是服从正态分布的,其数学期望:其方差:其标准差:,76,对于给定的 x=x0,E(Y0)的1-置信区间为:,由于,证

18、明见后,77,令,则样本回归方程,由最小二乘法可知,假设 可逆,则,78,记则,定理,79,80,81,82,83,84,也就是:,自由度为n-2的 t 分布的 水平上侧分位数,85,86,例 数据如上,试求在学生身高为167CM时的置信度0.95的学生体重的置信区间。,解 由题设条件得,=0.05,则有,87,当 时,得到最小值。当 时,的值随 的减少或增加而逐步增大。,88,89,Y 的个别值的置信区间估计,对于给定的,如果要预测 的一个个别值 的置信区间,则其相应的残差为:,的个别值的方差,当 时,所估计的 的方差组成,与 的方差,可以证明:和 相互独立。,90,即:Y0 的方差为:,即:,则:的标准差的估计值为:,91,92,对于给定的 X0,Y 的一个个别值Y0 的预测区间估计值为:,也就是:,与估计Y的平均值公式相比,此公式中多了一项“1”,因此,这个置信区间要相对大一些,93,94,当 时,得到最小值。当 时,的值随 的减少或增加而逐步增大。,若令,则有,95,点估计,若 x=80(十万吨),则:,96,区间估计,对于给定的 x=x0,Y 的1-置信区间为,97,即:,在大样本条件下,近似有:,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号