《相关分析回归分析案例.ppt》由会员分享,可在线阅读,更多相关《相关分析回归分析案例.ppt(20页珍藏版)》请在三一办公上搜索。
1、相关分析 回归分析 案例,第八章 相关与回归,相关和回归分析是研究事物的相互关系,测定它们联系的紧密程度,揭示其变化的具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、预测和控制的重要工具。,主要内容,相关分析,概念,种类,线性相关,变量之间关系,函数关系,相关关系,因果关系,互为因果关系,共变关系,确定性依存关系,随机性依存关系,种类,一元相关,多元相关,负 相 关,正 相 关,线性相关,曲线相关,x,y,正 相 关,x,y,负 相 关,x,y,曲线相关,x,y,不 相 关,线性相关,相关系数,测定两变量是否线性相关?,定义式:,未分组:,已分组:,值:,|r|=0 不
2、存在线性关系;|r|1 完全线性相关0|r|1不同程度线性相关(00.3 微弱;0.30.5 低度;0.50.8 显著;0.81 高度),符号:r0 正相关;r0 负相关,计算公式,相关系数的检验(t检验),检验统计量,要研究两个变量之间是否存在相关关系,自然要先作实验,拥有一批实验数据,然后,作散点图,以便直观地观察两个变量之间的关系。合成纤维强度与拉伸倍数的关系,24组实验。,散点图,某合成纤维拉伸倍数和强度的关系,回归分析,特点,线性回归,非线性回归,回归分析和相关分析的联系和区别,1理论和方法具有一致性;,2无相关就无回归,相关程度越高,回归越好;,3相关系数和回归系数方向一致,可以互
3、相推算。,1相关分析中,x与y对等,回归分析中,x与y要确定自变量和因变量;,2相关分析中x,y均为随机变量,回归分析中,只有y为随机变量;,3相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。,y与x之间是一种相关关系,即当自变量x变化时,因变量y大体按某规律变化,两者之间的关系不能直观地看出来,需要用统计学的办法加以确定,回归分析就是研究随机现象中变量间关系的一种数理统计方法,相关关系存在着某种程度的不确定性。身高与体重;矿物中A组分含量与B组分含量间的关系;分析化学制备标准工作曲线,浓度与吸光度间的关系。求回归方程的方法,通常是用最小二乘法,其基本思想就是从并不完全成一条直线
4、的各点中用数理统计的方法找出一条直线,使各数据点到该直线的距离的总和相对其他任何线来说最小,即各点到回归线的差分和为最小,简称最小二乘法。,线性回归,一元线性回归模型,1一元线性回归模型的一般形式,总体一元线性回归模型的一般形式,Y的数学期望E(Y),随机误差,也称一元线性回归方程,是对应于自变量X,某一取值时因变量Y的均值。,未知参数,样本的一元线性回归模型和回归方程,一元线性回归模型,一元线性回归方程,截距,斜率(回归系数),回归系数b表明自变量x每变化一个单位因变量y的增(减)量。,b与r的关系:,r0 r0 r=0b0 b0 b=0,是理论模型,表明x与y两变量之间的平均变动关系。,(
5、实际值):,X对y的线性影响而形成的系统部分,反映两变量的平均变动关系,即本质特征。,随机干扰:各种偶然因素,观察误差和其他被忽视因素的影响。,的理论假定,值相互独立,服从正态分布,的方差,都相同,且,的数学期望E(),x,y,2一元线性回归模型的确定,根据实际数据,用最小平方法,即使 分别对a、b求偏导并令其为零,求得两个标准方程:,解联立方程,得到,3一元线性回归模型拟合优度的评价,判定系数(r2),是对回归模型拟合优度的评价。,x,y,总偏差=回归偏差+剩余偏差,r2表示全部偏差中有百分之几的偏差可由x与y的回归关系来解释。,r 的符号同 b,回归模型整体的F检验,H0:R2=0;H1:
6、R20,检验统计量,F,检验假设,4一元线性回归模型的显著性检验,回归系数b的检验,设总体回归系数为,H0:=0;H1:0,n30时,检验统计量,(=0),b是样本回归系数抽样分布的标准差。通常是未知的,用其估计量 代替。,给定显著性水平,查Z表可知其临界值。,n30时,(=0),给定显著性水平,查t表可知其临界值。,0,0,Z,t,为了维护本课件多媒体的版权,本网站仅上传每章节若干页讲义,望大家谅解。,模型检验:模型检验主要包括方程的显著性检验(F检验)和回归系数的显著性检验(t检验)。F检验主要是针对模型拟合样本的整体效果,也就是选择的所有自变量对应变量的总体解释力度;回归系数的显著性检验
7、则反映每一个自变量的合理性。需要指出,如果模型不满足线性回归模型基本假定条件时,各种检验的效力都将受到影响甚至于失效。(1)F检验 在EViews中,为了方便,给出了拒绝零假设时犯错误(第一类错误或错误)的概率,称为收尾概率或相伴概率p。若此概率值低于事先确定的著信度(如0.05),则拒绝原假设,表示回归方程是显著的,反之不能拒绝。以后涉及的检验,大多数情况下都不用查表,只需直接查看相伴 概率即可。,(2)D.W检验D.W检验用于检验残差序列的自相关性。自相关性会影响模型参数估计值不具有最优性,使区间估计和预测区间的精度较低。J.Durbin和 G.S.Watson 于1951年提出的一种序列
8、自相关的方法。简称DW检验。DW检验目前是检验自相关性的最常用方法,但它只适用于检验一阶自相关性。一般只需考察计算得到的DW值落入的区间,以确定模型自相关状态。判别准则若0D.W dL,序列存在正相关;若dL D.W 4-du,序列无自相关;若4-dL D.W 4,序列存在负相关,(3)其他指标赤池信息准则(Akaike info criterion)简称AIC,它对方程的滞后项数选择提供指导。在特定条件下,可以通过选择使AIC达到最小值的方式来选择最优滞后发布的长度。AIC的值越小越好。施瓦茨准则(Schwarz Criterion)简称SC,它具有与AIC基本相同的解释。F统计量(F-Statistc)这是对回归式中的所有系数均为0(除了截距项或常数项)的假设检验。,(3)其他指标赤池信息准则(Akaike info criterion):即AIC,它对方程中的,