第7章相关与回归分析ppt课件.pptx

上传人:牧羊曲112 文档编号:2105335 上传时间:2023-01-11 格式:PPTX 页数:58 大小:988.42KB
返回 下载 相关 举报
第7章相关与回归分析ppt课件.pptx_第1页
第1页 / 共58页
第7章相关与回归分析ppt课件.pptx_第2页
第2页 / 共58页
第7章相关与回归分析ppt课件.pptx_第3页
第3页 / 共58页
第7章相关与回归分析ppt课件.pptx_第4页
第4页 / 共58页
第7章相关与回归分析ppt课件.pptx_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《第7章相关与回归分析ppt课件.pptx》由会员分享,可在线阅读,更多相关《第7章相关与回归分析ppt课件.pptx(58页珍藏版)》请在三一办公上搜索。

1、第7章 相关与回归分析,1,2,第一节 数据的相关分析,(一)双变量相关关系的含义,3,一、双变量相关关系的含义和种类,函数关系,相关关系,现象之间确定性的数量依存关系,现象之间非确定性的数量依存关系,(二)双变量相关关系的种类,4,一、双变量相关关系的含义和种类,相关关系的种类,相关方向,正相关和负相关,相关形式,线性相关和非线性相关,相关程度,完全相关、不完全相关和不相关,【例7-1】歌乐音响设备商店于2014年79三个月份中,连续10周使用了周末电视广告来提高商店的销售额。商店经理想调查这段时间内播出的广告次数和店内销售额之间是否存在某种关系。问题:如果该经理将这项工作交给你,你该怎样做

2、呢?,5,二、双变量相关关系的测度方法,(一)相关表法 1.编制原始数据表如下表 7-1 立体声音响设备商店的原始数据,6,二、双变量相关关系的测度方法,2.将原始数据表编制成相关表 表7-2 立体声音响设备商店的广告次数与销售额相关表,7,二、双变量相关关系的测度方法,(二)相关图法,8,二、双变量相关关系的测度方法,图7-1 立体声音响设备商店数据散点图,(三)相关系数法 相关系数是用以衡量两变量间线性相关关系情况下,相关方向和密切程度的相对数。,9,二、双变量相关关系的测度方法,1.相关系数的计算 样本相关系数的定义公式,10,二、双变量相关关系的测度方法,(7.1),11,样本数据的简

3、捷公式,12,总体数据的相关系数,7-2 根据表7-2相关数据,利用样本数据计算相关系数。,13,2.相关系数的应用a.相关系数的取值范围 的取值在-1和1之间,即 b.正负相关的判断 当 0时为正相关;当 0时为负相关。,14,c.相关密切程度的判断 当 时,相关关系越密切,当 说明X与Y之间完全相关,即函数关系;当 时,相关关系越不密切,当=0,说明X与Y之间不存在直线相关关系,但也许存在非线性相关关系。,15,在做具体判断时,有几个数量标准:,称为微弱相关。一般情况下,将其视为没有线性相关关系;0.3,称为低度相关;0.5,称为显著相关;0.8,称为高度相关。,16,计算结果表明,歌乐立

4、体音响设备商店在过去10周内,周末所做的广告次数与下一周的销售额之间存在着高度线性正相关关系。,17,对上面计算结果的统计分析,18,第二节 简单线性回归模型,只涉及两个变量(一个自变量和一个因变量)之间关系的回归分析称为简单回归分析。两个变量之间的关系大约呈一条直线的简单回归分析称为简单线性回归分析。,19,用回归分析可以预测运行一条商业航空线的成本吗?如果可以,那么哪些变量与这一成本有关呢?,20,一、从一个实际问题入手,21,飞机运行成本,飞机型号,飞行距离,乘客数量,行李或货物重量,天气状况,为了减少自变量个数,我们做如下假定:飞机类别波音737飞机 飞行距离500公里 航线可比,而且

5、在每年的相同季节 在这种条件下,可以用乘客数来预测飞行的成本吗?,22,表7-3是每年相同季节波音737飞机在12条500公里的不同航线不同乘客数时的飞行成本。我们用这些数据以乘客数作为自变量构造模型来预测成本。,23,24,(7.4),25,二、回归模型和回归方程,:因变量(随机变量),:自变量(给定变量),:参数,:误差项(随机变量),含义为说明在 中不能被 和 之间线性关系解释的变异性。,在有关 假设中,有一个假设就是的期望值或均值等于0,即,26,(7.5),如果简单线性回归模型满足了这个条件,那么就意味着 的均值或期望值就是一个线性函数。,描述 的均值与 的关系如何的方程称为回归方程

6、。,在简单线性回归中 1.回归方程的图形是一条直线(如图7.3所示);,27,(7.6),28,3.:斜率(回归系数);,29,2.:的截距;,的含义:当自变量 给定一个具体变动值时,因变量 平均变化的量。,30,31,估计回归方程 就是用样本统计量作为参数的估计值所建立的回归方程。,32,三、估计回归方程,(7.7),:的估计值,:的估计值,:的估计值,33,最小平方法,也称最小二乘法,是将回归模型的方差之和最小化,以得到一系列方程,从这些方程中解出模型中需要的参数的一种方法。,34,四、最小平方法,(一)画散点图,以初步观察成本与乘客数量之间是否呈回归直线。,35,(二)建立估计回归方程,

7、36,(7.8),最小平方法运用样本数据求出 和 的值,使得因变量的实际观察值 与其估计值 之差的平方和最小,即,(7.9),(三)估计回归方程斜率和截距的计算公式,37,(7.11),38,39,40,41,(四)将 和 的计算结果代入式(7.8)有:,计算结果表明,在其他条件相同情况下,12条航线上波音737飞机各条航线每次飞行时每增加1名乘客,将会使飞行成本平均增加40.70元。,结论:,42,*Y=4.48千元二者差0.061千元或61元。,测定系数估计标准误差,43,五、一元线性回归方程的评价,(一)测定系数 回归直线与各观测数据的接近程度称为回归直线的拟合优度。度量回归直线的拟合优

8、度最常用的指标是测定系数,(又称可决系数、判定系数)。该指标是建立在对总离差平方和进行分解的基础之上的。,44,45,离差分解图,两端平方后求和有,46,离差平方和的分解,(7.12),(7.13),(7.14),R2的取值范围是0,1。R2越接近于1,表明回归平方和占总离差平方和的比例越大,回归直线与各观测点越接近,回归直线的拟合程度就越好。在一元线性回归中,相关系数r的平方等于判定系数,符号与自变量x的系数一致。因此可以根据回归结果求出相关系数。,47,决定系数的取值,1.残差 残差是因变量的观察值y和因变量的估计值 之间的偏差。,48,例如,上面的例子,,(7.15),49,表7-5残差

9、计算表,残差平方的总和称为误差平方和(SSE)。,50,2.误差平方和,(7.16),SSE的值是用估计回归方程估计样本中因变量的值时所产生误差的一种测度。,因变量的值与其均值之间离差的平方和称为总离差平方和(SST)。,51,3.总离差平方和,(7.17),因变量的值与其估计值之间离差的平方和称为回归平方和(SSR)。,52,4.回归平方和,(7.18),表7-6 计算表,53,例如;飞行成本案例中各种有关数据计算如下,由表7-6计算结果可知,SSE=0.31434,SSR=2.79775,SST=3.11209,则,54,这就是说,在一条商业航线上一架波音737飞机飞行成本的方差中有89.

10、9%可以被乘客数目说明或预测,换句话说,飞行成本Y的方差中不能由X或回归方程解释的有10.1%。,55,估计标准误:是对各观测数据在回归直线周围分散程度的一个度量值,它是对误差项的标准差的估计。估计标准误反映了用估计的回归方程拟合因变量Y时平均误差的大小。各观测数据越靠近回归直线,sy 就越小,回归直线对各观测数据的代表性就越好。与R2不同的是,估计标准误是一个有单位的平均数。,56,(二)估计标准误,(7.19),在飞行成本的案例中:sse=0.31414 n=12,57,【统计分析】计算结果表明,在12条商业航线上,每架波音737飞机在飞行500公里和其他条件相同情况下,其飞行成本与它们的平均飞行成本平均相差117.3元。,计算结果表明,波音737飞机在相同季节12条航线上,乘客数量与运行成本之间存在线性高度的正相关关系。,58,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号