多重线性回归相关.ppt

上传人:sccc 文档编号:5629998 上传时间:2023-08-03 格式:PPT 页数:24 大小:421.51KB
返回 下载 相关 举报
多重线性回归相关.ppt_第1页
第1页 / 共24页
多重线性回归相关.ppt_第2页
第2页 / 共24页
多重线性回归相关.ppt_第3页
第3页 / 共24页
多重线性回归相关.ppt_第4页
第4页 / 共24页
多重线性回归相关.ppt_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《多重线性回归相关.ppt》由会员分享,可在线阅读,更多相关《多重线性回归相关.ppt(24页珍藏版)》请在三一办公上搜索。

1、多重线性回归与相关,多因素分析的优点:(1)资料易收集;(2)可同时研究多个因素;(3)既可考察各因素的独立作用,又可研究因素间的交互作用;,第一节 多重线性回归的概念,多重线性回归是研究一个应变量与多个自变量之间线性依存关系的统计方法,是一元直线回归分析的推广。,式中b0是常数项,bi(i1,2,m)称为偏回归系数。,b0是常数项,是各自变量都等于0时,应变量的估计值。有时,人们称它为本底值。b1,b2,bp是偏回归系数(pertial regression coefficient),其统计学意义是在其它所有自变量不变的情况下,某一自变量每变化一个单位,应变量平均变化的单位数。,与直线回归一

2、样,建立多重回归方程常用最小二乘法(least square method)原理求bi(i1,2,m),再求b0,即求出使估计值 与观测值y之间差异的平方和 达到最小的一组解作为bi的估计值。,多重线性回归模型的前提条件,1.线性(linear)2.独立(independent)3.正态(normal)4.等方差性(equal variance),例1 同样身高的20名健康男子的收缩压(kPa)、年龄(岁)和体重之间的多元线性回归方程。,编号 收缩压 年龄 体重 y x1 x2 1 15.60 50 76.0 2 18.80 20 91.5 3 16.53 20 85.5 4 16.80 30

3、 82.5 5 15.60 30 79.0 6 16.67 50 80.5 7 16.40 60 79.0 8 16.67 50 79.0 9 17.60 40 85.0 10 16.40 50 76.5,表1 20名健康男子的收缩压、年龄和体重测定值,n20,X1=44.05,X2=82.80,Y=17.82Y=356.35,X1=881,X2=1656.0,X12=41467,X22=137953.5,Y2=6408.2049,X1Y=15788.50,X2Y=29653.27,X1X2=72669.5,由样本计算得到得偏回归系数bi是总体偏回归系数i的估计值,即使总体偏回归系数等于0,但

4、由于抽样误差,仍可使样本偏回归系数bi不等于0,因此仍要作假设检验,以判断其是否有统计学意义。假设检验包括方程的假设检验和每个偏回归系数的假设检验。(一)多元回归方程的假设检验1.建立假设和确定检验水准:H0:1=2=3=m0 H1:1、2、3、m不全为0=0.05,假设检验,总=n-1 回归=m 剩余=n-m-1,SS误差=SS总-SS回归,总=20-119 回归=2 剩余=20-2-117,SS误差=SS总-SS回归25.2829,n20,X1=44.05,X2=82.80,Y=17.82Y=356.35,X1=881,X2=1656.0,X12=41467,X22=137953.5,Y2

5、=6408.2049,X1Y=15788.50,X2Y=29653.27,X1X2=72669.5,查F界值表得:F0.05(2,17)3.59,F F0.05(2,17),P0.05,因此在=0.05水平上,拒绝H0,可以认为收缩压与年龄和体重之间有回归关系,所建立的回归方程有意义。,(二)回归系数的假设检验1.建立假设和确定检验水准:H0:i=0 H1:i0=0.052.计算统计量t,查t界值表得:t0.05(17)2.110,t1 t0.05(17),P0.05,因此在=0.05水平上,拒绝H0,可以认为收缩压与年龄之间有线性回归关系。,查t界值表得:t0.05(17)2.110,t2

6、t0.05(17),P0.05,因此在=0.05水平上,拒绝H0,可以认为收缩压与体重之间有线性回归关系。,因为m个自变量都具有各自的计量单位以及不同的变异度,所以不能直接用偏回归系数的数值大小来反映方程中各个自变量对应变量Y的贡献大小。为此,可计算标准化回归系数。,标准化回归系数,复相关系数,R2称为决定系数,可定量评价y的总变异能被自变量解释的比重。,偏相关系数,扣除其他变量的影响后,变量y与x的相关,称为y与x的偏相关系数。如:r12.3,在一个有统计学意义的方程中,可能某些自变量对应变量影响较大,而另一些影响很弱甚至完全没有意义。为使回归方程中仅包含有意义的自变量,有必要对偏回归系数作

7、检验和进行自变量筛选。,自变量筛选的常用方法1.所有可能自变量子集选择;2.向前选择法;3.向后剔除法;4.逐步选择法,自变量筛选的原则:残差均方缩小或调整决定系数(Ra2)增大。,多重线性回归的注意事项:1.自变量必须是相互独立的;2.自变量的联合作用;3.样本含量;4.正确看待选入和未选入的自变量。,多重共线性问题及对策:多重共线性指的是自变量间存在着近似的线性关系,即某个自变量可以近似地用其他自变量的线性函数来描述。对策:1.增大样本量;2.采用多种自变量筛选方法相结合的方式;3.因子分析和主成分分析;4.通径分析;5.岭回归分析;6.从专业和实际角度,去除次要的、缺失值较多、测量误差较大的共线性因子。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号