双变量相关与回归.ppt

上传人:牧羊曲112 文档编号:6554786 上传时间:2023-11-12 格式:PPT 页数:20 大小:253KB
返回 下载 相关 举报
双变量相关与回归.ppt_第1页
第1页 / 共20页
双变量相关与回归.ppt_第2页
第2页 / 共20页
双变量相关与回归.ppt_第3页
第3页 / 共20页
双变量相关与回归.ppt_第4页
第4页 / 共20页
双变量相关与回归.ppt_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《双变量相关与回归.ppt》由会员分享,可在线阅读,更多相关《双变量相关与回归.ppt(20页珍藏版)》请在三一办公上搜索。

1、2023/11/12,1,第九章 双变量相关与回归 Bivariate Correlation and Regression,医 学 统 计 学,萨 建Department of Health Statistics,Public Health School,ShanXi Medical UniversityOffice:Email:,2023/11/12,2,医 学 统 计 学,医学上,许多现象之间也都有相互联系,例如:身高与体重、体温与脉搏、产前检查与婴儿体重、乙肝病毒与乙肝等。在这些有关系的现象中,它们之间联系的程度和性质也各不相同。这里,体温和脉搏的关系就比产前检查与婴儿体重之间的关系密

2、切得多,而体重和身高的关系则介与二者之间。另外,可以说乙肝病毒感染是前因,得了乙肝是后果,乙肝病毒和乙肝之间是因果关系;但是,有的现象之间因果不清,只是伴随关系,例如丈夫的身高和妻子的身高之间,就不能说有因果关系。相关与回归就是用于研究和解释两个变量之间相互关系的。,2023/11/12,3,一、简单线性回归,回归分析是研究一个变量(Y)和另外一个或一些变量(X)间线性依存关系的统计分析方法。如在青少年生长发育研究中体重随着身高的增长而增长,按专业知识,描述两个变量的数量变化关系,宜将体重作为应变量(dependent variable),身高作为自变量(independent variabl

3、e)。依存关系简单线性回归(simple linear regression)一个X多重线性回归(multiple linear regression)多个X,医 学 统 计 学,2023/11/12,4,采用线性回归分析可以解决以下几方面的问题:1、探讨体重是否随身高的增长而增加?2、体重与身高的关系呈直线还是曲线关系?3、如何采用回归方程定量地描述两者间的关系?4、该地15岁男童身高每增加1厘米,体重平均增加多少公斤?5、所建回归方程是否成立?即两变量间线性依存关系是否存在?6、如何由身高预测该地15岁男童的体重?,医 学 统 计 学,一、简单线性回归,2023/11/12,5,散点图在做

4、回归或者相关分析以前,对数据必须要做散点图!为了确定相关变量之间的关系,首先应该收集一些数据,这些数据应该是成对的。例如,每人的身高和体重。然后在直角坐标系上描述这些点,这一组点集称为散点图。,医 学 统 计 学,一、简单线性回归,2023/11/12,6,医 学 统 计 学,一、简单线性回归,由图9-1可见,体重随身高的增加而递增,并呈直线增长趋势。但身高相同者未必有相同的体重,说明体重除了受身高的影响之外,还可能受到一些未知的,诸如营养、生活方式、遗传等因素的影响。因此,回归分析所描述的两个变量间的关系,不全是一一对应的函数关系(确定性关系),而是一种非确定性关系。,2023/11/12,

5、7,实际应用中采用简单线性回归模型来定量描述应变量与自变量之间的数量关系。总体线性回归方程记作 为总体回归系数(regression coefficient),即直线的斜率,其统计学意义是X每增加(或减少)一个单位,Y平均改变个单位(即Y的均数改变个单位)。表示Y随X改变的平均变化量,0,表明Y随X的增加而增加;0,表明Y随X的增加而减少;=0,表明Y与X无线性回归关系。为回归直线在轴上的截距(intercept),其统计学意义为X取值为0时,方程所估计值Y的平均水平。截距的解释一定要符合专业实际。,医 学 统 计 学,一、简单线性回归,2023/11/12,8,设a和b是和的估计值,则可拟合

6、得到样本线性回归方程 表示x取某定值时相应总体均数Y的点估计值,b称为样本回归系数,也是有单位,有符号的。其回归方程满足三个基本性质:为最小;回归直线必然通过中心点。其中()称为残差(residual)。,医 学 统 计 学,一、简单线性回归,2023/11/12,9,回归方程的估计:最小二乘法(保证回归方程满足三个基本性质)保证各实测点至直线的纵向距离()的平方和,即残差平方和 最小。考查回归直线是否正确的方法:1、回归直线必然通过中心点 2,将回归直线左端延长与Y轴相交,交点纵坐标为截距3,要注意,直线只能在实测范围内应用,不能随意延长!,医 学 统 计 学,一、简单线性回归,2023/1

7、1/12,10,回归分析的统计推断 Y变异的分解,医 学 统 计 学,一、简单线性回归,2023/11/12,11,总体回归系数的假设检验t检验 注意:在简单线性回归模型中,由于只有一个自变量,回归模型的方差分析等价于对回归系数的检验,且t。另外,对回归系数的假设检验还有一种方法,即对相关系数作假设检验,在第二节讲到!,医 学 统 计 学,一、简单线性回归,2023/11/12,12,拟合优度检验与决定系数 回归系数大小和两个变量的单位及大小有关,回归系数越大,说明Y随X的变化越快,但并不表明影响越大。为描述这种影响的大小以及回归方程拟合效果的好坏,引入决定系数(coefficient of

8、determination)的概念。决定系数是简单线性回归与多重线性回归分析中一个重要的统计量,通常用R2表示。因SS回归SS总,所以取值在0到1之间。它的大小反映了自变量对回归的贡献,说明在的总变异中用、回归关系所能解释的比重。决定系数越趋近于1,回归方程的拟合效果越好,因此,常把它作为评价回归方程效果,反映拟合优度的指标。,医 学 统 计 学,一、简单线性回归,2023/11/12,13,回归分析的前提条件(LINE)线性(linear)独立性(independence)正态性(normality)等方差(equal variance)简单线性回归分析应用(预测与控制)利用回归方程进行预测

9、预报 X Y 注意:均数的可信区间与个体值容许区间的意义不同。利用回归方程进行统计控制 Y X不论预测或控制,都不能超出给出数据的范围!,医 学 统 计 学,一、简单线性回归,2023/11/12,14,简单线性回归分析可以告诉我们应变量Y随自变量X变化而变化的情况,研究的是变量之间的依存关系;但并未告诉我们二者间关系的密切程度。若要了解两随机变量间线性关系的程度与方向,就需进行简单相关分析,也称直线相关分析。相关分析中,变量无自变量和应变量之分,它只研究任两个变量之间相关关系的程度和性质,变量间的地位是平等的,这是回归分析与相关分析区别的关键,但二者又有着密切的联系。,医 学 统 计 学,二

10、、简单线性相关,2023/11/12,15,正相关 负相关 零相关完全正相关 完全负相关,医 学 统 计 学,二、简单线性相关,2023/11/12,16,若两变量X与Y呈双变量正态分布,散点图呈线性趋势,且各观察值之间相互独立,则两变量之间的相关关系可采用Pearson积差相关系数表示,简称简相关系数。样本相关系数用r表示,总体相关系数用表示。其取值范围1r1,一般地,r接近1表示两变量间正向线性关联程度较高;r接近-1表示两变量间负向线性关联程度较高;r接近0表示两变量间线性关联极弱,或无线性关联存在。,医 学 统 计 学,二、简单线性相关,2023/11/12,17,相关系数的统计推断

11、1t检验对同一份资料,对总体相关系数做假设检验的t值与前面对总体回归系数作假设检验的t值相等,由于Sb较难计算而Sr计算简单,故对同一资料可通过计算tr来代替tb计算,这也就是前面所说的回归系数假设检验的第三种方法。tb=tr2查表法,医 学 统 计 学,二、简单线性相关,2023/11/12,18,当资料服从双变量正态分布时,采用第二节介绍的相关分析。若资料不服从双变量正态分布,或数据为等级资料,或者分布型未知时,宜采用本节介绍的等级相关分析,也称秩相关分析,采用Spearman秩相关系数来表示两变量间相关关系的密切程度和相关方向。样本Spearman相关系数用rs表示总体Spearman相关系数用s表示,医 学 统 计 学,三、秩相关,2023/11/12,19,与Pearson相关相比,Spearman秩相关只是多了一步:对原始数据排秩次。然后利用秩次进行Pearson相关分析。具体的相关系数计算与统计推断完全一致。,医 学 统 计 学,三、秩相关,2023/11/12,20,1、回归与相关的区别与联系 区别:6点 联系:4点2、注意事项 先绘制散点图;异常点识别与处理;曲线回归;残差分析与残差图;资料分层要慎重;相关的意义,医 学 统 计 学,四、回归与相关的注意事项,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号