预防医学考研资料--山大协和版----两变量关联性分析101201.ppt

上传人:小飞机 文档编号:6165799 上传时间:2023-10-01 格式:PPT 页数:34 大小:1.16MB
返回 下载 相关 举报
预防医学考研资料--山大协和版----两变量关联性分析101201.ppt_第1页
第1页 / 共34页
预防医学考研资料--山大协和版----两变量关联性分析101201.ppt_第2页
第2页 / 共34页
预防医学考研资料--山大协和版----两变量关联性分析101201.ppt_第3页
第3页 / 共34页
预防医学考研资料--山大协和版----两变量关联性分析101201.ppt_第4页
第4页 / 共34页
预防医学考研资料--山大协和版----两变量关联性分析101201.ppt_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《预防医学考研资料--山大协和版----两变量关联性分析101201.ppt》由会员分享,可在线阅读,更多相关《预防医学考研资料--山大协和版----两变量关联性分析101201.ppt(34页珍藏版)》请在三一办公上搜索。

1、第11章 两变量关联性分析,学习目标1.熟悉用散点图确定两定量变量之间有否线性关系;2.掌握直线相关、相关分析、相关系数及相关系数的 假设检验;3.熟悉两分类变量的关联性分析基本步骤。,一、线性相关(Linear correlation),1.相关:研究的两个变量之间的相互关系。,(1)因果关系:,(2)共变关系:,(3)相关关系:,(1)相关系数:描述两个变量之间有无相关、相关方向及其密切程度的指标。样本相关系数用符号r表示;总体相关系数用符号表示。相关系数的取值范围:-1r 1直线相关:两个变量在散点图上呈现直线趋势。相关分析:用合适的统计量研究两变量是否存在相关关系、相关方向及密切程度的

2、方法和过程。,2.相关系数(coefficient of correlation),(2)相关系数的特点:,A.相关系数是无量纲值;B.相关系数r取值范围介于-1和+1之间;C.相关系数的“+”、“-”表示变量间的相关方向;D.r=+1完全正相关;r=-1完全负相关;r=0无相关;E.相关系数取值的大小表示相关的密切程度;F.相关系数r由样本数据得来,需要假设检验。,4.直线相关:,(1).直线相关(linear correlation)或Pearson积差相关,指两变量的关系在散点图上呈现直线趋势,用于描述两个变量线性相关的方向、密切程度。样本积差相关系数用r表示;总体积差相关系数用表示。,

3、A.要求数据成对出现;B.双变量为连续性变量;C.双变量正态分布;D.变量之间是线性关系。,(2).直线相关适用的资料:,(3).积差相关系数的计算:,计算相关系数需要计算的基础统计量:,由样本数据计算得到的相关系数r,只是总体相关系数的估计值,需要对总体相关系数是否等于零进行假设检验才能判定两个变量之间是不是存在相关性。检验方法:查r界值表法 t检验法,5.直线相关系数的统计推断,(1).查表法:根据自由度=n-2,查r界值表(附表13),比较|r|与r界值的大小,判断P值。|r|越大,P值越小。,(2).t 检验法:,r的标准误,本例 n=10,r=0.7919,=n-2=8,查r界值表得

4、:r0.05,8=0.632,P0.05。,建立假设,确定检验水准:,本例 n=10,r=0.7919,=n-2=8,t0.05,8=2.306,P0.05。拒绝H0,接受H1,可以认为两变量存在相关关系,即身高和体重之间存在正向相关关系。,H0:=0;H1:0;=0.05,相关系数的假设检验,P0.05,可以认为健康妇女的基础代谢和体重之间存在正向相关关系。相关的密切程度要用总体相关系数的置信区间来估计。,相关系数r的转换:tanh-1 反双曲正切函数,可以证明,Z近似地服从均数为,标准差为 的正态分布。我们可以计算的1-的置信区间。,的1-=95%的置信区间为:z=1.9996,Z0.05

5、/2=1.96,带入公式得(1.4086,2.5906)。,将Z=1.4086和Z=2.5906带入得:,95%CI:(0.8872,0.9888),6、直线相关应用中的注意事项:,(1)样本相关系数接近零并不意味着两变量无相关;(2)一个变量的数值人为设定时莫作相关;(3)出现异常值时慎用相关;P211 图11-3(a)(4)相关未必真有内在联系;(5)分层资料盲目合并易出现假象。图11-3(b、c、d),思考题,1.Pearson 积差相关系数r的假设检验无统计学意义,是否意味着两变量之间一定没有关系?2.Pearson 积差相关系数r的假设检验有统计学意义,P 值很小,是否意味着两变量之

6、间有很强的线性关系?,二、秩相关(rank correlation),1.等级相关:指双变量等级数据的直线相关分析,用于描述两个等级变量线性相关的方向、密切程度,常用的是Spearman 等级相关。样本等级相关系数用rS表示,总体等级相关系数用S表示。,(1)双变量计量数据不服从正态分布;(2)双变量等级数据;(3)双变量资料分布类型不清;(4)变量之间是直线关系。,2.等级相关的适用资料:,表11-2 急性白血病患儿的血小板(109/L)和出血症状,3.等级相关系数的计算:,假设检验:n50时,可查rs临界值表,若秩相关系数超过临界值,则拒绝H0;当 n50时,也可采用t检验。本例rs=-0

7、.422,查 rs临界值表,r0.1,12=0.5303,按=0.05的水准,不能拒绝H0,可以认为急性白血病患儿的出血症状与血小板数之间无相关关系。,4、秩相关系数的统计推断,三、分类变量的关联性分析,对定性变量之间的联系通用的方法是根据两个定性变量交叉分类计数所得的频数资料(列联表)作关联性分析,即关于两种属性独立性的卡方检验。交叉分类资料的独立性检验与两独立样本频数的假设检验计算公式相同,但是研究目的、设计方案、数据结构、结果解释是不一样的。,1.交叉分类22表的关联分析,例11-6 为观察婴儿腹泻是否与喂养方式有关,某医院儿科随机收集了消化不良的婴儿82例,对每个个体分别观察腹泻与否和

8、喂养方式两种属性,22种结果分类记述如表11-3所示,试分析两种属性的关联性。,表11-3 婴儿腹泻与喂养方式的关系,假设检验:H0:喂养方式与婴儿腹泻之间相互独立 H1:喂养方式与婴儿腹泻之间有关联=0.05,按照=0.05水准,拒绝H0,说明婴儿腹泻与喂养方式之间存在关联性。,婴儿腹泻与喂养方式之间存在关联性,可以用列联系数来描述。,2.22配对资料的关联性分析,例11-7 有56份咽喉涂抹标本,把每份标本一分为二,依同样的条件分别接种于甲乙两种白喉杆菌培养基上,观察白喉菌生长的情况,结果如表11-5,问两种培养基的结果有无关联?,表11-5 两种白喉杆菌培养结果,假设检验 H0:两种培养

9、基的结果之间互相独立 H1:两种培养基的结果之间有关联=0.05,按照=0.05水准,有理由拒绝H0,可以认为甲、乙两种培养基之间存在关联性。,3.RC表分类资料的关联性分析,例11-8某地居民主要有三种祖籍,均流行甲状腺肿。为探索甲状腺肿类型与祖籍是否有关联,现根据居民甲状腺肿筛查结果,按甲状腺肿类型与祖籍两种属性交叉分类,得表11-6的资料。问甲状腺肿类型与祖籍见有否关联?,表11-6 某地居民按甲状腺肿类型与祖籍两种属性的交叉分类表,假设检验 H0:甲状腺类型与祖籍无关 H1:甲状腺类型与祖籍有关联=0.05,按照自由度=(R-1)(C-1)=4查得:按照=0.05水准,有理由拒绝H0,甲状腺肿类型与祖籍之间有关联性。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号