两变量的关联性分析.ppt

上传人:小飞机 文档编号:6533564 上传时间:2023-11-09 格式:PPT 页数:59 大小:852KB
返回 下载 相关 举报
两变量的关联性分析.ppt_第1页
第1页 / 共59页
两变量的关联性分析.ppt_第2页
第2页 / 共59页
两变量的关联性分析.ppt_第3页
第3页 / 共59页
两变量的关联性分析.ppt_第4页
第4页 / 共59页
两变量的关联性分析.ppt_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《两变量的关联性分析.ppt》由会员分享,可在线阅读,更多相关《两变量的关联性分析.ppt(59页珍藏版)》请在三一办公上搜索。

1、Health statistics,卫生统计学,-两变量关联性分析,统计方法回顾,身高凝血酶浓度,t 检验 两个总体均数相等,方差分析 多个总体均数相等,上网时间满意度,婴儿腹泻ABO血型,研究目的:组间比较,秩和检验 两个(多个)总体中位数相等,研究目的:两随机变量间的关系,上网时间和考试分数的关系收入和生活满意度的关系,婴儿腹泻和婴儿喂养方式的关系ABO血型和MN血型的关系,线性相关(双变量正态分布资料),秩相关(偏峰分布、分布未知、等级资料),分类变量的关联性分析(二分类和无序多分类资料),身高和体重的关系凝血酶浓度和凝血时间的关系,线性相关(linear Correlation)秩相关

2、(rank correlation)分类变量的关联性分析,outline,线性相关(linear Correlation),Karl Pearson 1857-1936,Sir Francis Galton 1822-1911,线性相关,研究两个随机变量间有无直线相关关系,相关的方向及密切程度。条件:双变量正态分布,散点图,相关系数,X,Y,正相关(Positive Correlation),X,Y,负相关(Negative Correlation),X,Y,非线性相关,X,Y,零相关(zero Correlation),线性相关系数,Pearson积差相关系数 描述两个变量间相关关系的密切程

3、度与相关方向的指标。r:样本相关系数:总体相关系数,线性相关系数,去单位,Y 的离均差平方和:,X 的离均差平方和:,X与Y 间的离均差积和:,线性相关系数的计算,相关系数的性质,方向(direction)r0为正相关;r0为负相关;r=0为零相关。大小(strength)r越接近于,说明相关性越好;r越接近于,说明相关性越弱。,例11-1 随机抽取1名健康成人,测定血液的凝血酶浓度(单位/毫升)及凝固时间,数据如表11-1所示。据此数据如何判断这两项指标间有否相关?,表11115名健康成人凝血时间与凝血酶浓度测量值记录,凝血酶浓度(毫升),凝血时间(秒),2,3,3,图1 15例健康成人的凝

4、血酶浓度和凝血时间散点图,1.画散点图,线性相关?,2.计算线性相关系数,负相关,Question:Whether=0 or not?,X,Y,3.相关系数的假设检验,3.相关系数的假设检验,查表法:r界值表(附表13)t检验,建立检验假设,确定检验水准 H0:凝血酶浓度与凝血时间无直线相关关系,即0H1:凝血酶浓度与凝血时间有直线相关关系,即0=0.05,相关系数的假设检验,查表法 t 检验法,计算检验统计量,确定p值,相关系数的假设检验,相关系数的假设检验查表法,r 界值表,r=-0.926,v=15-2=13,P0.05,本例,相关系数的假设检验t 检验,0,0.025,0.025,-2

5、.16,2.16,-8.874,8.874,作出统计推断结论 P0.05,按=0.05检验水准拒绝H0,差别有统计学意义,可认为凝血酶浓度与凝血时间之间存在线性相关。,相关系数的假设检验,线性相关分析,画散点图:判断有无线性趋势计算线性相关系数:相关性大小和方向线性相关系数的假设检验:根据样本相关系数r推断总体相关系数,线性相关应用中应注意的问题1,散点图的重要性,r=0.816,线性相关应用中应注意的问题2,要求两变量都是随机变量,且为双变量正态分布资料。,r=0.08,r=0.85,线性相关应用中应注意的问题3,出现异常点时慎用相关,线性相关应用中应注意的问题4,相关未必是因果关系,线性相

6、关应用中应注意的问题5,分层资料盲目合并易出假象,(a),(b),(c),线性相关(linear Correlation)秩相关(rank correlation)分类变量的关联性分析,outline,秩相关,也称等级相关,最常用的Spearman秩相关。资料类型 不服从正态分布的资料 总体分布未知的资料 等级资料原理 利用两变量的秩次作线性相关分析,对原变量的分布不作要求,属非参数统计方法。,例11-4 某地研究岁急性白血病患儿的血小板数与出血症状程度之间的相关性,结果见表11-2,试用秩相关进行分析。,秩相关分析,编秩计算lpp、lqq、lpq 计算Spearman秩相关系数或等级相关系数

7、,用rs表示。,负相关?,Spearman秩相关系数,说明两个变量间相关的密切程度与方向;样本相关系数:rs 总体相关系数:取值介于-11之间 rs 0为正相关。,秩相关系数的假设检验,查表法:rs界值表(附表14)t检验,秩相关系数的假设检验-查表法,建立假设,确定检验水准 H0:s0,出血症状与血小板数之间无相关关系 H1:s0,出血症状与血小板数之间有相关关系=0.05查rs界值表(附表14):r=-0.422,|r|=0.422 n=12,r0.05/2,12=0.587确定p值,下结论 P0.05可认为急性白血病患儿的出血症状与血小板数之间无相关关系。,秩相关系数的假设检验查表法,r

8、s 界值表,秩相关系数的假设检验t 检验,Pearson积差相关与Spearman秩相关的区别与联系,a.计算线性相关系数r=0.930,你可以得出变量x,y相关吗?请解释b.请画散点图c.使用线性相关系数描述相关性合适吗?请解释,思考1,r=0.930,思考2,线性相关(linear Correlation)秩相关(rank correlation)分类变量的关联性分析,outline,分类变量的关联性分析,交叉分类22表资料的关联分析 22配对资料的关联性分析 RC表分类资料的关联性分析,例11-6 为观察婴儿腹泻是否与喂养方式有关,某医院儿科随机收集了消化不良的婴儿82例,对每个个体分别

9、观察腹泻与否和喂养方式两种属性,22种结果分类记数如表11-3所示。试分析两种属性的关联性。,一个样本,联合概率,边际概率,两属性X和Y互相独立:属性X的概率分布与属性Y的概率分布无关,在交叉分类表中每一格子中联合概率等于相应属性的边际概率的乘积:,建立假设,确定检验水准 H0:喂养方式与婴儿腹泻之间互相独立 H1:喂养方式与婴儿腹泻之间有关联=0.05计算检验统计量:确定P值,下结论 p0.05,说明婴儿腹泻与喂养方式之间存在着关联性。计算Pearson列联系数:,假设检验?,例11-7 有56份咽喉涂抹标本,把每份标本一分为二,依同样的条件分别接种于甲、乙两种白喉杆菌培养基上,观察白喉杆菌

10、生长的情况,结果如表11-5,问两种培养基的结果有无关联?,配对资料,建立假设,确定检验水准 H0:两种培养基的结果之间互相独立 H1:两种培养基的结果之间互相关联=0.05计算检验统计量:确定P值,下结论 p0.05,可认为甲、乙两种培养基之间存在关联性。计算列联系数:,例11-8 某地居民主要有三种祖籍,均流行甲状腺肿。为探讨甲状腺肿类型与祖籍是否有关联,现根据居民甲状腺肿筛查结果,按甲状腺肿类型与祖籍两种属性交叉分类,得表11-6的资料。问甲状腺肿类型与祖籍间有否关联?,33表,一个样本,建立假设,确定检验水准 H0:甲状腺肿类型与祖籍无关 H1:甲状腺肿类型与祖籍有关联=0.05计算检

11、验统计量:v=(3-1)(3-1)=4(x20.05,4=9.49)确定P值,下结论 p0.05,可认为甲状腺肿类型与祖籍有关联性。计算列联系数:,分类变量的关联性分析,交叉分类22表资料的关联分析 22配对资料的关联性分析 RC表分类资料的关联性分析,分类资料的关联性分析与概率分布的假设检验,相同:检验公式 理论频数计算公式 自由度计算公式不同:研究目的 结果的解释 设计方案,小结,对服从正态分布的两随机变量,可绘制散点图,发现有线性趋势之后,进而计算Pearson相关系数,以此描述两变量的线性相关性;对不满足正态分布的两随机变量,仍可绘制散点图,发现有递增或递降趋势之后,可采用Spearman秩相关系数来描述两变量的线性相关性;对两个反映属性的分类变量,若有一份随机样本,可作交叉分类的频数表,利用关于独立性的x2检验和列联系数来描述关联性。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号