《第5章t检验ppt课件.ppt》由会员分享,可在线阅读,更多相关《第5章t检验ppt课件.ppt(67页珍藏版)》请在三一办公上搜索。
1、第五章 t 检验(t Test),宁波大学医学院沈其君,t 检验问题提出,假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同;医疗卫生实践中最常见的是计量资料两组比较的问题;t检验(t test,student t test)和u检验(u test)是用于计量资料两组比较的最常用的假设检验方法如两种疗法治疗糖尿病的疗效比较,25例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食疗法,二个月后测空腹血糖(mmol/L)问两种疗法治疗后患者血糖值是否相同?,药物治疗,药物治疗合并饮食疗法,1,2,n1=12,=15.21,=1
2、0.85,n2=13,甲组,乙组,总体,样本,?,推断,t 检验问题提出,根据研究设计t检验可由三种形式:单个样本的t检验配对样本均数t检验(非独立两样本均数t检验)两个独立样本均数t检验t检验是以t分布为基础的,为便于学习在介绍t检验前先介绍t分布,t分布t值与t分布的引入,X,0,N(,2),N(0,1),样本均数正态分布,观察值正态分布,t分布,标准正态分布,S代替,t分布 特征,不服从标准正态分布,小样本时服从自由度=n-1的t分布 t分布曲线是以0为中心的对称分布自由度较小时,曲线峰的高度低于标准正态曲线,且曲线峰的宽度也较标准正态分布曲线峰狭,尾部面积大于标准正态曲线尾部面积,而且
3、自由度越小,t分布的这种特征越明显(翘尾低狭峰),t分布 特征,自由度越大,t分布越接近于正态分布;当自由度逼近时,t分布趋向于标准正态分布。自由度不同,曲线形态不同,t分布是一簇曲线。,概率、自由度与t值关系 t界值,标准正态分布中u值大小与尾部面积(概率)有关,以(单侧)和u/2(双侧)表示;在t分布中,当自由度一定时越小,|t|越大;在一定时,自由度越小,|t|越大,大于u值在t分布中,t值与、的大小有关;在单侧时(尾部面积取单侧)t 界值表示为t,双侧时表示为t/2,,其意义为,一定自由度和概率下的 t值t,,t/2,可通过查t界值表附表获得;例如=9,单侧=0.05,查附表得单侧 t
4、0.05,9=1.833自由度n-135-134,查附表2,得t0.05/2,34=2.032,概率、自由度与t值关系 t界值,第一节单个样本t检验,又称单样本均数t检验(one sample t test),适用于样本均数与已知总体均数0的比较,其比较目的是检验样本均数所代表的总体均数是否与已知总体均数0有差别。已知总体均数0一般为标准值、理论值或经大量观察得到的较稳定的指标值。单样t检验的应用条件是总体标准未知的小样本资料(如n50),且服从正态分布。,单个样本 t 检验原理,已知总体,0,未知总体,样本,在 H0:=0的假定下,可以认为样本是从已知总体中抽取的,根据t分布的原理,单个样本
5、t检验的公式为:,自由度n-1,单个样本t检验实例分析,例5.1 以往通过大规模调查已知某地新生儿出生体重为3.30kg.从该地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重为3.42kg,标准差为0.40kg,问该地难产儿出生体重是否与一般新生儿体重不同?本例已知总体均数0=3.30kg,但总体标准差未知,n=35为小样本,,S=0.40kg,故选用单样本t检验。,单个样本t检验检验步骤,1.建立检验假设,确定检验水准H0:0,该地难产儿与一般新生儿平均出生体重相同;H1:0,该地难产儿与一般新生儿平均出生体重不同;0.05。2.计算检验统计量在=0成立的前提条件下,计算统计量为:,
6、单个样本t检验检验步骤,3.确定P值,做出推断结论本例自由度n-135-134,查附表2,得t0.05/2,34=2.032。因为t t0.05/2,34,故P0.05,表明差异无统计学意义,按 0.05水准不拒绝H0,根据现有样本信息,尚不能认为该地难产儿与一般新生儿平均出生体重不同。,第二节 配对样本均数t检验,配对样本均数t检验简称配对t检验(paired t test),又称非独立两样本均数t检验,适用于配对设计计量资料均数的比较,其比较目的是检验两相关样本均数所代表的未知总体均数是否有差别。配对设计(paired design)是将受试对象按某些重要特征相近的原则配成对子,每对中的两
7、个个体随机地给予两种处理。,配对设计概述,应用配对设计可以减少实验的误差和控制非处理因素,提高统计处理的效率。配对设计处理分配方式主要有三种情况:两个同质受试对象分别接受两种处理,如把同窝、同性别和体重相近的动物配成一对,或把同性别和年龄相近的相同病情病人配成一对;同一受试对象或同一标本的两个部分,随机分配接受两种不同处理,如例5.2资料;自身对比(self-contrast)。即将同一受试对象处理(实验或治疗)前后的结果进行比较,如对高血压患者治疗前后、运动员体育运动前后的某一生理指标进行比较。,配对样本均数t检验原理,配对设计的资料具有对子内数据一一对应的特征,研究者应关心是对子的效应差值
8、而不是各自的效应值。进行配对t检验时,首选应计算各对数据间的差值d,将d作为变量计算均数。配对样本t检验的基本原理是假设两种处理的效应相同,理论上差值d的总体均数d 为0,现有的不等于0差值样本均数可以来自d=0的总体,也可以来d 0的总体。,配对样本均数t检验原理,可将该检验理解为差值样本均数与已知总体均数d(d=0)比较的单样本t检验.其检验统计量为:式中d为每对数据的差值,为差值样本的均数,Sd为差值样本的标准差,为差值样本均数的标准差,即差值样本的标准误,n为配对样本的对子数。,配对样本均数t检验实例分析,例5.2 有12名接种卡介苗的儿童,8周后用两批不同的结核菌素,一批是标准结核菌
9、素,一批是新制结核菌素,分别注射在儿童的前臂,两种结核菌素的皮肤浸润反应平均直径(mm)如表5-1所示,问两种结核菌素的反应性有无差别。,配对样本均数t检验检验步骤,建立检验假设,确定检验水准H0:d=0,两种结核菌素的皮肤浸润反应总体平均直径差异为0;H1:d0,两种结核菌素的皮肤浸润反应总体平均直径差异不为0;0.05。计算检验统计量先计算差值d及d2如上表第四、五列所示,本例d=39,d 2 195。,配对样本均数t检验检验步骤,先计算差数的标准差 计算差值的标准误按公式计算,得:,配对样本均数t检验检验步骤,确定 P 值,作出推断结论自由度计算为=n-1=n-1=12-1=11,查附表
10、2,得t0.05(11)=2.201,t0.01(11)=3.106,本例t t0.01(11),P 0.01,差别有统计学意义,拒绝H0,接受H1,可认为两种方法皮肤浸润反应结果的差别有统计学意义。,第三节 两独立样本t检验,两独立样本t 检验(two independent sample t-test),又称成组 t 检验。适用于完全随机设计的两样本均数的比较,其目的是检验两样本所来自总体的均数是否相等。完全随机设计是将受试对象随机地分配到两组中,每组患者分别接受不同的处理,分析比较处理的效应。,第三节 两独立样本t检验,两独立样本t检验要求两样本所代表的总体服从正态分布N(1,12)和N
11、(2,22),且两总体方差12、22相等,即方差齐性(homogeneity of variance,homoscedasticity)。若两总体方差不等,即方差不齐,可采用t检验,或进行变量变换,或用秩和检验方法处理(见第九章)。,两独立样本t检验原理,两独立样本t检验的检验假设是两总体均数相等,即H0:1=2,也可表述为12=0,这里可将两样本均数的差值看成一个变量样本,就是差值的标准误,则在H0条件下两独立样本均数t检验可视为样本与已知总体均数12=0的单样本t检验,统计量计算公式为,其中,两独立样本t检验原理,Sc2称为合并方差(combined/pooled variance),上述
12、公式可用于已知两样本观察值原始资料时计算,当两样本标准差S1和S2已知时,合并方差Sc2为:,两独立样本t检验实例分析,例5.3 25例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食疗法,二个月后测空腹血糖(mmol/L)如表5-2 所示,问两种疗法治疗后患者血糖值是否相同?,两独立样本t检验检验步骤,建立检验假设,确定检验水准H0:1=2,两种疗法治疗后患者血糖值的总体均数相同;H1:12,两种疗法治疗后患者血糖值的总体均数不同;0.05。计算检验统计量,两独立样本t检验检验步骤,代入公式,得:,两独立样本t检验实例分析,按公式计算,算得:确定P值,作出推断结论两独立样
13、本t检验自由度为=n1+n2-2=12+13-2=23;查t界值表,t0.05(23)=2.069,t0.01(23)=2.807.,两独立样本t检验实例分析,由于 t0.01(23)t t0.05(23),0.01 P 0.05,按0.05的水准拒绝H0,接受H1,差异有统计学意义。故可认为该地两种疗法治疗糖尿病患者二个月后测得的空腹血糖值的均数不同。几何均数资料 t 检验,服从对数正态分布,先作对数变换,再作 t 检验。,t 检验应用条件,两组计量资料小样本比较;样本对总体有较好代表性,对比组间有较好组间均衡性随机抽样和随机分组;样本来自正态分布总体,配对t检验要求差值服从正态分布,实际应
14、用时单峰对称分布也可以;大样本时,用u 检验,且正态性要求可以放宽;两独立样本均数t检验要求方差齐性两组总体方差相等或两样本方差间无显著性。,第四节 方差不齐时两样本均数检验,当两总体方差不等(方差不齐)时,两独立样本均数的比较,可采用检验,亦称近似t检验 方差齐性检验F检验F检验要求资料服从正态分布 检验统计量F值按下列公式计算,n-1,2=n-1,方差齐性检验,为较大的样本方差,为较小的样本方差;检验统计量F值为两个样本方差之比,若样本方差的不同仅为抽样误差的影响,F值一般不会偏离1太远。求得F值后,查附表3(方差齐性检验用的F界值表)得P值。取=0.05水准,若FF0.05(,2),P0
15、.05,拒绝H0,接受H1,可认为两总体方差不等;若FF0.05(,2),P0.05,两总体方差相等。,方差齐性检验实例分析,例5.4 两组小白鼠分别饲以高蛋白和低蛋白饲料,4周后记录小白鼠体重增加量(g)如表5-3所示,问两组动物体重增加量的均数是否相等?,方差齐性检验实例分析,建立检验假设,确定检验水准H0:1222,即高蛋白与低蛋白饲料喂养后小白鼠体重增加量的总体方差相同;H1:1222,即高蛋白与低蛋白饲料喂养后小白鼠体重增加量的总体方差不同;0.05。计算检验统计量,对表的数据计算可得:,方差齐性检验实例分析,按公式计算确定P值,作出统计推论自由度n-1=12-1=11,2=n-1=
16、13-1=12,查附表3F界值表,F0.05(11,12)3.34 F F0.05(11,12)P 0.05差别有统计学意义,方差齐性检验实例分析,按0.05水准,拒绝H0,接受H1 认为两组体重增加量的总体方差不等不可直接用两独立样本均数t 检验而应用检验 t检验,检验,Satterthwaite法近似t检验、Welch法近似t检验和Cochran&Cox法近似t 检验 Cochran&Cox法是对临界值校正 Satterthwaite法和Welch法是对自由度进行校正 介绍Satterthwaite法和Cochran&Cox法,检验,统计量的计算公式为 Cochran&Cox法校正临界值
17、的公式为式中,Satterthwaite法检验的自由度校正公式为 根据自由度查t界值表,作出推断结论 Satterthwaite法是统计软件中普遍使用的方法 对例5.4资料进行检验,检验,t 检验实例分析步骤,建立检验假设,确定检验水准H0:12,即两种饲料小白鼠增重总体均数相同;H1:12,即两种饲料小白鼠增重总体均数不相同;0.05计算检验统计量两总体方差不同,应选用t 检验,t 检验实例分析步骤,确定P值,作出推断结论 按Satterthwaite法计算校正自由度,得,t 检验实例分析步骤,查t界值表,得t0.05(12)2.179,t t0.05(12),P 0.05 按Cochran
18、&Cox法计算校正界值,先查t界值表 得t0.05(11)2.201,t0.05(12)2.179,再按公式计算,t 检验实例分析步骤,确定值得P 0.05两种检验方法所获得的界值虽略有差异,但结论是一致的。按0.05水准,拒绝H0,接受H1,差异有统计学意义。可认为两种饲料饲养后小白鼠增重的均数不同,高蛋白组高于低蛋白组。,第五节 u 检验,根据数理统计的中心极限定理,不论变量X的分布是否服从正态分布,当随机抽样的样本例数足够大,样本均数服从正态分布其中为原来的总体均数,为总体标准差 为均数标准误标准正态变量为,U 检验原理,当总体标准差已知,或样本量较大(如n50)时样本均数与总体均数比较
19、、配对设计样本均数比较和两独立样本均数比较的假设检验,可以计算检验统计量u值 标准正态变量u的界值双侧时,单侧时所计算的统计量u值与这些界值比较,很容易确定P值和作出推断结论,U 检验原理,成组设计的两样本均数比较的统计量u值计算中,两均数差的标准误为统计量u值的计算公式为,U 检验实例分析,例5-4 研究正常人与高血压患者胆固醇含量(mg%)的资料如下,试比较两组血清胆固醇含量有无差别。正常人组 高血压组,U 检验实例分析步骤,建立检验假设,确定检验水平,即正常人与高血压患者血清胆固醇值总体均数相同;,即正常人与高血压患者血清胆固醇值总体均数不同;=0.05,双侧。计算统计量u值将已知数据代
20、入公式,得,U 检验实例分析步骤,确定P值,作出推断结论本例u=10.402.58,故P0.01,按=0.05水准拒绝H0,接受H1,可以认为正常人与高血压患者的血清胆固醇含量有差别,高血压患者高于正常人。,第六节 t 检验中的注意事项,1.假设检验结论正确的前提 作假设检验用的样本资料,必须能代表相应的总体,同时各对比组具有良好的组间均衡性,才能得出有意义的统计结论和有价值的专业结论。这要求有严密的实验设计和抽样设计,如样本是从同质总体中抽取的一个随机样本,试验单位在干预前随机分组,有足够的样本量等。,第六节 t 检验中的注意事项,2.检验方法的选用及其适用条件,应根据分析目的、研究设计、资
21、料类型、样本量大小等选用适当的检验方法。t 检验是以正态分布为基础的,资料的正态性可用正态性检验方法检验予以判断。若资料为非正态分布,可采用数据变换的方法,尝试将资料变换成正态分布资料后进行分析。,第六节 t 检验中的注意事项,3.双侧检验与单侧检验的选择 需根据研究目的和专业知识予以选择。单侧检验和双侧检验中的t值计算过程相同,只是t界值不同,对同一资料作单侧检验更容易获得显著的结果。单双侧检验的选择,应在统计分析工作开始之前就决定,若缺乏这方面的依据,一般应选用双侧检验。,第六节 t 检验中的注意事项,4.假设检验的结论不能绝对化 假设检验统计结论的正确性是以概率作保证的,作统计结论时不能
22、绝对化。在报告结论时,最好列出概率 P 的确切数值或给出P值的范围,如写成0.02P0.05,同时应注明采用的是单侧检验还是双侧检验,以便读者与同类研究进行比较。当 P 接近临界值时,下结论应慎重。,第六节 t 检验中的注意事项,5.正确理解P值的统计意义 P 是指在无效假设 H0 的总体中进行随机抽样,所观察到的等于或大于现有统计量值的概率。其推断的基础是小概率事件的原理,即概率很小的事件在一次抽样研究中几乎是不可能发生的,如发生则拒绝H0。因此,只能说明统计学意义的“显著”。,第六节 t 检验中的注意事项,6.假设检验和可信区间的关系 假设检验用以推断总体均数间是否相同,而可信区间则用于估
23、计总体均数所在的范围,两者既有联系又有区别。,第七节 假设检验中两类错误,假设检验是针对H0,利用小概率事件的原理对总体参数做出统计推论。无论拒绝H0还是接受H0,都可能犯错误。,第七节 假设检验中两类错误,当H0为真时,检验结论拒绝H0接受H1,这类错误称为第一类错误或型错误(type error),亦称假阳性错误检验水准,就是预先规定的允许犯型错误概率的最大值,用表示 当真实情况为H0不成立而H1成立时,检验结论不拒绝H0反而拒绝H1,这类错误称为第二类错误或型错误(type error),亦称假阴性错误,第七节 假设检验中两类错误,概率大小用表示,只取单侧,一般未知,在已知两总体差值d(
24、如1-2)、和 n 时,才能算出 为了更好地理解两类错误的意义,以样本均数与总体均数比较的u 检验来说明 设H0:=0,H1:0 H0实际上是成立的,但由于抽样误差的存在,偶然得到较大的值(绝对值)以及u 值(绝对值),第七节 假设检验中两类错误,使得,按=0.05的检验水准,拒绝H0,接受H1,结论为0 此时犯型错误,其最大可能概率值为 若 确实小于0,即H0不成立,H1成立,由于抽样的偶然性,得到较小的值(绝对值)以及u值(绝对值)使得,检验结论不拒绝H0。此时犯型错误,其概率为,型错误与型错误示意图(以单侧u检验为例),第七节 假设检验中两类错误,愈小,愈大;相反,愈大,愈小 同时减小型错误和型错误,唯一的方法就是增加样本含量n 1-称为检验效能(power of a test),也称把握度 意义为,当两总体确有差别,按检验水准,假设检验能发现其差别(拒绝H0)的能力。和一样,1-只取单侧。,型错误与型错误示意图(以单侧u检验为例),谢 谢!,