《两样本定量资料的假设检验.ppt》由会员分享,可在线阅读,更多相关《两样本定量资料的假设检验.ppt(50页珍藏版)》请在三一办公上搜索。
1、6 两样本定量资料的假设检验,王 玖 博 士 副教授 滨州医学院卫生统计学教研室,6.1 两组独立样本的假设检验,用来比较两样本所来自的总体均数或总体分布是否相同。当两样本均来自正态总体且方差齐性时,首选t 检验,可以证明,用 t 检验比较两样本的总体均数是否相同的检验功效是最高的;当两样本均来自正态总体但方差不齐时,可采用校正的 t 检验。当两样本并非来自正态总体或总体分布不详时,可采用秩和检验(rank sum test)。,6.1.1 两独立样本的t检验,例6-1 为研究某种新药治疗贫血患者的疗效,将20名贫血患者随机分成两组,一组用新药治疗,另一组用常规药物治疗,测得血红蛋白增加量(g
2、/L)见表6-1。问新药与常规药治疗贫血患者后的血红蛋白平均增加量有无差别?,解析 该例目的在于比较用新药治疗的人群和用常规药治疗的人群的血红蛋白平均增加量(g/L)有无差异,其实质就是比较两个总体均数是否相同,即 是否成立。在研究设计上,该例属于完全随机设计的两组独立样本。,从两个人群分别随机抽取一定数量的观察资料构成样本,测量某项指标后进行组间比较,属于平行对照设计(成组设计)。为了研究新生儿窒息患者与正常新生儿血浆中SOD平均含量有无差异,某研究者收集了10名正常新生儿和10名新生儿窒息患者的血浆,测得SOD含量(Nu/mg),请问新生儿窒息患者和正常新生儿血浆中SOD平均含量有无差异?
3、,t检验进行两样本均数比较的步骤,(1)建立检验假设,确定检验水准:新药和常规药治疗贫血患者后血红蛋白平均增加量相同,即:新药和常规药治疗贫血患者后血红蛋白平均增加量不同,即(2)计算检验统计量,当 为真时,两个样本所属的总体均数相等,即,此时两个样本资料来自相同的总体,两个样本均数都是该总体均数的点估计值,样本均数与总体均数的差是样本均数的抽样误差,故两个样本均数均随机地出现在 附近,仅是样本均数的抽样误差,这时相应的成组 t 检验统计量 一般也很小或比较小;,当 非真时,两个样本的总体均数不相等,即,,两个样本均数分别为两个总体均数的点估计值,它们均随机地出现在各自的总体均数附近,由于两个
4、总体均数不等,故此时两个样本均数差异相对较大,其相应的成组 t 检验统计量 一般会较大或很大。,(3)查t界值表,得P0.05,按 0.05水准拒绝,接受,可以认为新药和常规药治疗贫血患者后血红蛋白增加量不同,根据样本均数的信息,认为,即服用新药后血红蛋白含量平均增加量高于常规药。,(4)均数之差的置信区间根据t检验中拒绝 的结论结合 的95%置信区间(3.829,11.731),也可推断用新药治疗患者的血红蛋白平均增加量高于常规药治疗的患者,6.1.2 校正的t检验(方差不齐),数据的正态性和方差齐性是t 检验的前提条件;如果两样本所属总体均为正态,但方差不齐,则应采用 作为检验统计量,自由
5、度也要校正。,例6-2 为探讨硫酸氧钒对糖尿病性白内障大鼠血糖的影响,研究人员将已诱导糖尿病模型的100只大鼠随机分为两组,实验组给予硫酸氧钒治疗,对照组为空白对照。结果如下,,试问两种处理疗效的总体均数是否相同?,校正t检验的统计量为,当,为真时,统计量 的临界值近似地等于自由度为 的 t 分布的临界值,当 时,对于 为真而言,这是一个小概率事件,在一次随机抽样中一般是不会发生的,有理由怀疑“为真”,故可以拒绝,认为两个总体均数不等。,6.1.3 方差齐性检验和正态性检验,(3)确定P值,判断结果,正态性检验,对于大样本资料(如n50),样本均数近似地服从正态分布,故满足成组检验关于正态分布
6、的要求;但当样本例数较小时,需要对每组资料进行正态性检验。常用的正态性检验方法是矩法检验和w检验(Shapiro-Wilk W test),矩法检验比较保守,w检验比较灵敏。此外,还有K-S检验(Kolmogorov-Smirnov test)和D检验(D test)等。正态性检验的无效假设为资料服从正态分布,备择假设为资料不服从正态分布。,两组独立样本的秩和检验,例6-3 某医师为研究血铁蛋白与肺炎的关系,随机抽查了肺炎患者和正常人若干名,并测得血铁蛋白(g/L)含量,问肺炎患者与正常人平均血铁蛋白含量有无差别?肺炎患者 31 68 237 174 457 492 199 515 599 2
7、38正常人 177 172 34 47 132 54 47 52 47 294 68 43 277 44 43 95,正常人组 正态性的W检验结果P=0.010,参数统计-非参数统计,在统计推断方法中,凡是在已知总体分布的前提下对总体参数进行估计或检验的方法,称为参数统计(parametric statistics)。但在实际工作中,有时总体的分布不易确定,或分布不符合要求的条件,则需要应用一种不依赖于总体分布类型的统计推断方法,称为非参数统计(nonparametric statistics)。Wilcoxon秩和检验属于非参数检验中的一种,可以用于完全随机化设计两组独立样本的比较。,非参数
8、统计的基本思想,在不知总体分布的情况下如何利用数据所包含的信息呢?一组数据的最基本信息是次序,将数值按大小次序排队,每个数值在整个数据中均有相应的位置和次序,称为该数据的秩(rank)。在一定的假设下,这些秩及其统计量的分布是可以求出来的,且与原来的总体分布无关,可进行所需要的统计推断。,Wilcoxon秩和检验基本步骤,(1)建立检验假设:肺炎患者与正常人的血铁蛋白总体分布相同:肺炎患者与正常人的血铁蛋白总体分布不同=0.05(2)计算检验统计量T值编秩将两组数据合起来由小到大统一编秩,即从小到大编号,最小的数据的秩为1,第二小的数据的秩为2,依此类推。编秩时如遇有相同数据,且相同数据在不同
9、组时,要取其平均秩次(3)确定P值,作出统计推断结论,查表法 T界值表(两样本比较的秩和检验用),先从左侧找到较小的样本量,本例较小的样本量为n1=10;再从表上方找两组例数的差,本例,n2-n1=6;在两者纵横交叉处即为T的界值。将检验统计量T1值与T界值相比,若T值位于界值范围内,其P值大于相应的概率;若T值等于界值或在界值范围外,其P值等于或小于相应的概率。正态近似法,相持较多时的校正,tj为第j(j=1,2)个相持所含的个体数,Wilcoxon秩和检验的基本思想,秩次在一定程度上反映了等级的高低;秩和在一定程度上反映了等级的分布位置,这样,对观察值的分析就转化为对秩次的分析。当H0为真
10、时,两个样本来自相同的总体,对于样本量为n1和n2而言,每个数据的秩均有相同的机会取值为1,2,n1n2,因此每个数据的秩次期望值为(n1+n2+1)/2。第一组的n1个数据的秩和T1应随机地出现在其期望值 n1(n1+n2+1)/2 附近。,H0为真时,第一组的秩和T1在其期望值n1(n1+n2+1)/2处呈对称分布,并且当样本量较大时,统计量秩和T1近似服从均数为n1(n1+n2+1)/2,方差为n1n2(n1+n2+1)/12的正态分布;H0非真时,在大多数情况下统计量秩和T1将远离其期望值,利用秩和T1借助Wilcoxon秩和检验的临界值表或近似正态分布的检验统计量实现假设检验,6.2
11、 配对设计定量资料的检验,配对设计是将受试对象按一定条件配成对子(同种属、同体重、同年龄、同性别等),再随机分配每对中的两个受试对象到不同的处理组。其实施的主要形式有:将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同的处理组;同一受试对象分别接受两种不同处理,其目的是推断两种处理的效果有无差别。,例6-4 为研究某种抗癌新药对小白鼠移植性肉瘤S180的抑瘤效果,将20只小白鼠按性别、体重、窝别配成对子。每对中随机抽取一只服用抗癌新药扶正消瘤汤,另一只作为阴性对照,服用生理盐水,观察其对小白鼠移植性肉瘤S180的抑瘤效果,经过一定时间,测得小白鼠瘤重如表6-3所示。问小白鼠服用
12、抗癌新药和生理盐水后平均瘤重有无不同?,对子内部相减之后,得到的差值资料实际上是一个样本,因此配对设计资料的假设检验类似于单样本检验,即检验差值的均数或中位数是否等于零。对于配对设计定量资料的统计分析,若差值服从正态分布,可采用配对 t 检验(paired t test);否则,采用配对资料的符号秩和检验(signed rank sum test)。,配对样本检验,首先计算出各对差值d的均数,当两种处理平均效应是相同的,则差值来自的总体均数 应该为0,故可将配对设计资料的 t检验视为样本均数 所来自的未知总体均数与已知总体均数 0的比较。小样本资料:,配对t检验的基本步骤,配对t检验的基本步骤
13、,(3)确定P值,作出统计推断结论 查t界值表,得P0.05,按水准拒绝H0,接受 H1。根据本资料可以认为小白鼠服用抗癌新药和生理盐水后平均瘤重不同。(4)均数之差的置信区间根据配对t检验中拒绝H0的结论结合总体均数 的95%置信区间(0.052,0.290),由此可知,在95%置信度的情况下,可以推断用新药治疗后平均瘤重较低。,当H0()为真时,公式(6-1)的成组t 检验统计量服从自由度为 的分布,当检验统计量的绝对值 时,对于()为真而言,这是一个小概率事件,在一次随机抽样中,一般是不会发生的,有理由怀疑 的成立,因此拒绝,认为()成立。,(6-1),例 用两种方法测定12份血清样品中
14、Mg2+含量(mmol/l)的结果见表6-2。试问两种方法测定结果有无差异?,计算统计量:自由度=n-1=12-1=11.查附表2(t临界值表),双侧 t0.20,11=1.363,知P0.20,在=0.05水平上不能拒绝H0。所以尚不能认为两法测定结果不同。,配对资料的符号秩和检验,例6-5 留取15名在医用仪表厂工作的工人尿液,分成两份,一份用离子交换法,另一份用蒸馏法测得尿汞值如下,问两种方法测得尿汞平均含量有无差别?,解析 本研究属于配对设计的定量资料,首先判断是否符合配对设计t检验的适用条件,即差值是否来自正态分布。通过对差值进行正态性检验,发现差值不是来自正态总体(W检验:P=0.
15、010),所以用配对资料的符号秩和检验(Wilcoxon matched-samples signed rank sum test)进行统计分析。,配对资料的符号秩和检验的基本思想,如果两种检测方法的平均效应相同,这些配对数值之差应服从于以0为中心的对称分布,也就相当于把这些差值按其绝对值大小编秩并标上原来的符号后,正秩和与负秩和在理论上应是相等的(都等于n(n+1)/4,n为有效对子数),对于样本的正秩和与负秩和之间的差异是一些随机因素造成的抽样误差、这些差异一般不会太大。如果差别太大,超出了规定的范围,就拒绝H0,接受H1,认为差值的总体中位数不等于0。,配对符号秩和检验步骤,(1)建立假
16、设,确定检验水准H0:两种方法测得的尿汞含量差值的总体中位数为零,即=0H1:两种方法测得的尿汞含量差值的总体中位数不等于零,即 0=0.05(2)计算检验统计量T值求差值 见表6-5的第(4)列。编秩 将差值按绝对值大小从小到大编秩,并按差值的正负给秩次加上正负号。若差值的绝对值相等,则取其平均秩次,编秩时如遇差值为0,则舍去不计。求秩和 分别求出正、负秩次之和,正秩和以T+表示,负秩和以T-表示,取两者中较小的秩和为统计量T,(3)确定P值,作出统计学结论 查表法 查T界值表(配对比较的符号秩和检验用),若检验统计量T值在上、下界值范围内,其P值大于表上方相应概率水平;若T值在上、下界值上
17、或范围外,则P值等于或小于相应的概率水平。正态近似法 若n25,超出T界值表的范围,可用正态近似法作检验。若H0为真,则秩和检验统计量T近似服从。,相持较多时(不包括差值为0者),6.3 两组Poisson分布资料的比较,医学研究中常涉及到对两个Poisson分布总体均数的比较,当每个样本的观察值之和都大于20时,Poisson分布近似正态分布,可考虑应用Z检验对其总体均数进行推断。,6.3.1 观察单位相等时两个独立样本的Z检验,例6-6 两种培养液配方各在3个平皿中制成固体培养基,各放入1 ml含幽门螺杆菌充分混匀的胃液。培养72小时后清点幽门螺杆菌菌落数如下,问两种培养基菌落数差别有无统
18、计学意义?甲 14,21,16乙 12,10,8,当两个Poisson分布的参数相等时,统计量近似服从标准正态分布。,观察单位不等时两个独立样本的Z检验,例6-7 用同位素方法独立地测量两份标本的放射性,标本的制备方法相同,但测量时间不同,第一份标本测量了10分钟,测得质点数为1500,第二份标本测量了20分钟,测得质点数为2400。问如果在相同时间长度内测量,两份标本发放质点的总体均数是否相等?,6.4 结果报告,统计描述:包括样本含量和统计描述指标;统计推断:包括采用的统计方法、检验统计量、单侧还是双侧检验、检验水准、确切的P值和置信区间。,在=0.10检验水准下,新药组和常规药物组血红蛋
19、白增加量均服从正态分布(W检验:P1=0.466,P20.482)且两总体方差齐(F1.345,P=0.261);采用两独立样本的t检验:t=4.137,=18,P=0.001。结果表明:在=0.05(双侧)检验水准下,可以认为两药疗效不同,新药治疗的患者血红蛋白平均增加量高于常规药治疗的患者。的95%置信区间(3.829,11.731)也表明新药治疗的患者血红蛋白平均增加量高。,The data of two samples were adequately normally distributed(Shapiro-Wilk test:P1=0.466;P20.482)and the two
20、population variances were equal at the significant level 0.10(F1.345;P=0.261),so two independent samples t test was used(t=4.137;df=18;P=0.001).The results indicated a statistically significant difference between effects of two drugs at two-tailed significant level 0.05 and the average increase of concentration of Hb was higher in patients taking the new drug,which could also be observed from the 95%confidence interval of the difference of two population means(3.829,11.731).,两样本定量资料的假设检验,