《假设检验的基本原理与t检验.ppt》由会员分享,可在线阅读,更多相关《假设检验的基本原理与t检验.ppt(73页珍藏版)》请在三一办公上搜索。
1、Xue Fuzhong,School of public health,Shandong University,假设检验的基本原理与t检验,假设检验的基本原理与t检验,假设检验的基本原理与t检验,假设检验的基本原理,假设检验(hypothesis test)亦称显著性检验(significance test),是统计推断的两个重要内容之一。假设检验的方法很多,如t检验、u检验、方差分析、检验、秩和检验、;应用时,需根据研究目的、设计方法、资料类型及其分布特征等选用。,二十世纪二、三十年代Neyman和Pearson建立了统计假设检验问题的数学模型。,假设检验的基本原理与t检验,假设检验的基本原
2、理,假设检验的基本原理与t检验,假设检验的基本原理,假设检验的基本原理与t检验,假设检验的基本原理,假设检验是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。,问题实质上都是希望通过样本统计量与总体参数的差别,或两个样本统计量的差别,来推断总体参数是否不同。这种识别的过程,就是本章介绍的假设检验(hypothesis test)。,假设检验的基本原理与t检验,假设检验的基本原理,例 根据大量调查,已知健康成年男子脉搏的均数为72次/分钟,某医生在一山区随机测量了25名健康成年男子脉搏数,求得其均数为
3、74.2次/分钟,标准差为6.5次/分钟,能否认为该山区成年男子的脉搏数与一般健康成年男子的脉搏数不同?,1.建立检验假设 确定检验水准一种是无效假设(null hypothesis),符号为H0;一种是备择假设(alternative hypothesis)符号为H1。,H0:,H1:,假设检验的基本原理与t检验,假设检验的基本原理,假设检验的基本原理与t检验,假设检验的基本原理,检验水准亦称显著性水准(significance level),符号为,是判断拒绝或不拒绝 的水准,也是允许犯型错误的概率,通常用。必要时,可用0.01或0.10或0.20。,假设检验的基本原理与t检验,假设检验的
4、基本原理,2.选定检验方法和计算统计量 根据研究设计的类型和统计推断的目的要求选用不同的检验方法。如完全随机设计中,两样本均数的比较可用t检验,样本含量较大时(n100),可用u检验。不同的统计检验方法,可得到不同的统计量,如t 值和u值。各检验方法都有其应用条件。选择时,须根据研究目的、设计类型、资料类型及其分布特征等选用适当的统计检验方法,并计算出相应的检验统计量。例如,本例为样本均数与总体均数比较,样本是随机抽取的,变量值为数值变量资料,样本含量较小,且总体标准差未知,因而选用单样本 检验。,假设检验的基本原理与t检验,假设检验的基本原理,2.选定检验方法和计算统计量,XN(72,2),
5、假设检验的基本原理与t检验,假设检验的基本原理,2.选定检验方法和计算统计量,假设检验的基本原理与t检验,假设检验的基本原理,2.确定P值,作出结论,假设检验的基本原理与t检验,假设检验的基本原理,P值是指在H0所规定的总体中作随机抽样,获得等于及大于(或小于)现有统计量t值的概率。,3.确定概率P值作出结论,假设检验的基本原理与t检验,假设检验的基本原理,3.确定概率P值作出结论,当P时,表示在H0成立的条件下,出现等于及大于现有统计量的概率是小概率,根据小概率事件原理,现有样本信息不支持H0,因而拒绝H0,结论为按所取检验水准拒绝H0,接受H1,即差异有统计学意义,如例3.3 可认为两总体
6、脉搏均数有差别;当P时,表示在H0成立的条件下,出现等于及大于现有统计量的概率不是小概率,现有样本信息还不能拒绝H0,结论为按所取检验水准不拒绝H0,即差异无统计意义,如例3.3 尚不能认为两总体脉搏均数有差别。,本例:,结论为按所取检验水准不拒绝H0,即差异无统计意义,尚不能认为两总体脉搏均数有差别。,假设检验的基本原理与t检验,假设检验的基本原理,3.确定概率P值作出结论,当P时,表示在H0成立的条件下,出现等于及大于现有统计量的概率是小概率,根据小概率事件原理,现有样本信息不支持H0,因而拒绝H0,结论为按所取检验水准拒绝H0,接受H1,即差异有统计学意义,如例3.3 可认为两总体脉搏均
7、数有差别;当P时,表示在H0成立的条件下,出现等于及大于现有统计量的概率不是小概率,现有样本信息还不能拒绝H0,结论为按所取检验水准不拒绝H0,即差异无统计意义,如例3.3 尚不能认为两总体脉搏均数有差别。,样本均数与总体均数的比较,小样本t检验法:,目的:推断样本所代表的未知总体均数与已知总体均数0是否相等。,t检验的适用条件:样本来自正态总体或近似正态总体;,若不符合条件可考虑用非参数方法(秩和检验法),假设检验的基本原理与t检验,样本均数与总体均数的比较:,小样本t检验法:,例经产科大量调查得知某市婴儿体重均数为3.30kg,今随机测得35名难产儿平均出生体重为3.42kg,标准差为0.
8、40kg。问该市难产儿出生体重与一般婴儿是否不同?,假设检验的基本原理与t检验,样本均数与总体均数的比较:,小样本t检验法:,假设检验的基本原理与t检验,样本均数与总体均数的比较:,大样本u检验法:,国外统计书籍及统计软件亦称为单样本u检验(one sample u-test)。样本均数与总体均数比较的u检验适用于:总体标准差已知的情况;样本含量较大时,比如n100时。对于后者,是因为n较大,也较大,则t分布很接近u分布的缘故。,假设检验的基本原理与t检验,样本均数与总体均数的比较:,大样本u检验法:,假设检验的基本原理与t检验,样本均数与总体均数的比较:,SAS运行结果:,假设检验的基本原理
9、与t检验,例题:已知某水样中碳酸钙的真值为20.7mg/L.现用某法重复测定该水样11次,测得碳酸钙的含量分别为 20.99 20.41 20.10 20.00 20.91 22.60 20.99 20.41 20.00 23.00 22.00。问用该法测得的碳酸钙含量的均知与真值差异有无统计学意义?,data a;input x;y=x-20.7;cards;20.99 20.41 20.10 20.00 20.91 22.60 20.99 20.41 20.00 23.00 22.00run;proc univariate data=a normal;var y;run;,SAS code
10、,样本均数与总体均数的比较:,SAS运行结果:,假设检验的基本原理与t检验,SAS output,样本均数与总体均数的比较:,SAS运行结果:,假设检验的基本原理与t检验,SAS output,样本均数与总体均数的比较:,SAS运行结果:,假设检验的基本原理与t检验,SAS output,配对t检验:,所谓配对样本(paired sample)是指两个样本中的观察对象由于存在某种联系或具有某些相近的重要特征而结成对子(matching),每对中的两个个体随机分配接受两种不同的处理。,医学研究中常见的配对样本:配成对子的两个个体分别给予两种不同的处理(如把同窝、同性别和体重相近的动物配成一对;把
11、同性别、同病情和年龄相近的病人配成一对等);同一个体同时分别接受两种不同处理(如同一动物的左右两侧神经、同一份标本分成两部分);同一个体自身前后的比较(如高血压患者治疗前后的舒张压比较、肝炎患者治疗前后的转氨酶比较等)。,假设检验的基本原理与t检验,配对t检验:,对于配对样本数据,应该首先计算出各对差值的均数。当两种处理结果无差别或某种处理不起作用时,理论上差值的总体均数应该为0,故可将配对样本资料的假设检验视为样本均数与总体均数=0的比较,所用方法为配对t检验(paired t-test),适用条件:要求差值的总体分布为正态分布,即差数来自正态分布总体。,不符合条件时,可考虑用非参数检验(配
12、对符号秩和检验法),假设检验的基本原理与t检验,配对t检验:,例4.3 将20只按体重、月龄及性别配对的大白鼠随机分入甲、乙2组,甲组给正常饲料,乙组饲料缺乏维生素E。10天后测定大白鼠肝脏的维生素A含量(IU/g),结果如下。问2组大白鼠肝脏维生素A含量是否有差别?,假设检验的基本原理与t检验,配对t检验:,假设检验的基本原理与t检验,配对t检验:,例4.4 有12名志愿受试者服用某减肥药,服药前和服药一个疗程后各测量一次体重(kg),数据如表4-2所示。试判断此减肥药是否有效。,假设检验的基本原理与t检验,配对t检验:,假设检验的基本原理与t检验,配对t检验:,假设检验的基本原理与t检验,
13、SAS运行结果,例题:为研究女性服用某种避孕药后是否影响其血清总胆固醇含量,将20名女性按年龄配成10对。每对随机抽取1人服用该药,另1人服用安慰剂。经一段时间后,测定血清总胆固醇含量如下。问该药是否影响女性血清总胆固醇含量?,SAS code,配对t检验:,假设检验的基本原理与t检验,SAS运行结果,SAS output,配对t检验:,假设检验的基本原理与t检验,SAS运行结果,SAS output,完全随机设计的两组数值变量资料比较:,小样本t检验法:,完全随机设计(completely random design):把受试对象完全随机分为两组,分别给予不同处理,然后比较独立的两组样本均数
14、。各组对象数不必严格相同。目的:比较两总体均数是否相同。,适用条件:两样本均数均来自正态分布总体;两总体方差相等(方差齐),若有一条以上不符合:采用适当的变量变换方法,使其达到上述条件;若变量变换后仍不满足条件,则用非参数检验法(秩和检验)。,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,小样本t检验法:,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,小样本t检验法:,例4.6 将20份钩端螺旋体患者的血清随机分为2组,分别用标准株和水生株做凝溶试验,结果见表4-3。试比较两法测得的血清抗体平均效价有无差别。,假设检验的基本原理与t检验,完全随机设计的两
15、组数值变量资料比较:,小样本t检验法:,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,正态性检验:,正态性检验(normality test)方法:统计指标:偏度系数、峰度系数;W值、D值等 统计图:PP图、QQ图、直方图、茎叶图、箱图等,正态性检验是推断资料是否服从正态分布,或样本是否来自正态分布总体的方法。医学统计学中,许多统计方法仅适用于正态分布或近似正态分布资料。例如,用均数和标准差描述数值变量资料的分布特征,以及t、u检验和方差分析时,均要求样本资料服从正态分布。因此,选定统计方法时,先要用正态性检验(test of normality)推断资料是否服从正态分布。
16、,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,正态性检验:,假设检验的基本原理与t检验,P-P 图,完全随机设计的两组数值变量资料比较:,正态性检验:,假设检验的基本原理与t检验,P-P 图,完全随机设计的两组数值变量资料比较:,正态性检验矩法(即分别对总体分布的偏度与峰度进行检验):,假设检验的基本原理与t检验,P-P 图,完全随机设计的两组数值变量资料比较:,正态性检验矩法(即分别对总体分布的偏度与峰度进行检验):,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,正态性检验矩法(即分别对总体分布的偏度与峰度进行检验):,假设检验的基本原理与t检验,检
17、验水准取大些!,完全随机设计的两组数值变量资料比较:,两独立样本方差的齐性检验:,两独立小样本均数的t检验,除要求两组数据均应服从正态分布外,还要求两组数据相应的两总体方差相等,即方差齐性(homoscedasticity)。但即使两总体方差相等,两个样本方差也会有抽样误差,两个样本方差不等是否能用抽样误差解释?可进行方差齐性检验。,注意:方差齐性检验本为双侧检验,但由于公式规定以较大的方差作分子,F值必然大于1,故附表3单侧0.025的界值,实对应双侧检验P=0.05;当样本含量较大时(如n1和n2均大于50),可不必作方差齐性检验。,假设检验的基本原理与t检验,根据专业知识确定单、双侧检验
18、,完全随机设计的两组数值变量资料比较:,两独立样本方差的齐性检验:,根据专业知识确定单、双侧检验,完全随机设计的两组数值变量资料比较:,两独立样本方差的齐性检验:,完全随机设计的两组数值变量资料比较:,两独立样本方差的齐性检验:,例 某研究所为了了解水体中汞含量的垂直变化,对某氯碱厂附近一河流的表层水和深层水作了汞含量的测定,结果如下。试检验两个方差是否齐性。,深层水:n1=8,样本均数=1.781(mg/L),S1=1.899(mg/L)表层水:n2=10,样本均数=0.247(mg/L),S2=0.210(mg/L),确定P值 作出推断结论 本例18-1=7,210-1=9,查附表3,F界
19、值表(方差齐性检验用),得F0.05,7,9=4.20,本例F80.97 F 0.05,7,9=4.20;故P0.05,按=0.05 水准,拒绝H0,接受H1,结论:故可认为两总体方差不齐。,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,两独立样本方差的齐性检验:,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,t 检验:,近似t检验有3种方法可供选择,包括Cochran&Cox法、Satterthwaite法和Welch法。其中1、2两种方法较为常用。Cochran&Cox法是对临界值校正,而 Satterthwaite法和Welch法则是对自由度校正。
20、Satterthwaite法是目前计算机软件中普遍使用的方法。,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,两大样本均数的u检验(two-sample-test for independent samples):,在两个样本均数比较时,若两组样本含量都很大,可用u检验,其计算公式为:,例4.8 某医师欲比较某地工人和农民全血胆碱脂酶活力,检测工人143名,均数3.52mol/L,标准差为0.49mol/L;检测农民156名,均数3.36mol/L,标准差为0.53mol/L。问该地工人与农民全血胆碱脂酶活力有无差别?,假设检验的基本原理与t检验,完全随机设计的两组数值变量
21、资料比较:,两大样本均数的u检验(two-sample-test for independent samples):,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,SAS运行结果,假设检验的基本原理与t检验,例题:某克山病区测得急性克山病患者11名和该地健康人的血磷值如下,问两组血磷值差异是否有统计学意义?急性克山病患者:4.73 6.40 2.60 3.24 6.53 5.18 5.58 3.73 4.43 5.78 3.37健康人:2.34 2.50 1.98 1.67 1.98 3.60 2.33 3.73 4.57 4.82 5.78 4.17 4.14,完全随机设
22、计的两组数值变量资料比较:,SAS output,假设检验的基本原理与t检验,Group=1,Group=2,完全随机设计的两组数值变量资料比较:,SAS output,假设检验的基本原理与t检验,完全随机设计的两组数值变量资料比较:,SAS output,假设检验的基本原理与t检验,型错误和型错误:,假设检验的基本原理与t检验,假设检验中作出的推断结论可能发生两种错误:拒绝了实际上是成立的H0,这叫型错误(typeerror)或第一类错误,也称为错误。(1)即可信度(confidence level):重复抽样时,样本区间包含总体参数(m)的百分数。不拒绝实际上是不成立的H0,这叫型错误(t
23、ypeerror)或第二类错误,也称为错误。(1)即把握度(power of a test):两总体确有差别,被检出有差别的能力。,型错误和型错误:,假设检验的基本原理与t检验,型错误和型错误:,假设检验的基本原理与t检验,型错误和型错误:,假设检验的基本原理与t检验,型错误和型错误:,假设检验的基本原理与t检验,型错误和型错误:,假设检验的基本原理与t检验,假设检验中作出的推断结论可能发生两种错误的控制,型错误和型错误:,假设检验的基本原理与t检验,假定做了 次检验,通常称为“族检验(family of tests)”,在每一次检验(第一类错误)不变的情况下,K次检验的联合假阳性率将远远大于
24、。假阳性率(false discovery rate,FDR)是在特定检验水准 下,有“统计学意义”的结果中,为真的比例。,多次重复检验造成的假阳性,每人的命中率0.95,而失误率为0.05,则多人的联合失误率会远远大于0.05。,假设检验的基本原理与t检验,多次重复检验造成的假阳性,假设检验的基本原理与t检验,单侧检验与双侧检验:,假设检验的基本原理与t检验,单侧检验与双侧检验:,假设检验的基本原理与t检验,假设检验时应注意的事项:,假设检验的基本原理与t检验,1要有严密的抽样研究设计 这是假设检验的前提。样本必须是从同质总体中随机抽取的;要保证组间的均衡性和资料的可比性,即对比组间除处理因
25、素(如新药和常规药)外,非处理因素(如年龄、性别、病程、病情轻重等)应尽可能相同。,2正确选用检验方法 应根据研究目的、设计类型、资料类型及其分布特征等选用适当的假设检验方法。如完全随机设计的两数值变量资料比较时,若n小且方差齐,则选用两样本t检验;若方差不齐,则选用t检验或成组设计的两样本比较的秩和检验;若n1、n2均大于50,则选用两样本u检验。,假设检验时应注意的事项:,假设检验的基本原理与t检验,3、对差别有无统计学意义的判断不能绝对化 假设检验的推断结论是概率性的假设检验的结论是根据概率推断的,所以不是绝对正确的:当 p,不能拒绝 H0,不能接受H1,按不能接受H1下结论,也可能犯错
26、误,没有拒绝实际上不成立的H0,这类称为 II 类错误(“存伪”的错误),其概率大小用 表示,值一般不能确切的知道(存伪是指两总体均数不相等)。(3)做统计结论时要留有余地,不宜用“肯定”,“一定”,“必定”等词,而且最好列出检验统计量的值,写出P值的确切范围,以便读者与同类研究进行比较。,假设检验时应注意的事项:,假设检验的基本原理与t检验,(4)正确理解“显著性”的含义:以往,习惯上把称为差异有显著性。此“显著性”易被理解为二者差异大,或被理解为所分析的指标具有“显著效果”或“显著价值”。例如,用某降压药后舒张压平均下降2mmHg,经t检验可能得到p0.05,由此得出的“用药前后的差异有显著性”的统计学结论,并不意味此药在临床上有“显著疗效”。事实上2mmHg的差值并无实际意义(有临床意义的差值应 mmHg)。为了避免对显著性含义的错误理解,目前在医学统计学中已用“差别有统计学意义”和“差别无统计学意义”分别表示 和。因此,在假设检验的推断结论中,既要有统计结论,又要依据专业知识做出专业结论。,假设检验时应注意的事项:,假设检验的基本原理与t检验,假设检验时应注意的事项:,假设检验的基本原理与t检验,Thank you!,