《数值变量资料的假设检验.ppt》由会员分享,可在线阅读,更多相关《数值变量资料的假设检验.ppt(105页珍藏版)》请在三一办公上搜索。
1、第四章(二)假设检验 Hypothesis testing,山东大学公共卫生学院刘静,2,Example 1 The dean of a medical school states that the students of the school are a highly intelligent group with an average IQ of 135.,Do you believe him?,3,Suppose is really 135,Random Sample,sample,?,Population,Not necessarily.Sampling error will alway
2、s cause the sample mean to deviate from the population mean.,4,H0:=0,then N(0,2/n),Fig.1 Distribution of sample means when H0 is true,To suspect H0,0,5,H0:=0,0,Fig.2:Regions of rejection and nonrejection in hypothesis testing of one sample mean,Reject region,Nonrejection region,area of nonrejection
3、region,1-,Critical value of sample mean,6,Fig.3:Critical value of t in hypothesis testing for one sample mean,area of nonrejection region,1-,area of rejection region,Critical value of t:-t,t,Degrees of freedom,=n-1,7,8,A random sample of 10 students is drawn;their IQs are as follows:115 140 133 125
4、120 126 136 124 132 129,9,Calculate the value of t that corresponds to the mean of the sample.,10,-2.935,In this example,the t score(-2.935)does fall in the region of rejection.Therefore,the null hypothesis should be rejected,and naturally the alternative hypothesis is accepted.,Conclusion!,=n-1=9,t
5、,11,Steps to test a hypothesis about a mean,State the null and alternative hypotheses,H0 and H1.Select the decision criterion(or“significance level”).Establish the critical value(s)of the testing statistic.Draw a random sample from the population,then calculate the mean and the standard deviation of
6、 that sample and estimate sampling error().,Calculate the value of the test statistic t corresponding to the mean of the sample.,Compare the calculated value of t with the critical values of t,and then draw an inferential conclusion to reject or not to reject the null hypothesis.,12,Hypothesis testi
7、ng of the current example,Conclusion:The null hypothesis was rejected and logically the alternative hypothesis was accepted under the significance level of 0.05.Therefore,the mean IQ of the students of that medical school was less than 135.,=n-1=9,13,一、假设检验的基本思想,反证法:当一件事情的发生只有两种可能A和B,为了肯定其中的一种情况B,但又
8、不能直接证实B,这时否定另一种可能A,则间接的肯定了B。,假设检验之所以可行,其理论背景为“小概率事件原理”,即小概率事件在一次抽样中不可能发生。,14,二、假设检验的一般步骤,(一)建立假设和确定检验水准 1确定单、双侧检验 根据研究目的或专业知识确 定单侧检验(one-sided test)或双侧检验(two-sided test)。,15,二、假设检验的一般步骤(续),(二)选定检验方法和计算统计量根据研究目的、设计类型、资料类型及其分布特征等选用适当的统计检验方法,并计算出相应的检验统计量。(三)确定值,做出推断结论求出检验统计量后,查相应的统计用表,得出概率值。P值是指从H0所规定的
9、总体中随机抽样时,获得等于及大于(负值时为等于及小于)现有样本统计量的概率。,16,P值的含义双侧检验,area of nonrejection,1-,t,不拒绝H0,拒绝H0,拒绝H0,17,Area of nonrejection,1-,Area of rejection,t,Nonrejection region,Rejection region,P值的含义单侧检验,18,二、假设检验的一般步骤(续),第五章 t检验,20,数值变量资料两组均数的比较 t 检验和 u 检验,一、单样本的假设检验 样本均数与已知总体均数比较二、配对资料的t 检验三、成组设计资料的两样本均数比较(两独立 样本
10、的t检验),21,一、单样本的检验样本均数与已知总体均数(0)的比较,1、t 检验当总体标准差未知时:检验统计量2、u 检验当总体标准差已知时:检验统计量,22,例1.某医学院校的校长称该校学生的平均智商为135。现有人从该校学生中随机抽取10人进行智商测定,得均数为128,标准差为7.54。试推断该校长所言是否正确。,23,(1)建立假设,确定检验水准。H0:该校学生平均智商为135,即=0=135 H1:该校学生平均智商低于135,即t0.01,9=2.821,故P0.01,按=0.05的检验水准拒绝H0,接受H1,认为该校学生的平均智商低于135。,24,例2.随机测量了26名男性汽车司
11、机的脉搏平均数为73.7次/min,标准差为8.8次/min。可否据此认为男性汽车司机脉搏平均数高于一般男性脉搏数(72次/min)?,25,(1)建立假设,确定检验水准。H0:男性汽车司机平均脉搏次数与一般男性相同、即=0=72 H1:男性汽车司机平均脉搏次数与一般男性不同、即0=72=0.05(2)选择检验方法,计算检验统计量。本例应用t检验,检验统计量为(3)确定P值,做出推断结论。,26,例一般男性血色素含量的医学参考值为14.0g/dl。某研究者从某高原地区人群中随机抽取120名健康男性,测得其血色素均数 g/dl,标准差 g/dl。问该高原地区健康男性血色素含量是否高于一般男性?,
12、27,(1)建立假设,确定检验水准。H0:高原地区健康男性血色素含量与一般男性相同、即=0=14.0 H1:高原地区健康男性血色素含量高于一般男性、即0=0.05(2)选择检验方法,计算检验统计量。本例应用t检验,检验统计量为(3)确定P值,做出推断结论。因很大,可以u界值代替t界值,t1.645,故P0.05,按=0.05水准拒绝H0,接受H1,该地健康男性与一般男性血色素含量的差别有统计学意义,可认为该高原地区健康男性血色素含量高于一般男性。,28,例4.大量调查表明,某市某年正常顺产新生儿的出生体重均数为3.20kg,标准差为0.39kg。今某医院记录了25名难产儿的出生体重,均数为3.
13、42kg。问难产儿的出生体重与正常顺产儿的出生体重有无差别?,29,(1)建立假设,确定检验水准。H0:难产儿与正常顺产儿平均出生体重相同,即=0=3.20 H1:难产儿与正常顺产儿平均出生体重不相同,即0=0.05(2)选择检验方法,计算检验统计量。本例应用t检验,检验统计量为(3)确定P值,做出推断结论。u2.58,故P0.01,按=0.05水准拒绝H0,接受H1,可认为难产儿与正常顺产儿平均出生体重不同,难产儿平均出生体重较高。,30,二、配对资料的t 检验,配对资料类型:配对设计:先将受试对象按非研究因素相同或相近配成对子,然后用随机分组方法将各对中的2个受试对象分别分配到不同 的处理
14、组;同一组受试对象实验前后的比较;同一批样品分别用两种不同的测量方法进行测量,比较其测量 结果是否相同;同一组受试对象身体不同部位、不同器官的某项特征进行比较。,31,计算公式:式中,为差值d 的样本均数;为 所代表的未知总体均数,当2种处理的效应相同或某种处理无作用时;为差值的标准差,为差值样本均数的标准误;n为对子数,为自由度。,配对 t 检验,32,例5.将20只按体重、月龄及性别配对的大白鼠随机分入甲、乙2组,甲组给正常饲料,乙组饲料缺乏维生素E。10天后测定大白鼠肝脏的维生素A含量(IU/g),结果如下。问2组大白鼠肝脏维生素A含量是否有差别?,配对 t 检验,33,配对 t 检验,
15、34,(1)建立假设,确定检验水准(2)计算统计量 本例,,配对 t 检验,35,(3)确定P值,做出推断结论 以,查附表2 t界值表,得,按 检验水准拒绝,接受,可认为2组大白鼠肝脏维生素A含量的差别有统计学意义,维生素E缺乏组的大白鼠肝脏维生素A含量低于正常饲料组。,例5,配对 t 检验,36,例6 有12名志愿受试者服用某减肥药,服药前和服药一个疗程后各测量一次体重(kg),数据如表4-2所示。试判断此减肥药是否有效。,配对 t 检验,37,(1)建立假设,确定检验水准 H0:d=0,H1:d0,=0.05(2)计算统计量 本例,,配对 t 检验,(3)确定P值,做出推断结论 以=n-1
16、=11,查附表2 t界值表,得单侧P0.25,按=0.05检验水准不拒绝H0,根据本资料尚不能认为该减肥药有效。,38,三、成组设计资料的两样本均数比较,目的是推断两样本各自所代表的总体均数是否相等。H0:1=2 H1:12=0.05方法:(1)样本含量较小时 t 检验(2)样本含量较大时 u 检验,39,1、样本含量较小时 t 检验 应用条件:两样本均来自正态总体;两总体方差相等(方差齐)。,=n1+n2-2,成组设计的两小样本均数比较,40,例7.将19只雌性大白鼠随机分为2组,分别饲以高蛋白和低蛋白饲料8周,各鼠体重的增加克数如下,问不同饲料组大白鼠的增重有无差别?高蛋白组():134
17、146 104 119 124 161 107 83 113 129 97 123 低蛋白组():70 118 101 85 107 132 94,两样本 t 检验,41,(1)建立假设,确定检验水准,两样本 t 检验,42,(2)计算统计量 本例,两样本 t 检验,43,(3)确定P值,做出推断结论 以,查附表2 t界值表,得双侧,按 检验水准不拒绝,可认为两组雌性大白鼠增重的差别无统计学意义,尚不能认为两种饲料对雌鼠的增重不同。,两样本 t 检验,44,成组设计的两样本几何均数比较,在医学研究中,有些资料为对数正态分布资料和倍数资料,其平均水平宜用几何均数表示。当成组设计的两样本几何均数比
18、较时,其检验统计量值计算公式为:,45,例8.将20份钩端螺旋体患者的血清随机分为2组,分别用标准株和水生株做凝溶试验,结果见表4-3。试比较两法测得的血清抗体平均效价有无差别。,成组设计的两样本几何均数比较,46,成组设计的两样本几何均数比较,47,(1)建立假设,确定检验水准:两总体几何均数相等:两总体几何均数不等(2)计算统计量本例,成组设计的两样本几何均数比较,48,成组设计的两样本几何均数比较,49,(3)确定P值,做出推断结论 以,查附表2 t界值表,得双侧,按 检验水准拒绝,接受,认为两组抗体平均效价的差别有统计学意义,标准株组高于水生株组。,成组设计的两样本几何均数比较,50,
19、2.u检验:应用条件:两样本含量均足够大,一般要求n150,n250。公式:,成组设计的两大样本均数比较,51,例9.某医师欲比较某地工人和农民全血胆碱脂酶活力,检测工人143名,均数为3.52mol/L,标准差为0.49mol/L;检测农民156名,均数为3.36mol/L,标准差为0.53mol/L。问该地工人与农民全血胆碱脂酶活力有无差别?,两样本 u 检验,52,(1)建立假设,确定检验水准(2)计算统计量 本例,,例9,两样本 u 检验,53,例9,(3)确定P值,做出推断结论,按 检验水准拒绝,接受,可认为该地工人与农民的全血胆碱脂酶活力不同,工人高于农民。,两样本 u 检验,54
20、,第四节 正态性检验,医学统计学中,许多统计方法仅适用于正态分布或近似正态分布资料。例如,用均数和标准差描述数值变量资料的分布特征,以及t、u检验和方差分析时,均要求样本资料服从正态分布。因此,选定统计方法时,首先要检验资料是否服从正态分布。正态性检验(test of normality)是推断资料是否服从正态分布,或样本是否来自正态分布总体的方法。,55,正态性检验常用的方法,图示法:P-P图或Q-Q图矩法:检验偏度系数和峰度系数 W检验(Shapiro-Wilk检验)D检验(Kolmogorov-Smirnov检验)频数分布拟合优度的2检验,56,第五节 两个方差的齐性检验,两个方差的齐性
21、检验用于推断两样本方差 s12 和s22所分别代表的总体方差 12和22是否相等。当s12 和s22 分别代表的总体方差相等时称两样本方差齐;反之,当s12 和s22 分别代表的总体方差不等时称两样本方差不齐。两样本的t检验要求两样本来自方差相等的总体,即方差齐。因此,在两样本t检验时,需先进行两个方差的齐性检验。,57,两样本方差齐性检验方法,F 检验:式中,为较大的样本方差,为较小的样本方差,为分子的自由度,为分母的自由度,n1和n2分别为相应的样本含量。,58,例10,例10.来自正态分布总体的2个随机样本的血清IgA(u/ml)测定结果如下,试检验两个方差的齐性。肺气肿组:健康组:,5
22、9,(1)建立假设,确定检验水准(2)计算统计量(3)确定P值,做出推断结论 以,查附表3F界值表得,按 检验 水准不拒绝,可认为两总体方差相等,即两样 本方差齐。,例10,60,若变量变换后总体方差齐性 可采用t 检验(如两样本几何均数的t 检验,就是将原始数据取对数后进行t 检验);若变量变换后总体方差仍然不齐 可采用t 检验或Wilcoxon秩和检验。,若两总体方差不等(),?,61,(1)Cochran&Cox近似t 检验(t 检验)调整 t 界值,62,63,例11 为研究国产四类新药阿卡波糖胶囊的降血糖效果,某医院用40名II型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等
23、分到试验组(用阿卡波糖胶囊)和对照组(用拜唐苹胶囊),分别测得试验开始前和8周后的糖化血红蛋白HbA1c(%),其下降值如表3-5。问用两种不同药物的病人其HbA1c下降值是否不同?,对照组和试验组HbA1c下降值(%),64,对照组方差是试验组方差的3.77倍,经方差齐性检验,认为两组的总体方差不等,故采用近似 t 检验。,(1)建立检验假设,确定检验水准(略),(2)计算检验统计量,65,(3)确定P值,作出推断结论。查t界值表 t0.05/2,19=2.093。,由t=0.9650.05。按=0.05水准,不拒绝H0,还不能认为用两种不同药物的病人其HbA1c下降值不同。,66,(2)S
24、atterthwaite近似t检验:Cochran&Cox法是对临界值校正 而Satterthwaite法则是对自由度校正。,67,以=28.428、t=0.965查附表2的t界值表得0.20P0.40。结论同前。,按Satterthwaite法对例11做检验,得,68,(3).Welch法近似t检验:Welch法也是对自由度进行校正。校正公式为,69,对例11,如按Welch法,则,以=29.429、t=0.965查附表2的t界值表得0.20P0.40。结论同前。,70,第六节 型错误和型错误,A Type I error is the error of rejecting the null
25、 hypothesis when it is true.The probability of committing a Type I error is usually denoted by.A Type II error is the error of accepting the null hypothesis when it is false.The probability of making a Type II error is usually denoted by.,71,Conclusions and consequences for testing a hypothesis,72,假
26、设检验中可能发生的两类错误,73,74,称为检验效能或把握度(power of test),即两总体确有差别时,按 水准能识别该差别的能力。如 表示:若两总体确有差别,理论上平均100次抽样中,有95次能得出两总体有差别的结论。在假设检验中,值的大小是事先确定的。严格地说,值也应事先确定,以保证一定检验效能()。,75,检验效能(1-)与以下因素有关:检验水准;两总体参数的差值;样本含量n;总体中的个体变异程度。,76,Fig.1 The relationship between“”and“”,77,Fig.2 The relationship between“”and“”,78,Fig.3
27、The relationship between sampling error and“”,79,下面通过抽样实验说明假设检验中的两类错误的含义:,80,第一类错误抽样实验1,81,第一类错误抽样实验2,82,第一类错误抽样实验3,83,第一类错误抽样实验,84,第二类错误抽样实验4,85,第二类错误抽样实验5,86,第二类错误抽样实验6,87,第二类错误抽样实验7从同一正态总体中以不同样本量进行抽样设置不同的检验水准值,88,第二类错误抽样实验8从标准差不同的正态总体中以不同样本量进行抽样,89,第二类错误抽样实验9从均数不同的正态总体中以不同样本量进行抽样,90,第二类错误抽样实验10,从
28、正态总体N(1,22)中以n=20/n=10 抽样:t检验的检验功效(1-)与=1-0的关系从正态总体N(12,22)中以n=20进行抽样:t检验的检验功效(1-)与的关系从正态总体N(12,22)/N(11,22)中以不同样本量进行抽样:t检验的检验功效(1-)与样本含量n的关系从正态总体N(11,22)中以n=20进行抽样:t检验的检验功效(1-)与检验水准的关系,91,从正态总体N(1,22)中以n=20抽样t检验的检验功效(1-)与=1-0的关系:H0:1=0=10,H1:10=10,=0.05,92,从正态总体N(1,22)中以n=10抽样t检验的检验功效(1-)与=1-0的关系:H
29、0:1=0=10,H1:10=10,=0.05,Power,1,93,从正态总体N(12,2)中以n=20抽样t检验的检验功效(1-)与的关系:H0:1=0=10,H1:10=10,=0.05,94,从正态总体N(12,22)中以不同样本量进行抽样:t 检验的检验功效(1-)与样本含量n的关系:H0:1=0=10,H1:10=10,=0.05,Power(1-),样本含量n,95,从正态总体N(11,22)中以不同样本量进行抽样:t检验的检验功效(1-)与样本含量n的关系:H0:1=0=10,H1:10=10,=0.05,96,从正态总体N(12,22)中以n=10进行抽样:t检验的检验功效(
30、1-)与检验水准的关系 H0:1=0=10,H1:10=10,97,实际研究中,根据所需检验的总体参数差值,设定的检验水准和检验效能1-(或第二类错误概率),在研究设计中确定合适的样本量。,98,第七节 假设检验时应注意的事项,要有严密的抽样研究设计 正确选用检验方法 正确理解“显著性”的含义 对差别有无统计学意义的判断不能绝对化假设检验与参数估计在一定程度上可以相互解释,99,可信区间与假设检验所提供的推断信息,100,可信区间与假设检验的联系,一方面,可信区间亦可回答假设检验的问题,算得的可信区间若包含了0,则按水准,不拒绝H0;若不包含 0,则按水准,拒绝H0,接受H1。另一方面,可信区
31、间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义。虽然可信区间亦可回答假设检验的问题,并能提供更多的信息,但并不意味着可信区间能够完全代替假设检验。可信区间只能在预先规定的概率 检验水准的前提下进行计算,而假设检验能够获得一较为确切的概率P值。,101,小 结,假设检验是依据样本提供的有限信息对总体作推断的统计学方法,是在对研究总体的两种对立的判断之间作选择的决策程序。假设检验的过程:建立检验假设、计算统计量、确定P 值并与给定的 比较、做出结论。假设检验的理论依据“小概率事件在一次抽样中不太可能发生”。假设检验结论不是绝对正确的(两类错误的概念)。假设检验的基本思想、P 值的含义、两类错误、t 检验和u 检验的适用条件及用途。,102,两均数比较假设检验的方法选择,103,两均数比较的假设检验的一般步骤,104,谢谢!,105,两均数比较假设检验的方法选择,