假设检验的基本概念.ppt_三一办公31ppt.com

资源描述

《假设检验的基本概念.ppt》由会员分享，可在线阅读，更多相关《假设检验的基本概念.ppt（36页珍藏版）》请在三一办公上搜索。

1、假设检验的基本概念,南方医科大学生物统计系谭旭辉,统计分析,统计描述,统计推断,参数估计,假设检验,(hypothesis test),(significance test),例8-1:通过以往大规模调查，某地新生儿头围均数为34.50cm，标准差为1.99cm，为研究某矿区新生儿发育状况，现从该矿区随机抽取新生儿55人，得头围均数为33.89cm，问该矿区新生儿总体均数与一般新生儿头围总体均数是否不同。,差异来源,导致矿区新生儿头围均数与该地新生儿头围均数不等的原因由于抽样误差导致矿区的地理环境及生活条件等因素对新生儿头围的影响两种可能性都可能发生，如何抉择？,两个假设,H0：该矿区新生儿总

2、体均数()与一般新生儿头围总体均数(0)相同H1：该矿区新生儿总体均数与一般新生儿头围总体均数不同可考虑样本资料和哪一个假设有较大的矛盾来决定拒绝哪一个假设。一般考察样本资料是否与H0有较大的矛盾。,H0成立时会怎样？根据样本均数抽样分布知识得 N(0,02/n)。所得u值因样本而异，但其绝对值多数情况下落在0附近。u的分布规律可由u界值表查出。当前状况如何，发生的可能性（P值）有多大？本例n=55,=33.89,0=34.50 0=1.99，得u=-2.273,P值：指在H0成立的假设前提下，出现当前检验统计量以及更极端情况的概率。查u界值表，当前u值以外的双侧尾部面积介于0.05和0.02

3、之间，即0.05P0.02决策决策者需要事先规定一个可以忽略的小概率值。如取0.05，那么上述P值可认为很小。即H0成立时，几乎不可能出现当前的状况。,于是，面临两种抉择，一是认为H0是成立的，而当前的极端情况又恰好偶然发生了；二是怀疑H0的正确性，从而接受H1。根据小概率事件在一次抽样中不可能发生的原理我们通常选择后者。本例，可以认为该矿区新生儿总体均数与一般新生儿头围总体均数不同。当然，此时决策者也可能错误地拒绝H0，其犯错的最大概率为。,假设检验的基本步骤,1.建立假设、确定检验水准 H0：=0（检验假设 hypothesis to be tested）（无效假设 null hypot

4、hesis）H1：0（备择假设 alternative hypothesis）显著性水平：=0.05,2.选用适当的检验方法并计算相应的检验统计量根据研究分析目的要求、设计方法、资料类型和各假设检验方法的应用条件检验统计量属于样本指标，是根据现有样本，在H0成立的假设前提下，选用不同公式计算出来的不同的检验方法要计算其相应的统计量，它们各自服从特定的概率分布,3.确定P值并作出推断结论P值系指在H0成立的假设前提下，出现当前检验统计量以及更极端情况的概率。若检验结果是P，下差别有统计意义的结论。依据是：在H0成立的条件下，得到当前结果（遇到当前情形）的概率小于，而小概率事件一般不可能在一次试

5、验中发生，但现在却发生了，所以怀疑H0的正确性，于是决定拒绝H0，接受H1。此时，我们犯错误的概率最大仅为。,相反如P，即在H0成立时，发生当前事件的概率很大，或说现有样本信息支持H0，尚没有理由拒绝它（尽管 0，）。不管是拒绝还是不拒绝H0，都有可能发生错误。结论一般包含统计结论和专业结论。,大样本均数的假设检验,单样本均数的u检验例8-2：1995年，某地20岁应征男青年平均身高为168.5cm。2003年在当地20岁应征男青年中随机抽取85人，平均身高为171.2cm，标准差为5.3cm，问这两年身高是否不同。解：总体方差一般未知，当样本含量足够大时，用S作为的估计值。建立假设，确定检

6、验水准 H0：168.5，H1：168.5 0.05,计算统计量u确定P值，下结论查u界值表，4.70 u 0.001/2=3.2905,得P 0.001,按照 0.05水准，拒绝H0，接受H1，可认为2003年20岁应征男青年身高有变化，比1995年增高了。,可信区间与假设检验,可信区间主要用于推断总体均数在哪个范围；假设检验用于推断两总体均数有无差别（即质的不同）。可信区间亦可以回答假设检验的问题如上例，2003年当地男青年身高总体均数的95%可信区间为：可信区间只能在预先规定的检验水准下计算，而假设检验能得到一个确切的概率（P 值）。,两样本均数比较的u检验例8-3：为比较某药治疗流

7、行性出血热疗效，将72名患者随机分为试验和对照组，结果分别为n1=32,=2.9，S1=1.9，n2=40,=5.2，S2=2.7，问试验组和对照组的平均退热天数差别有无统计学意义。解：可用两组大样本资料的u检验。建立假设，确定检验水准 H0：1=2，H1：1 2=0.05,计算统计量u u=-4.23确定P值，做出结论查u界值表，4.23 u 0.001/2=3.2905,得P 0.001,按照=0.05水准，拒绝H0，接受H1，可认为试验组和对照组退热天数的总体均数不等，疗效不同。试验组比对照组平均退热天数短。1-2 的95可信区间为-3.3-1.3天,大样本率的假设检验,当n足够大，且

8、样本率p和(1-p)均不太小，如：np与n(1-p)均大于5时，样本率逼近正态分布，此时率的假设检验可采用u检验，其具体条件如下。n较大，如每组例数大于60；样本率p或(1-p)均不接近100%和0；np与n(1-p)均大于5,单样本率的u检验例8-4：已知道某地40岁以上成年男性高血压患病率为8.5%(0)，经健康教育数年后，随机抽取该地成年男性1000名，查出高血压患者55例，患病率(p)为5.5%。问经健康教育后，该地成年男性高血压患病率是否有降低？解：从专业上可以确认经健康教育后该地成年男性高血压患病率不可能低于健康教育前，故采用单侧检验。建立假设，确定检验水准 H0：=8.5%，H1

9、：8.5%单侧检验，=0.05,计算统计量u确定P值，做出结论单侧界值u0.01=2.32，现|u|u0.01，故P0.01，按=0.05水准拒绝H0，接受H1，差异有统计学意义，可以认为经健康教育后，该地成年男性高血压患病率有多降低,单样本率比较，当不满足正态分布应用条件时，可根据二项分布的原理直接计算概率，无效假设成立时，阳性数为X的概率：,两个率比较的u检验例8-5：某医院用黄芪注射液和胎盘球蛋白进行穴位注射治疗小儿支气管哮喘病人，黄芪注射液治疗117例，有效103例；胎盘球蛋白治疗55例，有效49例。试比较两种疗法有效率差异有无统计学意义。解：基本原理与两样本均数u检验类同，在H0

10、成立和大样本条件下，两样本率差值(p1-p2)近似服从均数为1-2=0，方差为的正态分布。,建立假设，确定检验水准 H0：1=2，H1：1 2=0.05计算统计量u确定P值，做出结论 u0.05/2=1.96，现|u|0.05，按=0.05检验水准接受H0，差异无统计学意义，尚不能认为两种疗法治疗小儿支气管哮喘的疗效有差别。,两样本率比较及多个样本率比较，当不满足正态分布应用条件时，可采用2检验或Fisher精确概率法，详见后面的2检验章节。,两类错误,类错误(type error)：拒绝了实际上是成立的H0 接受H1(弃真)，亦称假阳性错误。类错误(type error)：不拒绝实际上是不

11、成立的H0(存伪），亦称假阴性错误。,例：为考察某种降血脂新药的疗效，随机抽取n个人接受该药治疗，经过一个疗程，得各人血脂下降值。已知常规药治疗的平均血脂下降量为0，问该药是否优于常规药？H0：=0，H1：0(0)类错误把与常规药本无差别的药说成优于常规药。类错误把优于常规药的新药说成与常规药相当。,当n确定时，越大，越小；要同时减小和，可以增大n。检验效能(power of test，把握度1-):即两总体确有差别时，按水准能发现它们有差别的能力。一般未知，即不知道犯第二类错误的概率。在估计样本容量时非常重要。,单双侧检验,如例8-2，如果有理由认为(参考文献，专业背景）2003年应征男青年

12、得平均身高不会小于1995年，则可用单侧检验 H0：=0 168.5，H1：0168.5=0.05(单侧）u4.70 u0.00053.2905，P 0.0005,按检验水准=0.05，拒绝H0,接受H1，二者差别有统计学意义,标准正态分布单双侧界值,单侧检验更容易得出有差别的结论（容易犯类错误），应用时要有过硬的专业依据，发表论文时要特别注明。,假设检验应注意的问题,实验设计方面随机抽样、分组，资料具有均衡性和可比性结论的正确性是以概率作为保证的，推断结论不能绝对化报告结论时应给出检验统计量，值，单侧检验应特别说明。拒绝H0，接受H1时，要结合样本均数说明其大小。假设检验与可信区间结合起来

13、，同时给出P值和可信区间正确理解差别有统计学意义的涵义。当专业上和统计学上都有“显著性意义”时，才有实用价值,P 值,指在H0成立的假设前提下，出现当前检验统计量以及更极端情况的概率检验后才能确定只针对某个样本而言，不同的样本可能有不同的P 值 P值越小，当前实验结果越“不利于”接受H0，不能说明总体参数间的差别越大，只能据P 值做出拒绝或接受H0的定性判断,显著性水平,检验水准(size of a test)或显著性水平(significance level)需要在检验前确定（常取0.05，0.01）表示拒绝了实际上成立的H0的概率大小，也可表示在拒绝H0做出“有差别”结论时可能犯错误的最大概率。,小结,假设检验的基本思想与步骤两类错误及其相互关系可信区间与假设检验P 值与,

展开阅读全文