[临床医学]第四章总体均数的估计与假设检验.ppt

上传人:sccc 文档编号:4600907 上传时间:2023-04-30 格式:PPT 页数:177 大小:1.10MB
返回 下载 相关 举报
[临床医学]第四章总体均数的估计与假设检验.ppt_第1页
第1页 / 共177页
[临床医学]第四章总体均数的估计与假设检验.ppt_第2页
第2页 / 共177页
[临床医学]第四章总体均数的估计与假设检验.ppt_第3页
第3页 / 共177页
[临床医学]第四章总体均数的估计与假设检验.ppt_第4页
第4页 / 共177页
[临床医学]第四章总体均数的估计与假设检验.ppt_第5页
第5页 / 共177页
点击查看更多>>
资源描述

《[临床医学]第四章总体均数的估计与假设检验.ppt》由会员分享,可在线阅读,更多相关《[临床医学]第四章总体均数的估计与假设检验.ppt(177页珍藏版)》请在三一办公上搜索。

1、第四章,总体均数的估计与假设检验,第一节 均数的抽样误差与标准误,一、抽样误差与标准误,概念:抽样研究的目的就是要用样本信息来推断总体特征。由于存在变异,抽样后各个样本均数往往不等于总体均数,且各样本均数间也不一定相等。这种由抽样造成的样本均数与总体均数的差异或各样本均数之间的差异称为抽样误差,抽样误差是不可避免的。,若某市某年14岁健康女生身高资料服从=155.4cm,=5.30cm的正态分布。从该正态分布N(155.4,5.32)的总体中随机抽样,每次样本含量n=10,共抽取100次,得到100个样本的样本均数和标准差,频数分布见表。,100个样本均数的分布,样本均数的频数分布图,提示样本

2、均数的抽样分布具有如下特点:1.样本均数未必等于总体均数;2.各样本均数间存在差异;3.样本均数围绕总体均数,呈正态分布;4.样本均数的变异范围较原变量的变异范围大为缩小。(100个样本均数的均数为155.52cm,标准差为1.63cm),理论可以证明:若从正态总体 中,反复多次随机抽取样本含量固定为n 的样本,这些样本均数 也服从正态分 布,即 的总体均数仍为,样本均数 的标准差为。,1.从正态总体中重复随机抽取样本含量为n的样本,样本均数也服从正态分布;2.从偏态总体中重复随机抽样,当样本含量n足够大时(n 50),样本均数也近似服从正态分布;3.样本均数的总体均数 等于原总体均数;,数理

3、统计推论与中心极限定理,抽样分布,抽样分布示意图,抽样分布,抽样分布示意图,4.样本均数的标准差比原个体值的标准差要小,标准差为:(理论值)(估计值),标准误的意义(SE):即样本均数的标准差,反映样本均数间 的离散程度,也反映样本均数与总体均数 间的差异,说明均数抽样误差的大小。标 准误越大,说明抽样误差越大,用样本统计 量作为总体参数估计值的可靠程度越差。,二、标准误的用途,1.表示抽样误差的大小:标准误越小说明 抽样误差越小,样本均数与总体均数越 接近,用样本均数推论总体均数的可靠 性越大;2.用于估计总体均数的可信区间;3.用于均数的假设检验。,例:为了解某地1岁婴儿的血红蛋白浓度,从

4、该地随机抽取36名1岁婴儿,算得血红蛋白的平均浓度为121.3g/L,标准差为8.2g/L。计算该次抽样的标准误。,(g/L),大量研究资料显示,当地1岁婴儿血红蛋白的平均浓度为123.7g/L,标准差为11.9g/L。计算该次抽样的标准误。,(g/L),三、标准差与标准误的区别和联系,区别:1.意义:标准差:描述观察值之间的离散程度,标准差越小,表示观察值围绕均数的分布比较集中,说明均数的代表性较好;标准误:描述样本均数的离散程度,表示抽样误差的大小,标准误小,表示抽样误差小,样本均数与总体均数较接近,用样本均数推断总体均数的可靠性大。,2.表示方法:标准差:标准误:3.计算公式:标准差:标

5、准误:,4.用途:标准差:用于估计变量值的分布范围,制定医学参考值范围。标准误:用于估计总体均数的可信区间、假设检验。,5.与样本含量的关系:标准差:随着样本含量的增多,逐渐趋于稳定(一般200例以上)。标准误:随着样本含量的增多,逐渐减少.若样本含量趋近于总体观察单位的数量,则标准误趋近于0,抽样误差几乎消失。,联系:1.两者均是表示变异程度大小的指标:说明观察值之间的变异程度用标准差,说明统计量之间的变异程度用标准误。2.标准误与标准差的大小成正比,当样本含量不变时,标准差越大标准误也越大。,第二节 t 分布,一、t 分布的概念,随机变量XN(m,s2),标准正态分布uN(0,12),s,

6、0,m,1,N(m,s2/n),标准正态分布uN(0,12),m,0,1,N(m,s2/n),标准正态分布uN(0,12),m,0,1,在实际工作中,通常未知,常用S作为的估计值,但 已不再服从标准正态分布,而是服从自由度为=n-1的 t 分布。,二、t 分布的图形与特征,不同自由度下的 t 分布图,1.t 分布的图形,t 分布曲线是一簇曲线。当自由度不同时,曲线的形状不同。当时,t分布趋近于标准正态分布,但当自由度较小时,t分布与标准正态分布的差异较大。t分布曲线的形状随自由度的大小而变化。,2.t 分布的特征,.单峰分布,以0为中心,左右对称;.自由度 越小,则t 值越分散,t分布的峰部越

7、矮而尾部翘得越高;因此,t分布曲线下面积为95%或99%的界值不是一个常量,而是随自由度大小而变化的;,.当时,t分布逼近标准正态分布,故标准正态分布是t分布的极限分布(特例)。.t分布的唯一参数是自由度。,t 分布界值表,t 分布界值表,表示方法:单尾概率t值:t,双尾概率t值:t/2,3.t界值表的特点:(1).在同一自由度下,|t|值越大,概率P值越 小;(2).在相同|t|值时,双侧概率P值为单侧概 率P值的两倍;(3).概率P值一定的情况下,自由度越大,|t|值越小;自由度越小,|t|值越大;,(4).当100时,双侧t的界值接近标准正态分布的u值,=时,t 值=u值。(5).表示方

8、法:单尾概率t值:t,双尾概率t值:t/2,。,三、t分布的应用 1.总体均数的区间估计;2.t 检验。,第三节 总体均数的估计,一、可信区间(CI)的概念,1.点值估计:用相应样本统计量直接作为 其总体参数的估计值。优点:估计方法简单易行;缺点:没有考虑抽样误差的大小;缺乏概率的保证。,2.区间估计:按预先给定的概率,所确定 的包含未知总体参数的可能范围。该范围 称为总体参数的可信区间或置信区间;预先 给定的概率1称为可信度或置信度,常取 95%或 99%。若无特别说明,一般取双侧 95%。,.可信区间确切涵义:从总体中作随机抽样,根据每个样本可算得一个可信区间,如95%的可信区间,意味着作

9、100次抽样,算得100个可信区间,有95个可信区间包含总体均数(估计正确),有5个可信区间不包含总体均数(估计错误)。5%是小概率事件,对一次抽样而言出现的可能性很小,因此,在实际应用中,就认为总体均数在算得的可信区间内。,图4-2 模拟抽样成年男子红细胞数100次的95%可信区间示意图,*,*,*,*,*,*,.可信区间通常由两个数值即可信限构成,较小的称下限,较大的称上限,可信区间是开区间。.可信区间是随机的,总体参数是固定的,所以可信区间包含总体参数的可能性为1-.,可信区间的两个要素 1.准确度:反映在可信度的大小,1-越接 近1,可信区间包含的概率越大。2.精密度:反映在区间的宽度

10、,区间宽度愈 窄,精密度越高。若在样本量确定的情况下,两者是矛盾的,视情况而定。但不能笼统地认为99%可信区间比95%可信区间好,一般95%较为常用。要同时提高准确度和精密度,须增加样本含量。,二、总体均数可信区间的计算,1.未知,n较小:按t 分布计算:,双侧:,单侧:,例:为了解某地1岁婴儿的血红蛋白浓度,从该地随机抽取25名1岁婴儿,测得其 血红蛋白平均数为123.7g/L,标准差 为11.9g/L。估计该地1岁婴儿血红蛋 白的平均浓度。,2.已知或未知,但是n足够大(100)时,按正态分布原理计算可信区间。,已知:,未知,但n足够大:,双侧:,双侧:,单侧:,单侧:,例:某地抽得正常人

11、200名,测得其血清 胆固醇的均数为3.64mmol/L,标准 差为1.20mmol/L,试估计其95%可 信区间。,三、可信区间与医学参考值范围的区别,1.意义:医学参考值范围:绝大多数正常人的解剖、生理、生化等指标的波动范围;个体值的波动范围 总体均数的可信区间:按预先给定的概率,确定的未知总体参数可能所在的范围;总体均数可能所在的范围。,医学参考值范围:,双侧:,百分位数法:,单侧:,2.计算公式:,已知或未知,但n足够大:,未知,n较小:,双侧:,双侧:,或:,总体均数的可信区间:,3.应用:医学参考值范围:进行统计描述;绝大多数观察对象某项指标的分布范围;判断某项指标正常与否 总体均

12、数的可信区间:进行统计推断;估计未知的总体均数所在范围;进行均数的假设检验。,第四节 假设检验(hypothesis testing),一、假设检验的基本思想:,根据研究目的,先对总体的参数或分布做出某种假设,然后用适当的统计方法,根据样本提供的信息,对所做出的假设进行检验,依据检验结果做出是否拒绝该假设的判断,这种方法称为假设检验(又称显著性检验)。,是利用小概率反证法思想,从问题的对立面H0出发,间接判断要解决的问题H1是否成立。然后在H0成立的条件下计算检验统计量,最后通过所获得的P值加以判断。当P值小于或等于预先规定的概率值,即是小概率事件。根据小概率事件的原理:小概率事件在一次抽样中

13、发生的可能性很小,如果它发生了,则有理由怀疑原假设H0,认为其对立面H1成立,该结论可能犯大小为的错误.,例:根据大量调查,已知健康成年男子的脉搏均数为72次/分。某医生在某山区随机调查25名健康成年男子,求得脉搏均数为74.2次/分,标准差为6.0次/分,能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?,由于样本均数有抽样误差,对一个样本均数X与一个已知的或假设的总体均数0作比较,它们之间差别可能有两种原因造成:,由于抽样误差所致,山区男子脉搏的总体 均数与一般成年男子的脉搏总体均数相同,也是72次/分,现在所得样本均数74.2 次/分,仅仅是由于抽样误差造成的,统计上称之为差

14、异无统计学意义。,2.由于环境条件的影响,两个均数间有本质 差异,即山区男子脉搏总体均数与一般男 子脉搏的总体均数不同。现在所得样本 均数74.2与总体均数72有本质性差别,不 是抽样误差的原因。统计上称之为差异有 统计学意义。为判断由何种原因引起的差异,必须通 过假设检验来回答这个问题。,如何判断?利用反证法的思想,假设它们属于同一总体,如果差异不大,可以用抽样误差解释,则可以认为它们属于同一总体;如果差异很大,不能用抽样误差解释,则可以认为它们不属于同一总体。多大的差异算是由抽样误差造成的?,根据抽样分布理论计算t值或u值,求得P值来判断。如果差异大,检验统计量就大,所对应的 P值就小;当

15、P值小于预先规定的概率值(0.05或0.01)则为小概率事件,即在一次抽样中发生的可能性很小,如果它发生了,就有理由认为假设不成立,认为假设的对立面成立。这个结论的正确性冒着犯5%错误的风险。,二 假设检验的一般步骤:,1、建立检验假设,确定检验水准(1)H0:0(检验假设、无效假设)(2)H1:0(备择假设、对立假设)注意:检验假设针对的是总体,非样本;H0和H1相互联系、对立的假设,缺一不可;H0的形式一般为:某两个(或多个)总体参数相等、两总体参数差为0,或无效;H1的内容要反映出检验的单双侧。,单侧、双侧检验:.一般情况用双侧检验,较为稳妥。.双侧检验:甲组均数大于乙组均数或乙组均数大

16、于甲组均数的情况均可能出现,宜用双侧检验;.单侧检验:根据专业知识,已知甲组均数不会小于乙组均数,可应用单侧检验;.单侧检验较双侧检验更容易得出“有统计学意义”的结论,应在有充分专业依据时使用;应用单侧检验时应说明。,(3):检验水准,是预先规定的概率值,它确定了小概率事件水准。在实际工作中常取0.05,但并非一成不变,可以根据不同的目的给予不同的设置。检验水准:是预先规定的拒绝域的概率值(犯型错误的概率)。,假设检验中,先提出假设,然后在假设成立的前提下看实际抽到的样本是否属于小概率事件,若属于小概率事件,则拒绝该假设;若不属于小概率事件,则不拒绝该假设。,2、选定检验方法,计算检验统计量

17、应根据变量和资料的类型、设计方案、统计推断的目的、方法的适用条件等选择检验统计量。所有检验统计量都是在H0成立的前提条件下计算出来的。,3、确定P值,作出推断结论 P值的含义:指从H0 规定的总体中随机抽 得等于及大于和/或等于及小于现有样本获 得的检验统计量值的概率。P值的大小一般通过一个检验统计量的值 来衡量。将获得的事后概率P,与事先规定的 概率检验水准进行比较得出结论。推断的结论:统计结论和专业结论,将获得的概率P值与检验水准进行比较,得出结论。P,拒绝H0,接受H1,可以认为总体参数有差异(可以认为样本统计量差异有统计学意义)P,不拒绝H0,不可以认为总体参数有差异(不可以认为样本统

18、计量差异有统计学意义),P时,拒绝H0,接受H1。作出这一结论的理由是:在H0成立的条件下,出现等于及大于现有检验统计量的概率P,是小概率事件,在一次抽样研究中不大可能发生,即现有样本的检验统计量所提供的信息不支持H0因而拒绝它;相反,P即样本信息支持H0,就没有理由拒绝它。,结果判断:=0.05 P0.05 差别无统计学意义 0.01 P 0.05 差别有统计学意义 P 0.01 差别有高度统计学意义,第四节 t检验和u检验,1.t 检验的应用:主要用于样本含量较小(n60)、或总体标准差未知的情况。.样本均数与已知总体均数的比较;.两个小样本均数的比较;.配对设计资料均数的比较。2.t 检

19、验的应用条件:.正态性;.方差齐性。,2.u检验的应用:要求样本含量较大,或n较小但已知。.样本均数与已知总体均数的比较;.两个大样本均数的比较。,一.样本均数与总体均数的比较,进行样本均数与已知总体均数的比较,比较的目的:推断样本所代表的未知总体均数与已知的总体均数有无差别。已知总体均数:理论值、标准值或经过大量观察所得的稳定值。,检验统计量t 的计算公式及自由度:,例5.1:根据大量调查,已知健康成年男子的脉搏均数为72次/分,标准差为6.0次/分。某医生在某山区随机调查25名健康成年男子,求得脉搏均数为74.2次/分,能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?,对资料

20、进行分析:1.资料提供的信息:计量资料 已知总体均数0=72次/分,n=25,S=6.0次/分。2.应进行样本均数与总体均数比较的 t检验。3.目的:推断样本所代表的未知总体均 数与已知的总体均数有无差别。,(1)建立检验假设,确定检验水准 H0:=0,山区成年男子脉搏均数与一般成年男子的脉 搏均数相同 H1:0,山区成年男子脉搏均数与一般成年男子的脉 搏均数不同=0.05,(3)确定P值,作出统计推断结论 以=n-1=25-1=24,查t界值表,t0.052,24=2.064,tt0.052,24,P0.05,按=0.05水准尚不拒绝H0,两者的差异无统计学意义。据此资料还不能认为山区成年男

21、子的脉搏均数与一般健康成年男子的脉搏均数不同。,(2)计算统计量,(1)建立检验假设,确定检验水准 H0:=0,山区成年男子脉搏均数与一般成年男子的脉 搏均数相同 H1:0,山区成年男子脉搏均数高于一般成年男子的 脉搏均数 单侧=0.05,(3)确定P值,作出统计推断结论 以=n-1=25-1=24,查t界值表,t0.05,24=1.711,tt0.05,24,P0.05,按=0.05水准拒绝H0,接受H1,两者的差异有统计学意义。可以认为山区成年男子的脉搏均数高于一般健康成年男子的脉搏均数。,(2)计算统计量,0=72次/分,=?次/分,山区人群(未知总体),一般人群(已知总体),假设:=0

22、,0,1.833,1.711,2.492,0.01p0.05,例5.2 以往通过大规模调查已知某地新生儿出生体重为3.30kg,从该地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重为3.42kg,标准差为0.40kg。问该地难产儿出生体重是否与一般新生儿体重不同?,对资料进行分析:1.资料提供的信息:计量资料 已知总体均数0=3.30kg,n=35,S=0.40kg。2.应进行样本均数与总体均数比较的 t检验。3.目的:推断样本所代表的未知总体均 数与已知的总体均数有无差别。,(1)建立检验假设,确定检验水准 H0:=0,该地难产儿与一般新生儿平均出生体重相同 H1:0,该地难产儿与一

23、般新生儿平均出生体重不同=0.05,(3)确定P值,作出统计推断结论 以=n-1=35-1=34,查t界值表,t0.052,34=2.032,tt0.052,34,P0.05,按=0.05水准尚不拒绝H0,两者的差异无统计学意义。据样本提供的信息,还不能认为该地难产儿与一般新生儿平均出生体重不同。,(2)计算统计量,例:某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得均数为130.83g/L,标准差为25.74g/L。已知正常成年男性的血红蛋白平均值为140g/L,问从事铅作业工人的血红蛋白平均值是否不同于正常成年男性?,(3)确定P值,作出统计推断结论 以=n-1=36-1=35,查

24、t界值表,t0.052,35=2.030,tt0.052,35,P 0.05,按=0.05水准拒绝H0,接受H1,差异有统计学意义。可以认为从事铅作业男性工人的血红蛋白含量不同于正常成年男性。即从事铅作业男性工人的血红蛋白含量低于正常成年男性。,(2)计算统计量,二、配对样本均数的t检验,配对设计(paired design):将受试对象按照某种特征相同或相近的原则配成对子,每对中的两个受试对象随机分配到两个不同处理组或实验组和对照组中,分别给予不同的处理,称配对设计。优点:由于同对的受试对象间均衡性较好,可减少非研究因素对结果的影响,提高统计处理的效率。,人群试验中:常将性别相同、年龄、生活

25、条件、工作条件、病情等因素相近的人配成对子。动物实验中:常将动物的种属、窝别、性别相同、体重相近的动物配成对子。,在医学科研中,配对设计主要有以下几种情况:1.两个同质受试对象分别接受两种不同的处理;2.同一受试对象或同一标本的两个部分,分别接 受两种不同的处理;目的:推断两种处理有无差别。3.同一受试对象处理前后比较(自身对比);目的:推断该种处理有无作用。特点:不能随机分配处理因素,在实验研究中应 设平行对照。,配对t检验的基本原理:假设两种处理的效应相同,即1=2,则1-2=0(可视为已知总体均数0=0),即可看成是差值的样本均数所代表的未知总体均数d与已知总体均数0=0的比较。应用条件

26、:差值服从正态分布。,样 本,治疗前后血红蛋白的变化(差值),问题归纳:样本疗效 药物作用+机遇,对上面问题可以作如下考虑:,问题:究竟多大能够下“有效”的结论?,假定治疗前后血红蛋白检测结果的差值服从正态分布,若 则 服从t 分布。根据 t 分布能够得到有如此大差异的相应的概率P值,如果P 值很小,即计算出的t 值超出了给定的界限,则倾向于拒绝H0,认为治疗前后有差别。,图4-3 利用t 分布进行假设检验原理示意图,检验统计量t 值的计算公式及自由度:,例5.3:测得贫血儿童治疗一个疗程前后血红蛋白(g/L),资料见表。试比较治疗前后患儿血红蛋白含量有无差别?资料所提供的信息:1.计量资料

27、2.配对设计。,表 贫血患儿治疗一个疗程前后血红蛋白(g/L)变化情况,H0:d=0,即治疗前后患者血红蛋白含量相同 H1:d0,即治疗前后患者血红蛋白含量不同=0.05,以n-110-19,查t界值表得:t0.05/2,92.262,t0.01/2,93.250,13.3053.250,故P0.01,按0.05水准,拒绝H0,接受H1,差别有统计学意义。即可以 认为治疗前后患者血红蛋白含量不同,治疗 后血红蛋白水平升高,治疗有效。,例:应用某药治疗9例高胆固醇患者,观察治疗前后血浆胆固醇变化情况,结果见表。问该药是否对患者治疗前后血浆胆固醇变化有影响?,表 用某药治疗前后血浆胆固醇变化情况,

28、H0:d=0,该药对血浆胆固醇无影响 H1:d0,该药对血浆胆固醇有影响=0.05,以n-19-18,查t界值表得:t0.05/2,82.306,t0.01/2,82.355,5.172.355,故P0.01,按0.05水准,拒绝H0,接受H1,差异有统 计学意义。可以认为该药对血浆胆 固醇有影响,该药物可降低胆固醇。,三、两独立样本均数的t检验,应用:两样本t 检验又称成组t检验,适用于完全随机设计的两样本均数比较。目的:推断两样本所来自的总体其总体均数是否相同。要求:样本来自正态总体,两样本均数比较时还要求两样本总体方差相等。,完全随机设计(completely random design

29、):是将全部试验对象按随机化的方法分配到 g 个处理组(水平组),各组分别接受不同水平的处理,试验结束后比较各组均数之间的差别有无统计学意义,推断处理因素的效应。各组样本含量可以相等也可以不等,相等时检验效率较高。,完全随机设计样本均数的比较,有两种类型:一种是选择一定数量的研究对象,将他们随机分成两组,分别施以不同的处理。如:临床试验中,为比较两种治疗方案的治疗效果,选择具有一定特征的病例,将他们随机分成两组,每组分别接受不同的治疗方案。第二种:从两组具有不同特征的人群中,分别随机抽取一定数量的样本,比较某一指标在不同特征人群中是否相等。如:比较矽肺患者与煤工尘肺的损伤程度是否相同。,1.两

30、样本均数的比较 当样本来自的两总体方差相等,即12=22时,进行t 检验。此时将两样本方差合并,求两者的共同方差-合并样本方差:Sc2。,例:为研究某新药的降糖效果,某医院对40名型糖尿病病人进行同期随机对照试验,试验者将这些病人随机等分到试验组(新药)和对照组(传统药),分别测得试验开始前和8周后的空腹血糖下降值,详细情况见下表,能否认为新药与传统药的降糖效果不同?,表 试验组和对照组空腹血糖下降值(mmol/L),H0:12,新药和传统药的降糖效果相同 H1:12,新药和传统药的降糖效果不同=0.05,查t界值表得,t0.05/2,382.024,tt0.05/2,38,得P 0.05,按

31、=0.05水准,尚不拒绝H0,两者的差异无统计学意义,还不能认为新药和传统药的降糖效果不同。,例:某克山病区随机抽样测得11例急性克山病患者和13例健康人的血磷值如表。问急性克山病患者和健康人的血磷值是否不同?,表 11例急性克山病患者与13例健康人的血磷值(mmol/L),H0:12,急性克山病人与健康人的血磷值相同 H1:12,急性克山病人与健康人的血磷值不同=0.05,查t界值表得,t0.05/2,222.024,t0.01/2,22 2.712,t0.05/2,22 t t0.01/2,22,得0.01 P 0.05,按=0.05水准,拒绝H0,接受H1,两者的差异有统计学意义,可以认

32、为该地急性克山病患者和健康人的血磷值不同,急性克山病患者较高。,2、两样本几何均数比较的t 检验 目的:比较两样本几何均数,推断其各自所代表的总体几何均数是否差别。,例:选甲型流感病毒血凝抑制抗体滴度(倒数)5者24人,随机分为两组,每组12人。用甲型流感病毒活疫苗进行免疫,一组用气雾法,另一组用鼻腔喷雾法。免疫后一个月采血,分别测定血凝抑制抗体滴度,结果如下,问两法免疫的效果有无差别?,表 气雾组和鼻腔喷雾组甲型流感病毒血凝抑制抗体测定结果,H0:两总体几何均数相等 H1:两总体几何均数不等=0.05 计算t值:,查t界值表得,t0.05/2,222.024,t0.01/2,22 2.712

33、,t t0.01/2,22,得P 0.01,按=0.05水准,拒绝H0,接受H1,两者的差异有统计学意义,可以认为两种免疫方法的效果有差别,鼻腔喷雾免疫法效果较好。,进行两样本均数的比较,两样本含量相等,其优点:1、两样本含量相等时,计算简便;2、两样本含量相等时,检验效能较高。,四、u检验,1、单样本u检验:进行样本均数与已知总体均数的比较。,0已知,0未知,但n足够大(60),例:根据以往经验,传统疗法治疗肺炎的平均退热天数为6.3天,标准差为1.1天。某医师用某新疗法治疗观察了30例肺炎患者,平均退热天数为5.3天。问该新疗法的治疗效果是否与传统疗法相同?,(1)建立检验假设,确定检验水

34、准 H0:=0,该疗法与传统疗法的平均退热天数相同 H1:0,该疗法与传统疗法的平均退热天数不同=0.05,(3)确定P值,作出统计推断结论 查u界值表,u0.052=1.96,u0.012=2.58,uu0.012,P0.01,按=0.05水准拒绝H0,接受H1,两者的差异有统计学意义。可以认为两种疗法治疗肺炎的效果不同,新疗法优于传统疗法。,(2)计算统计量,2、两样本u检验:适用于两样本含量均较大(n160,且 n260)时。特点:简单,但只是近似方法。u界值与自由度无关。u0.05/21.96,u0.01/22.58,例:某地随机抽查了2529岁正常人群的红细胞数,其中:男性156人,

35、得均数为4.65(1012/L),标准差为0.55(1012/L);女性74人得均数为4.22(1012/L),标准差为0.44(1012/L),问该人群男女不同性别间红细胞数有无差异?,H0:12,不同性别间红细胞数相同 H1:12,不同性别间红细胞数不同=0.05,查u界值表得,u0.05/21.96,u0.01/22.56,uu0.01/2,得P 0.01,按=0.05水准,拒绝H0,接受H0,两者的差异统计学意义,可以认为该地该人群男女不同性别之间红细胞数有差别,男性高于女性。,第五节、假设检验的注意事项,(一)、要有严密的研究设计 这是假设检验的前提。要求样本具有代表性和均衡可比性,

36、即除比较的主要因素外,其他影响结果的有关因素都应尽可能一致,或能在资料处理时消除其影响。样本的获得必须遵循随机化的原则,避免主观、随意选择。,(二)、应根据资料的特点和分析目的,选用适当 的假设检验方法。资料的性质不同、设计类型不同、样本含量的多少,均可影响所选用的假设检验的方法。两小样本的t 检验,应用的前提条件是:正态性和方差齐性,否则选用t检验。配对设计的计量资料,只能用配对设计的t 检验,不能进行成组比较,否则会降低统计效能,得出错误的结论。,(三)、正确理解假设检验的结论(概率性)假设检验利用小概率反证法的思想,根据样本统计量作出的推断结论具有概率性,所以其结论不是绝对的:1、当P,

37、拒绝H0,接受H1;按接受H1下结论,但是H0不是绝对不成立,所以可能犯错误;2、当P,不能拒绝H0,不能接受H1;按不能接受H1下结论,但是H0不是绝对成立,也可能犯错误。3、假设检验的结果并不是指差异的大小,只能反映两者是否相同或不同。,1、当P,则结论为按所取检验水准,拒绝H0,接受H1,有统计学意义(统计结论)。可认为.不同或不等(专业结论)。2、当P,则结论为按所取检验水准,不拒绝H0,无统计学意义(统计结论)。还不能认为.不同或不等(专业结论)。3、不拒绝H0不等于接受H0,因为此时拒绝H0的证据不足.从决策的观点:可认为暂时“接受”它或“阴性待诊”。下结论时,对H0只能说:拒绝或

38、不拒绝H0;而对H1只能说接受H1。,(四)、假设检验的结论不能绝对化 所有的统计结论均具有概率性质,在做推断时,可能会犯错误;因此不宜用“肯定”、“一定”、“证明”等类似的词。当计算出的检验统计量其相应的P值接近时,下结论应尤其慎重。(1)因取同一检验水准,就现有样本的信息尚不拒绝H0,但增加样本含量后,由于抽样误差的减少可能拒绝;(2)检验水准是根据分析要求确定的,具有一定的灵活性。,(五)、单侧检验与双侧检验的选择(1)对同一资料进行检验,有可能双侧检验无统计学意义,单侧检验有统计学意义。因此,在进行假设检验时,应事先根据专业知识和问题的要求在设计时确定;(2)如果已具备了单侧检验的条件

39、而放弃单侧检验,则会丧失部分信息。,(六)、正确理解实际意义与统计学意义的区别 假设检验的结果并不表示专业上的实际意义,只能反映两者是否相同。(1).差别有统计学意义,不应理解为差异很大或有显著的价值;(2).差异大小的实际意义只能根据专业知识确定(3).P值的大小不能表示实际差异水平的高低。,实际意义与统计学意义两者间的关系:1.统计结论与专业结论一致,最终结论与两者一致;2.统计结论与专业结论不一致,最终结论需根据实际情况加以考虑;3.统计结论有意义,专业结论无意义,则可能由于 样本含量过大或设计存在缺陷,则最终结论无意义;4.统计结论无意义,专业结论有意义,应当检查设计是否合理、统计方法

40、是否选用得当、样本含量是否足够等方面,并进一步进行分析验证。,如:有研究者调查我国城市女婴的出生体重,北方5385人,均数为3.08kg,标准差为0.53kg,南方4896人,均数3.10kg,标准差0.34kg。u=2.30,P0.05。,七、结果报告 格式:检验统计量 单侧检验应说明 检验水准 P值的比较确切的范围 统计推断结果结合专业知识对所研究的事物做出比较全面的分析。,第六节 假设检验中的两类错误,H0:=0,H1:0,0,1-,型错误:拒绝了实际成立的H0,即“弃真”,其概率大小为。假设检验时,研究者可根据不同研究目的确定 的大小,如规定=0.05,当拒绝H0 时,理论上100次检

41、验中平均有5次发生这样的错误;型错误:没有拒绝实际不成立的H0,即“存伪”,其概率大小为,其大小一般不能确切的知道,需要根据两总体差值、检验水准、样本含量n计算得到。(1-)称为检验效能,它的意义是当两总体确有差异,按照规定的检验水准所能发现该差异的能力。如两总体确有差别,若1-=0.90,则理论上在100次这样的检验中,能够得出90次有统计学差异的结论。,两者的关系:拒绝H0只可能犯类错误,不可能犯类错误;不拒绝H0只可能犯类错误,不可能犯类错误。越小,越大;越大,越小;欲同时减小两类错误,唯有增加样本含量。,第七节 可信区间与假设检验的 区别与联系,联系:1.可信区间也可以回答假设检验的问

42、题。可信区间若包含了H0,按水准不拒绝H0;可信区间若不包含H0,按水准拒绝H0,接受H1.2.可信区间比假设检验可提供更多的信息。可信区间还能提示差别有无实际的专业意义。,区别:可信区间用于量的推断,即估计总体均数的范围。假设检验质的推断,即判断两总体均数是否不同。,表 用某药治疗前后血浆胆固醇变化情况,H0:d0,该药对血浆胆固醇无影响 H1:d0,该药对血浆胆固醇有影响=0.05,该区间未包含H0,按=0.05拒绝H0,接受H1,有统计学意义,即该药对血浆胆固醇有影响。,计算差值d的双侧(1-)可信区间:,有统计学意义,有实际专业意义的值 H0,有实际专业意义,可能有实际专业意义,无实际

43、专业意义,样本例数太少,不拒绝H0,图示 可信区间在统计推断上提供的信息,无统计学意义,第一条线:下限超过实际意义值,说明不但有统计 意义,而且有实际意义,值得重视;第二条线:有统计意义,提示可能有实际意义,但可 信区间较宽,应增大样本含量继续观察;第三条线:有统计意义,但无实际意义,增大样本含 量无济于事;第四条线:样本含量小,抽样误差大,由于抽样误差 的干扰,难以得出正确的结论;第五条线:无统计意义,增大样本含量可能会有统 计意义,但无实际意义。,标准差与标准误的区别与联系,总体均数可信区间与参考值范围的区别,小 结虽然可信区间也可以回答假设检验的问题,并能提供更多的信息,但是并不意味着可

44、信区间能够完全代替假设检验。可信区间只能在预先规定的概率(检验水准)的前提下进行计算,而假设检验能够获得一较为确切的概率P值。将两者结合起来,才是完整的分析。,1.总体参数值在现实中通常不能获得,而是通过随机样本来进行估计。由于个体存在差异,因此通过样本推论总体时会存在一定的误差,这种由抽样造成的样本均数与总体均数的差异称为抽样误差。抽样误差的大小可以用标准误进行衡量。,2.参数估计有点估计和区间估计两种方式。点估计的重要表达方式是平均值;区间估计是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。区间越窄说明估计的精确度越高。,3.总体均数可信区间的计算公式可以利用 的抽样分布

45、获得。可是利用 t 分布计算可信区间。单侧可信区间只需将公式中的双侧界值换成单侧界值。,4.假设检验的思想是:首先对所需要比较的总体提出一个无差别的假设,然后通过样本数据去推断是否拒绝这一假设。其实质是判断观察到的“差别”是抽样误差引起还是总体上的不同。,5.假设检验主要特点:.统计检验的假设是关于总体特征的假设;.用于检验的方法是以检验统计量的抽样分布为理论依据;.作出的结论是概率性的,不是绝对的肯定或否定。,6.假设检验有三个基本步骤:建立假设和确定检验水准,通常选 选择检验方法和计算检验统计量 确定P 值和做出统计推断结论 所有的假设检验都按照这三个步骤进行,各种检验方法的差别在于第步计算的检验统计量不同。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 教育教学 > 成人教育


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号