《抽样误差与假设检验t检验.ppt》由会员分享,可在线阅读,更多相关《抽样误差与假设检验t检验.ppt(71页珍藏版)》请在三一办公上搜索。
1、抽样误差与假设检验,叶孟良,几个概念:计量资料:测定每个观察单位某项指标量的大小得到的数据(资料)。总体:研究对象(某项变量值)的全体。样本:总体中随机抽取的一部分研究对象的某项变量值。统计量:从样本计算出来的统计指标。参数:总体的统计指标叫总体参数。,统计推断:用样本信息推论总体特征的过程。包括:参数估计:运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。假设检验:又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。方法:均数的参数估计、均数t 检验,一、抽样误差与标准误(一)概念1、抽样误差:是伴随抽样所产生的样本统计量与参数之间的差别。
2、2、标准误:符号,表示抽样误差大小的指标;也称为样本均数的标准差;反映了用样本均数代替总体均数的可靠性程度的大小,增加样本容量可以降低抽样误差。,抽样误差与抽样分布,(二)、表达式与计算,样本均数的标准差,也称为标准误,反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异。,例4.1 某市随机抽查12岁男孩100人,得身高均数139.6cm,标准差6.85cm,计算标准误。,标准差与标准误联系与区别,二、抽样分布,从正态总体中抽样,样本均数()的抽样分布:1.n较大时(n50),服从正态分布,经过标准化转换 服从标准正态分布即 u分布2.n较小时(n50),是非正态的单峰对称分布 就有
3、小样本统计量()的转换值服从t分布(是一组曲线)。,抽样分布,英国统计学家:哥塞德在1908年以笔名“student”提出了著名的t分布,故也称为student t分布。t分布是描述小样本均值转换度的分布。,1、从正态总体中抽样,大样本均数的转换值服从标准正太分布2、小样本均数的转换值服从t分布,(1)tu(n)(2)和N(0,1)一样都是单峰分布,以0为中心对称(3)越小,则 越大,t值越分散,和N(0,1)相比,集中在这部分的比例越少,尾部翘得越高。,2、t分布的特征,t 分布(与u 分布 比较的特点),横坐标为自由度,纵坐标为概率p,表中数字表示自由度为、p为、t的界值,记 如单侧=0.
4、05,=20可查得=1.725 表示p(t1.725)=0.05 由t分布的对称性p(t-1.725)=0.05 t,以外尾部面积的百分数是,3、t界值表,的界值,与u分布比较,U的临界值小于t曲线相应的临界值的绝对值当n时,临界值相近。自由度越小,t的临界点越偏离u的临界点。,总体均数的参数估计,参数估计:是指由样本指标值(统计量)估计总体指标值(参数),即用样本均数估计总体均数,有两种估计方法:(1)、点估计(近似值)(2)、区间估计(近似范围),一、点估计,点估计:用样本均数直接作为总体均数的估计值,未考虑抽样误差。如用 估计相应的当 时,样本均值趋近于总体均值.如果,则 更可靠.,二、
5、区间估计,1、概念可信区间:也称为置信区间(confidence interval,CI),是按预先给定的概率估计未知总体均数的可能范围.事先给定的概率1-称为可信度,常取95%或99%总体均数的95%(或99%)可信区间:表示该区间包括总体均数的概率为95%(或99%).,根据总体标准差是否已知,以及样本含量n的大小而异。(1)t分布法(n50),2、计算方法,(1)t分布法(未知,n50),按t分布原理,可用以下公式进行区间估计:对上式进行变换,得置信度为1-的总体均数可信区间的通式为:习惯将上式写成:,例 某医师测得40名老年慢性支气管炎病人中17-酮类固醇排除量均数为15.9mol/d
6、,标准差为5.03 mol/d,试估计该种病人尿17-酮类固醇排除量总体均数的95%可信区间.本例中:n=40,=5.03,=n-1=39,取0.05,查t值表 95%的可信区间,(2)U分布法(已知或未知,但n足够大n50),总体均数的可信区间.已知:未知但n足够大:,u可以查表某地12岁男孩身高均数的95%的可信区间.本例中:n=100,=139.6,s=6.85,u0.05=1.96该地12岁男孩身高均数的95%可信区间为:138.3(cm)141.0(cm),注意,(1)统计意义:从总体中作大数次随机抽样,有95%求得的可信区间包含总体均数。并不是做一次抽样求得可信区间包括的概率是0.
7、95,对一次抽样而言只有两种可能,要么可信区间包含,要么不包含。(2)与医学正常值范围不同,正常值范围估计与可信区间估计,假设检验的意义和步骤,假设检验(hypothesis test)也称显著性检验(significance test)。二十世纪二、三十年代Neyman和Pearson建立了统计假设检验问题的数学模型。假设检验:建立在统计抽样分布,小概率事件原理基础上的对差别性质进行风险推断的一种逻辑思维方法.,假设检验:1、原因2、目的3、原理4、过程(步骤)5、结果,1、假设检验的原因,由于个体差异的存在,即使从同一总体中严格的随机抽样,X1、X2、X3、X4、,不同。因此,X1、X2
8、不同有两种(而且只有两种)可能:(1)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无显著性。(2)分别所代表的总体均数不同。差别有显著性。,根据大量调查,已知健康成年男子脉搏的均数为72次/分,某医生在一山区随机调查了30名健康成年男子,求得脉搏均数为74.2次/分,标准差为6.5次/分,能否据此认为该山区成年男子的脉搏均数高于一般人?,我们当然不能强求脉搏均数恰为72次/分时,才认为山区成年男子的脉搏均数和一般人一样,因为即使一样由于抽样误差的存在,样本均数未必等于72,造成山区健康成年男子的脉搏样本均数与一般人不同的原因有:抽样误差 环境因素的影响要回答这一问题就是假设
9、检验问题,2、假设检验的目的,判断是由于何种原因造成的不同,以做出决策。(推断参数是否相等),无效假设,备择假设,3、假设检验的原理/思想,反证法:当一件事情的发生只有两种可能A和B,为了肯定其中的一种情况A,但又不能直接证实A,这时否定另一种可能B,则间接的肯定了A。小概率事件原理:小概率事件在一次抽样中不可能发生.概率论:事件的发生不是绝对的,只是可能性大小而已。即,带有风险性的推断.,4、假设检验的一般步骤,建立一对假设(注意单双侧)确定显著性水准():无效假设(H0):两个总体均数相等;备择假设(H1):与 H0 相反;预先给定的概率值(0.05或0.01),区分大小概率事件的标准.如
10、上例,H0:1=72 H1:172=0.05 计算统计量:(选择不同的统计方法:u检验,t检验,F检验等)确定概率值p和做出统计推断结论:(p值实际得到犯一类错误的可能性,p,则统计推断为按检验水准,不拒绝H0。),5、假设检验的结果,不拒绝无效假设拒绝无效假设正确理解结论的概率性(都隐含着犯错误的可能性)。,六、均数的假设检验,t检验(t test)也称student t检验,是计量资料中最常用的假设检验方法,它以t分布为基础.本章将要介绍单个样本的t检验(样本均值与总体均值的比较)配对样本t检验两独立样本的t检验(两样本均值的比较,方差一致),单个样本t检验,单个样本t检验:是样本均数 代
11、表的总体均数 和已知总体均数 的比较.适用条件:(1)已知一个总体均数;(2)可得到一个样本均数及该样本标准误;(3)样本量小于50;(4)样本来自正态或近似正态总体。,例:根据大量调查,已知健康成年男子的脉搏均数为72次/分.某医生在某山区随机调查30名健康男子,求得脉搏均数为74.2次/分,标准差为6.5次/分.能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?,因本例已知=72次/分,=74.2次/分,s=6.5次/分,n=30,由于已知,故选用单样本t检验,1、建立检验假设,确定概率水准 山区成年男子平均脉搏数与一般成年男子相同。山区成年男子平均脉搏数与一般成年男子不同。2
12、、计算检验统计量在=0成立的条件下,计算统计量为:,3、确定p值,做出推断结论,查表2,可得 t 0.05/2(29)=2.045,今t0.05,无统计学意义,按水准,不拒绝H0,尚不能认为该山区成年男子平均每分钟脉搏数高于一般成年男子。,配对样本均数t检验简称配对t检验(paired t test),又称非独立两样本均数t检验,适用于配对设计计量资料均数的比较,其比较目的是检验两相关样本均数所代表的未知总体均数是否有差别。配对设计(paired design)是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。,配对样本t检验,(1)两种同质受试对象分别接受两种
13、处理:如:把同窝、同性别和体重相近的动物配成一对。(2)同一受试对象或同一样本的两个部分,分别接受两种不同处理:如:把服用两种降糖药的病人配成对(3)同一受试对象处理(实验或治疗)前后的结果比较:如:对高血压患者治疗前后,配对设计资料主要有三种类型:,应用配对设计可以减少实验的误差和控制非处理因素,提高统计处理的效率。,配对样本t检验的原理,配对样本t检验实际上是配对设计的差值均数与总体均数0比较的t检验配对样本t检验的基本原理是假设两种处理的效应相同,即1=2,则1-2=0(即,已知总体均数d=0),即检验差值的样本均数 所代表的未知总体均数d 与0的比较.,公式:自由度:对子数-1适用条件
14、:两组配对计量资料。样本来自正态分布总体,配对t检验要求差值服从正态分布,实际应用时单峰对称分布也可以;大样本时,用u 检验,且正态性要求可以放宽;,例 某医院在研究肾动脉成形术前后血液动力学的 改变中,观察了10例病人手术前后的 血压变化情况见表,试问手术前后舒张压有无变化?,1、建立检验假设,确定检验水准H0:d=0,即假设手术前后舒张压无变化,样本 是从差数均数为0的总体中抽得。H1:d 0,即手术前后舒张压有变化。=0.05,2、计算检验统计量先计算差值d及d2,得计算差值均数 计算差值的标准差 计算差值的标准误得,计算t值,、确定p值,作出推断结论自由度n-1=10-1=9,t 0.
15、05/2(9)=2.262本例t t0.05/2(9),p0.05,按0.05检验水准,不拒绝H0,即还不能认为手术前后的舒张压不同。,两独立样本的t检验,目的:由两个样本均数的差别推断两样本 所代表的总体均数间有无差别。计算公式及意义:公式:,应用条件:(1)已知/可计算两个样本均数及它们的标准差;(2)两个样本之一的例数少于50;(3)样本来自正态或近似正态总体;(4)方差齐。,自由度:,两独立样本t检验实例分析,例5.3 25例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食疗法,二个月后测空腹血糖(mmol/L)如表5-2 所示,问两种疗法治疗后患者血糖值是否相同?
16、,两独立样本t检验检验步骤,1、建立检验假设,确定检验水准H0:1=2,两种疗法治疗后患者血糖值的总体均数相同;H1:12,两种疗法治疗后患者血糖值的总体均数不同;0.05。2、计算检验统计量,两独立样本t检验检验步骤,代入公式,得:,两独立样本t检验实例分析,按公式计算,算得:3、确定P值,作出推断结论两独立样本t检验自由度为=n1+n2-2=12+13-2=23;查t界值表,t0.05/2(23)=2.069,t0.01/2(23)=2.807.,两独立样本t检验实例分析,t t0.05/2(23),P 0.05,按0.05的水准拒绝H0,接受H1,差异有统计学意义。故可认为该地两种疗法治
17、疗糖尿病患者二个月后测得的空腹血糖值的均数不同。,配对t检验与两样本的 t检验的比较,两样本含量较大时均数的比较,当样本含量较大时,可用u检验法某医院对4050岁年龄组的男、女不同性别的健康人群测定了 脂蛋白有无差别?,1、建立假设并确定检验水准H0:1=2,即不同性别健康人群 脂蛋白无差别;H1:12,即不同性别健康人群 脂蛋白有差别;=0.05,2、计算u值,3、确定P值 不必查表,双侧检验以u1.96时、P0.05,今u3.751.96,故p0.05。按=0.05的水准,拒绝H0,接受H1。认为男性 脂蛋白含量高于女性 脂蛋白含量。,t检验中的注意事项,1.要有严密的抽样研究计划 要保证
18、样本是从同质总体中随机抽取。除了对比的因素外,其它影响结果的因素应一致。2选用的假设检验方法应符合其应用条件要了解变量的类型是计量的还是计数的,设计类型是配对设计还是成组设计,是大样本还是小样本。,假设检验的结论是根据概率推断的,所以不是绝对正确的:(1)当 p,不能拒绝 H0,不能接受H1,按不能接受H1下结论,也可能犯错误;,3.正确理解假设检验的结论(概率性),4.正确理解差别有无显著性的统计意义差别有显著性,或有统计意义,指我们有很大的把握认为原假设不正确,并非是说它们有较大的差别。差别无显著性,或无统计意义,我们只是认为以很大的把握拒绝原假设的理由还不够充分,并不意味着我们很相信它。
19、5.统计显著性与其它专业上的显著性的意义不同,6、可信区间与假设检验的联系与区别,假设检验用以推断总体均数间是否相同,而可信区间则用于估计总体均数所在的范围,两者既有联系又有区别。,根据研究的目的和专业知识来决定单双侧,在没有特别说明的情况下通常采取双侧。,7.单侧检验与双侧检验,假设检验中两类错误,第 I 类错误和第 II 类错误,假设检验的结果有两种。,(1)当拒绝 H0 时,可能犯错误,可能拒绝了实际上成立的H0,称为 类错误(“弃真”的错误),其概率大小用 表示。(2)当不能拒绝 H0 时,也可能犯错误,没有拒绝实际上不成立的H0,这类称为 II 类错误(“存伪”的错误),其概率大小用
20、 表示,值一般不能确切的知道。,表 假设检验的两类错误,是非判断:()1标准误是一种特殊的标准差,其表示抽样误差的大小。()2N一定时,测量值的离散程度越小,用样本均数估计总体均数的抽样误差就越小。()3假设检验的目的是要判断两个样本均数的差别有多大。,选择题:,按=0.10水准做t检验,P0.10,不能认为两总体均数不相等,此时若推断有错,其错误的概率为()。A大于0.10 B,而未知 C小于0.10 D1-,而未知2某地正常成年男子红细胞的普查结果,均数为480万/mm3,标准差为41.0万/mm3,后者反映()A个体变异 B抽样误差 C总体均数不同 D均数间变异,3.两个样本均数比较,经t检验,差异有显著性,p越小,说明()A两样本均数差别越大 B两总体差别越大C越有理由认为两总体均数不同D越有理由认为两样本均数不同,思考题:,1.标准差和标准误有何区别和联系?2.可信区间和参考值范围有何不同?3.一类错误和二类错误的区别,