《分类变量资料的统计推断(预防医学).ppt》由会员分享,可在线阅读,更多相关《分类变量资料的统计推断(预防医学).ppt(32页珍藏版)》请在三一办公上搜索。
1、1,分类变量资料的统计推断,2,率的抽样误差与总体率的区间估计,3,一、率的抽样误差与标准误,在同一总体中按一定的样本含量n抽样,样本率和总体率或样本率之间也存在着差异,这种差异称为率的抽样误差。率的抽样误差的大小是用率的标准误来表示的。,4,公式:,5,二、总体率的区间估计,正态分布法 样本含量n足够大,p和1-p均不太小,且np与n(1-p)均5时,6,查表法 当样本含量较小(如n50),np或n(1p)5时,样本率的分布呈二项分布,总体率的可信区间可据二项分布的理论求得。,7,率的u检验,应用条件:样本含量n足够大,np与n(1p)均5。此时,样本率p也是以总体率为中心呈正态分布或近似正
2、态分布的。,8,一、样本率与总体率比较的u检验,u值的计算公式为,9,二、两样本率比较的u检验,适用条件为两样本的np和n(1-p)均大于5。计算公式为,10,2 检验,2 检验用途:1.检验两个或多个样本率及构成比之间有无差别;2.两属性变量间的关联分析;3.频数分布的拟和优度检验等。,11,一、四格表资料的 2 检验,四格表资料的检验主要用于两个样本率(或构成比)的假设检验,一般制成表1的计算格式(以阳性和阴性为例)。,12,表1 四格表资料 2 检验计算表,13,一、四格表资料的 2 检验,例:为了解某中草药预防流感的效果,将410名观察者随机分为两组,观察结果如表11-1,问两组流感发
3、病率是否有差别?,14,实际数,理论数,15,(一)2 检验的基本思想,=(R-1)(C-1),2 分布:连续性分布,与自由度有关。2 界值表:P196 附表111,16,(一)2 检验的基本思想,首先假设H0成立,基于此前提计算出2值,它表示观察值与理论值之间的偏离程度。根据2分布,由统计量2及自由度可以确定在H0成立的条件下获得当前统计量及更极端情况的概率P。,17,(一)2 检验的基本思想,如果P值很小,说明观察值与理论值偏离程度太大,应当拒绝原假设,表示比较资料间的差异有统计学意义;否则就不能拒绝原假设,还不能认为 资料间有差异。,18,(二)2 检验的步骤,1.基本公式法:条件:n4
4、0,T5,理论频数T,=(R-1)(C-1),19,1.建立假设,确定检验水准 H0:1=2 H1:1 2,=0.052.计算统计量 T11=50.49 T12=179.51 T21=39.51 T22=140.49,20,=(2-1)(2-1)=13.确定P及结论,根据=1查 2 界值表,得0.01P 0.025,按=0.05的检验水准,拒绝H0,接受H1,可认为两组发病率差别有统计学意义,服药组流感发病率低与对照组。,21,2.四格表检验专用公式,22,表2 用药组和对照组流感发病率的比较,23,两种方法计算结果,24,3.四格表值的校正,条件:(1)任一格的1T5,且n40时,需计算校正
5、值。(2)任一格的T1或n40时,用确切概率计算法。,基本公式,专用公式,25,二、配对四格表资料的2检验,用途:用于配对定性资料差异性的假设检验。,若b+c40,公式为:,若b+c40,需计算X2校正值:=1,26,二、配对四格表资料的2检验,例11.7 某医师对55例类风湿关节炎患者,分别采用免疫比浊法(ITA)与乳胶凝集试验(LAT)法检测类风湿因子(RF),结果见表11-3,问两种方法检测效果有无差别?,27,表11-3 两种方法检测RF结果比较,28,检验步骤,H0:B=CH1:BC=0.05,根据=1查2界值表,得0.005P 0.01,按=0.05的检验水准,拒绝H0,接受H1,
6、可认为两种方法检出率有差别,ITA检出阳性率高于LAT。,29,三、行列表的2检验,行列表(RC表)的检验主要用于解决多个样本率或多个样本构成比的比较以及有序分类资料的关联性检验。基本公式=(R-1)(C-1),30,简化公式:式中n为总例数,A为每格子的实际频数,nR、nC分别为与某格子实际频数(A)同行、同列的合计数。,=(R-1)(C-1),31,(三)行列表资料的检验的注意事项,1.理论数不宜太小,一般不宜有1/5以上格子的理论频数小于5,或有一个理论频数小于1。对理论数太小有三种处理方法:最好增加样本含量以增大理论频数,根本的方法。删去理论频数太小的行和列;此法不好。将理论频数较小的行或列与邻行或邻列进行合理的合并以增大理论频数。但后两法可能会损失信息,,32,(三)行列表资料的检验的注意事项,2.当多个样本率(或构成比)比较的检验,结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间不全相等,但不能认为彼此间都不相等。若要比较彼此间的差别,可用的行列表的分割法。,