计数资料的基本统计方法.ppt

上传人:sccc 文档编号:5305625 上传时间:2023-06-24 格式:PPT 页数:71 大小:949.51KB
返回 下载 相关 举报
计数资料的基本统计方法.ppt_第1页
第1页 / 共71页
计数资料的基本统计方法.ppt_第2页
第2页 / 共71页
计数资料的基本统计方法.ppt_第3页
第3页 / 共71页
计数资料的基本统计方法.ppt_第4页
第4页 / 共71页
计数资料的基本统计方法.ppt_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《计数资料的基本统计方法.ppt》由会员分享,可在线阅读,更多相关《计数资料的基本统计方法.ppt(71页珍藏版)》请在三一办公上搜索。

1、计数资料的基本统计方法,温医公卫学院黄陈平,计数资料的基本统计方法,相对数及其应用 率的标准化 二项分布 2检验 诊断性试验的分析和评价,什么是计数资料?用什么指标进行描述?,一、相对数及其应用,甲、乙两地发生麻疹流行,甲地患儿100人,乙地患儿150人,何地较为严重?若甲地易感儿童500人,而乙地易感儿童1000人。,甲地麻疹发病率为 100/500100%=20%乙地麻疹发病率为 150/1000100%=15%,1.常用相对数(1)率,K为比例基数,其确定原则为:(1)习惯用法;(2)保留12位整数。,(2)构成比,各部分的构成比相加必等于100%,故又称百分比,(3)相对比 两个有关联

2、的指标之比。注:两指标互不包含。,2.应用相对数时应注意的问题(1)分母不宜过小(2)避免以比代率(3)注意平均率(合并率)的计算,(4)样本率或样本构成比的比较需假设检验(5)注意可比性 若两个总率比较,其内部构成不同,并能影响其结果,需进行率的标准化。,二、率的标准化,(1)直接法:,选择标准组的方法 1)大范围内的人口资料 2)两组年龄段人口合并 3)以其中一组为标准组,对另一组作标准化,(2)间接法:,注意事项:(1)标准化率不能反映实际水平,仅用于比较;(2)有明显交叉资料,则不能用标准化率比较;(3)若总率为样本率,仍需假设检验。,P:标准组死亡率;r:被标化组实际死亡数;niPi

3、:被标化组预期死亡数;SMR:标准化死亡比,二、二项分布1.概念:为率的抽样分布,各种情况的概率等于二项式展开各项。,0 3 生 生 生 0.2 0.2 0.2 0.008,1 2 死 生 生 0.8 0.2 0.2 生 死 生 0.2 0.8 0.2 生 生 死 0.2 0.2 0.8 0.096,2 1 死 死 生 0.8 0.8 0.2 死 生 死 0.8 0.2 0.8 生 死 死 0.2 0.8 0.8 0.384,3 0 死 死 死 0.8 0.8 0.8 0.512,P 1.000,(0.2+0.8)3=(0.2)3+3(0.8)(0.2)2+3(0.8)2(0.2)+(0.8)

4、3 三生 二生一死 一生二死 三死,2.概率的计算:(1)恰有X例阳性的概率:,(2)至少有k例阳性的概率:,(3)至多有k例阳性的概率:,3.二项分布的图形,二项分布的特点:(1)离散型(2)当=1-时,两边对称(3)当n增大,二项分布逐渐逼近正态分布 一般认为,n 和 n(1-)5时,可近似看作正态分布。4.率的标准误,表示率的抽样误差,5.二项分布的应用(1)总体率可信区间估计 1)查表法:n50,尤其p0 或 1时,现 n=41,x=19,p=46.34%。查附表6,P817得:31%63%,若x n/2,则按n-x 查表得?,然后100-?例:上题若 X=29,则 n-x=41-29

5、=12查表得:16%46%然后100-?得:54%84%,2)正态近似法:若n 50 或 n p和n(1-p)5时,(2)样本率与总体率比较 1)直接计算概率法,H0:1=0=0.01H1:1 0=0.01 单侧=0.05,2)近似正态法:n 和n(1-)5时,H0:1=0=0.2H1:1 0=0.2 单侧=0.05,(3)两样本率比较(近似正态法),四、2检验用途:率或构成比的假设检验两分类变量间的相关分析其它类型:(一)四格表资料的2检验 主要是两样本率比较什么是四格表资料?,分析的基本思想,A:为实际数;T:为理论数。即在H0:1=2 的条件下,基本格子中的频数。基本思想为分析实际数与理

6、论数的吻合度,T值的计算:,X2值大小除与|A-T|有关外,还取决于自由度,自由度一定时,X2值分布也一定。P823,附表8 X2界值表,计算:(1)基本公式法:,H0:1 2 H1:1 2=0.05,查附表8,得:,(2)专用公式法:,(3)2值校正:当1 T 5,而且N 40,=3.03 查表得:P 0.05,若未校正,X2=4.47,P 0.05,应用条件(1)T 5,而且N 40 直接用2检验。(2)1 T 5,而且N 40 校正2检验。(3)T 1 或N 40,不能用2检验。注意:上述条件是以理论数未依据,而非实际数。,H0:B CH1:B C=0.05,(二)配对四格表资料的2检验

7、(McNemar法),应用条件:b+c40,b+c 40,注意:1、该法一般用于样本含量不太大的资料。2、比较检出率时,对象应为确诊病例。,(三)四格表资料的Fisher确切概率法当T 1 或N 40时,例:在某牧区观察慢性布氏病患者植物血凝素(PHA)皮肤试验反应,资料如下表,问活动型与稳定型布氏病患者PHA皮试反应阳性率有无差别?,H0:1=2 H1:1 2=0.05,列出周边合计不变的四格表组合。,选取|A-T|值大于等于原始表格|A-T|值的组合,并计算其概率。,原始表格|A-T|=1.4,P=0.0166+0.1423+0.1079=0.2688,问题:如何进行单侧检验?,若上例问稳

8、定型患者PHA皮试反应阳性率是否高于活动型布氏病患者?,选取|A-T|1.4 并且稳定型阳性数 3的组合。即 P=P(1)+P(2)=0.1589,例:某防疫站观察当地的一个污水排放口,在高温季节和低温季节水样的伤寒菌检出情况,资料如下表,问两个季节污水的伤寒菌检出率有无差别?,P=(0.0007+0.0129)2=0.0272,(四)行列表资料的2检验 是多个样本率或构成比的比较专用公式:,H0:三种处理方法的有效率相等H1:三种处理方法的有效率不等或不全相等=0.05,=(3-1)(2-1)=2,查表得:P 0.005,注意事项:1、1/5格子以上1 T 5或任一格T 1 处理:1)增大样

9、本含量 2)合理的合并或删除 3)RC表的Fisher确切概率法,2、等级资料一般不宜用2检验,问题:若上题用2检验,其结果说明什么?,根据2可分割原理,把率或比按一定规则(最接近原则)把样本以四格表形式分割出来,计算其2值,当差异无显著性时,就把它合并成一个样本,再把它与另一较接近的样本比较,如此进行下去直到结束。,(1)进行2分割,3、多个样本率两两比较,(2)调整检验水准(2k组资料)1)共同对照组,药物1与安慰剂比较:,按=0.005的水准,尚不能拒绝H0,2)两两比较,若上例进行两两比较,则按=0.003水准来判断。,(五)两分类变量资料的关联性检验,1、双向无序分类资料的关联性检验

10、,Pearson列联系数,Pearson列联系数介于 01之间,愈接近 0,关系愈弱,愈接近1,则关系愈密切。,H0:两种血型无关联(构成比无差别)H1:两种血型有关联(构成比有差别)=0.05本例:X2=213.16,v=6,P0.005,PA:实际观察一致率;PE:期望一致率,即偶然机会 造成的一致率。,Kappa值波动于 0 1 之间。K=1,说明两次结果完全一致;若 K=0,则完全由于机遇造成。一般情况,K 0.75,一致性程度较好,K 0.4,则较差。,2、双向有序同属性两分类变量的判断一致性检验,则:Kappa=(0.83-0.355)/(1-0.355)=0.736注意:样本资料

11、计算出的Kappa值需要假设检验。,上表中红色数字为200例患者中两次检查结果一致的患者数,总计 166 例,一致率 PA=166/200=0.83 若两次检查结果一致的患者数是随机的,则:,用等级相关分析,3、双向有序属性不同的两分类变量相关分析,(六)关于2检验在其它方面的应用:,H0:1=2 H1:1 2=0.05,五、诊断性试验的分析和评价,诊断性试验包括1、狭义的诊断性试验:即各种实验室检查。2、广义的诊断性试验:除实验室检查外,还包括临床资料和影像诊断。,诊断性试验在临床上应用很广,可涉及病原学诊断、病因诊断、病理诊断、治疗效果评价指标、疾病预后判断指标等方面,临床医生需正确地选择

12、和评价诊断性试验。,诊断性试验的研究步骤:1、首先确定金标准或标准诊断;2、选择研究对象,包括用金标准核实的病例 组和对照组;3、用诊断性试验盲法同步测量研究对象;4、将获得的结果与金标准比较。,评价指标:(一)真实性指标:反映测量值与真值的差异程度。1、灵敏度(真阳性率),2、特异度(真阴性率),两者存在矛盾,而且易受患病率影响。,3、准确度(符合率),4、诊断指数=灵敏度+特异度 理想值为 200%,不大于 100%的试验方法不能成立,不大于170%的试验方法不宜采用。,5、阳性似然比=,说明患者中阳性结果是非患者阳性结果的多少倍。,6、阴性似然比=,说明患者中阴性结果是非患者阴性结果的百

13、分之几。阳性似然比与阴性似然比是反映灵敏度和特异度两方面特性,不易受患病率影响,较稳定。,7、阳性预测值=,说明阳性者中真患者的比例。,8、阴性预测值=,说明阴性者中非患者的比例。阳性预测值与阴性预测值是评价诊断性试验收益的指标。可受患病率的影响。,9、回收率,回收率是测定值对真值的相对百分比。其愈接近100%愈好。,说明用该方法检查,100名糖尿病患者中有75人呈阳性;而在100名非糖尿病患者中有61人呈阴性。,1、灵敏度(真阳性率),2、特异度(真阴性率),3、准确度(符合率),4、诊断指数,说明用该方法检查,糖尿病患者所得阳性结果约为非糖尿病患者的2倍;糖尿病患者所得阴性结果约为非糖尿病患者的4/10。,5、阳性似然比,6、阴性似然比,7、阳性预测值,8、阴性预测值,阳性预测值说明100人诊断试验阳性中,有66人是糖尿病;阴性预测值说明100人诊断试验阴性中,有71人不是糖尿病。为诊断性试验的收益指标。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号