医学统计学计数资料的统计描述.ppt

上传人:sccc 文档编号:5397852 上传时间:2023-07-03 格式:PPT 页数:75 大小:3.13MB
返回 下载 相关 举报
医学统计学计数资料的统计描述.ppt_第1页
第1页 / 共75页
医学统计学计数资料的统计描述.ppt_第2页
第2页 / 共75页
医学统计学计数资料的统计描述.ppt_第3页
第3页 / 共75页
医学统计学计数资料的统计描述.ppt_第4页
第4页 / 共75页
医学统计学计数资料的统计描述.ppt_第5页
第5页 / 共75页
点击查看更多>>
资源描述

《医学统计学计数资料的统计描述.ppt》由会员分享,可在线阅读,更多相关《医学统计学计数资料的统计描述.ppt(75页珍藏版)》请在三一办公上搜索。

1、第五章计数资料的统计分析Description of Enumeration data,流行病与卫生统计学教研室公共卫生学院,outline,Rate、constituent ratio and ratio Application of relative measurement Standardization rate Dynamic series,第五章 计数资料的统计描述,常用的相对数:一、率。二、构成比三、相对比,计数资料常见的数据形式是绝对数,如某病的出院人数、治愈人数、死亡人数等。但绝对数通常不具有可比性:1、如甲、乙两个医院某病出院人数不同时,比较两医院该病的死亡人数没有意义 2、

2、如00级七年制一、二大班学生人数不同时,比较两班医学统计学的及格人数没有意义 因此需要在绝对数的基础上计算相对数。,第一节 常用相对数,一、率:说明某现象发生的频率或强度。常以百分率(%)、千分率()、万分率(1/万)、十万分率(1/10万)等表示,计算公式为:,式中比例基数,可以取100%、1000、10万/10万等。比例基数的选择主要根据习惯用法和使计算的结果能保留12位整数,以便阅读。例如患病率通常用百分率、婴儿死亡率用千分率、肿瘤死亡率以十万分率表示。,例5-1 某医院1998年在某城区随机调查了8589例60岁及以上老人,体检发现高血压患者为2823例。高血压患病率为:2823/85

3、89 100%=32.87%。,例5-2:某幼儿园有100名儿童1998年3月发生麻疹流行有30名儿童患病。问此时该幼儿园麻疹发病率是多少?,其中10名曾经患过麻疹,有30名有麻疹疫苗接种史,有40名是新入园的。,二、构成比构成比:表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布。通常以100%为比例基数。其计算公式为:,设某事物个体数的合计由A1,A2,Ak个部分组成,构成比的计算为:.,例5-3 某医院1990年和1998年住院病人死于五种疾病的人数见表5-1。1990年因五种疾病死亡的人数共190人,其中死于恶性肿瘤者58人,恶性肿瘤

4、死亡人数占五种疾病死亡人数的构成比为 58/190100%=30.53%。同理可分别计算出1990年和1998年循环系统疾病、呼吸系统疾病等死亡占五种疾病死亡人数的构成比,结果见表5-1。,从表5-1可以看出该医院1990和1998两年五种疾病死亡构成比的排序不同。1990年五种疾病死亡人数中恶性肿瘤所占比重最大,其次为循环系统疾病,消化系统疾病死亡占的比重最小;1998年循环系统疾病占五种疾病死亡人数的比重最大,其次为恶性肿瘤,消化系统疾病、传染病死亡则占比重最小。,构成比有两个特点:(1)说明同一事物的k个构成比的总和应等于100%,即各个分子的总和等于分母。(2)各构成部分之间是相互影响

5、的,某一部分比重的变化受到两方面因素的影响。其一是这个部分自身数值的变化,其二是受其它部分数值变化的影响。,表5-1中,1990与1998年住院病人五种疾病死因构成的总和均为100%。1998年呼吸系统疾病死亡人数比1990年少,但构成比却比较接近;再看两年的循环系统疾病死亡人数相同,而1998年的构成比却较1990年高,这不能说明1998年循环系统疾病的病死严重程度较1990年高。死因构成比只能说明某病死亡人数在总死亡人数中所占比重,如需要比较其病死的严重程度,则要计算病死率。,例5-4:某地各年龄组妇女宫颈癌危险人数及患者资料如下表,问哪个年龄组妇女容易患宫颈癌。,表5-4:某地妇女各年龄

6、组宫颈癌患者构成比及患病率年龄 危险人数 患者数 构成比 30以下 100000 3 1.230-96667 29 11.2 40-63000 82 31.850-24000 96 37.260-6000 48 18.6 合计 289667 258 100.0,构成比=(患者数/合计)100%,百万患病率=(患者数/危险人数)1000000%,三、相对比相对比简称比(ratio),是两个有关指标之比,说明两指标间的比例关系。两个指标可以是性质相同,如不同时期发病数之比;也可以性质不同,如医院的门诊人次与病床数之比。通常以倍数或百分数(%)表示。,式中两指标可以是绝对数、相对数或平均数。,计算公

7、式为,例5-5 某年某医院出生婴儿中,男性婴儿为370人,女性婴儿为358人,则出生婴儿性别比例为370/358100=103,说明该医院该年每出生100名女婴儿,就有103名男性婴儿出生,它反映了男性婴儿与女性婴儿出生的对比水平。据大量观察,出生婴儿男多于女,出生性别比一般在104-107之间。这个医院的出生性别比为103,说明该年该医院出生女婴相对较多。,第二节 应用相对数的注意事项,1、计算相对数应有足够数量即分母不宜太小。如果例数较少会使相对数波动较大。如某种疗法治疗5例病人5例全部治愈,则计算治愈率为55100%=100%,若4例治愈,则治愈率为45100%=80%,由100%至80

8、%波动幅度较大,但实际上只有1例的变化。在临床试验或流行病调查中,各种偶然因素都可能导致计算结果的较大变化,因此例数很少的情况下最好用绝对数直接表示。,但动物实验时,可以通过周密设计,严格控制实验条件,例如毒理实验,每组用10只纯种小鼠也可以了。分母到底多大才可以呢?要根据研究目的、研究指标而定!,2、不能以构成比代替率构成比是用以说明事物内部某种构成所占比重或分布,并不说明某现象发生的频率或强度,在实际工作中经常会出现将构成比指标按率的概念去解释的错误例如表5-2研究已婚育龄妇女在不同情况下放置避孕环与失败率的关系。,表5-2 已婚育龄妇女不同情况下放环失败率的比较,临床工作者常常用门诊或住

9、院病人的资料来分析疾病与年龄、性别、职业等因素的关系。但值得注意的是所计算的相对数一般都是构成比,不能当作率来分析。,3、正确计算合计率 对分组资料计算合计率或称平均率时,不能简单地由各组率相加或平均而得,而应用合计的有关实际数字进行计算。,C.(30+30)/(150+100)100%=24%。,A.20%+30%=50%,B.(20%+30%)/2=25%,,甲乙两医院某病治疗情况比较,4、注意资料的可比性 在比较相对数时,除了要对比的因素(如不同的药物),其余的影响因素应尽可能相同或相近。在临床研究和动物实验时,应遵循随机抽样原则进行分组。,下列因素可能影响对比组之间的可比性:(1)观察

10、对象是否同质,研究方法是否相同,观察时间是否相等,以及地区、周围环境、风俗习惯和经济条件是否一致或相近等。(2)观察对象内部结构是否相同,若两组资料的年龄、性别等构成不同,可以分别进行同年龄别、同性别的小组率比较或对总率(合计率)进行标准化后再作比较(见本章第三节)。,5、对比不同时期资料应注意客观条件是否相同 例如,疾病报告制度完善和资料完整的地区或年份,发病率可以“升高”;居民因医疗普及,就诊机会增加,或诊断技术提高,也会引起发病率“升高”。因此在分析讨论时,应根据各方面情形全面考虑,慎重对待。6.样本率(或构成比)的比较应做样本率(或构成比)假设检验。,第三节 率的标准化法,一、标准化法

11、的意义和基本思想当比较的两组或多组资料,其内部各小组率明显不同,且各小组观察例数的构成比,诸如年龄、性别、工龄、病情轻重、病程长短等也明显不同时,直接比较两个或多个合计率是不合理的。因为其内部构成不同,往往影响合计率大小。,表5-4两种疗法的治愈率比较,要正确比较两种疗法的合计治愈率,必须先将两组治疗对象的病型构成按照统一标准进行校正,然后计算出校正后的标准化病死率再进行比较。这种用统一的内部构成,然后计算标准化率的方法,称为标准化法。标准化法的基本思想是:采用某影响因素的统一标准构成以消除构成不同对合计率的影响,使通过标准化后的标准化合计率具有可比性。,二、标准化率的计算(一)标准化方法 1

12、、直接法 2、间接法 根据已有资料的条件,采用不同的方法计算标准化率。如对死亡率的年龄构成标准化,若已知年龄别死亡率,可采用直接法;若只有总死亡数和年龄别人口数而缺乏年龄别死亡率时,或各年龄组人口数较小,年龄别死亡率不稳定时,宜用间接法。,标准化法计算的关键是选择统一的标准构成。选择标准构成的方法通常有三种:1.两组资料中任选一组资料的人口数(或人口构成)作为两者的“共同标准”。这种方法适用于直接法。2.两组资料各部分人口之和组成的人口数(或人口构成)作为两者的“共同标准”。这种方法适用于直接法。3.另外选用一个通用的或便于比较的标准作为两者的“共同标准”,如采用全国、全省或全地区的数据作为标

13、准。,(二)计算标准化率计算标准化率的步骤可归纳为:1.根据对比资料所具备的条件选用直接法或间接法。2.选定标准构成。3.选择公式(5-4)、(5-5)或(5-6)计算标准化率,现以死亡率的年龄构成标准化为例说明标准化率的计算。,(1)直接法的计算:选择年龄别人口数作标准时,直接法标准化率的计算公式为:(5-4)Ni为标准年龄别人口数,为实际年龄别死亡率 N为标准人口总数。是预期死亡数,它除以标准人口总数N即得直接法的标准化死亡率。,选择年龄别人口构成比作标准时,直接法标准化率的计算公式为:Ni/N为标准年龄别人口构成比,乘以实际年龄别死亡率,其乘积和也是直接法的标准化死亡率。,(2)间接法的

14、计算:选择年龄别死亡率作标准,间接法标准化率的计算公式为:,标准总死亡率与SMR的乘积即得间接法的标准化死亡率。需要说明的是,SMR这个指标在流行病学中用的较多,若SMR 1,表示被标化人群的死亡率高于标准组;反之,若SMR 1,表示被标化人群的死亡率低于标准组。但样本的SMR有抽样误差,在单独使用SMR这个指标时,还需作总体SMR是否为1的假设检验。,(三)标准化率的计算步骤 1.直接标准化(1)用标准人口数计算:,例:甲、乙两县男性肝癌死亡率资料如下表,分析两县男性肝癌死亡率;计算其肝癌标准化死亡率(用全国第三次普查年龄别人口构成)进行比较。,表3-2甲、乙两县男性肝癌死亡率 甲县 乙县年

15、龄 人口 人口 死亡 死亡 人口 人口 死亡 死亡 数量 构成比 数 率 数量 构成比 数 率 0-323600 0.6555 24 7.4 364500 0.6949 22 6.030-56800 0.1150 75 132.0 64300 0.1226 75 116.640-42400 0.0859 103 242.9 40100 0.0765 104 259.450-30500 0.0618 87 285.2 28800 0.0549 84 291.760-21300 0.0431 69 323.9 16200 0.0309 54 333.370-19100 0.0387 33 172.

16、8 10600 0.0202 22 207.5合计493700 1.0000 391 79.2 524500 1.0000 361 68.8,表3-3甲、乙两县男性肝癌标准化死亡率.标准 人口 甲县 乙县.年龄 构成 原死 分配 原死 分配 亡率 死亡率 亡率 死亡率.0-0.6271 7.4 4.6 6.0 3.830-0.1267 132.0 16.7 116.6 14.840-0.0954 242.0 23.2 259.4 24.750-0.0745 285.2 21.2 291.7 21.760-0.0485 323.9 15.7 333.3 16.270-0.0278 172.8 4

17、.8 207.5 5.8.合计 1.0000 79.2 86.2 68.8 87.0.,三、应用标准化时的注意事项1、标准化法只适用于某因素两组内部构成不同,并有可能影响两组总率比较的情况。对于因其它条件不同而产生的不具可比性问题,标准化法不能解决。2、由于选择的标准人口不同,算出的标准化率也不同。因此,当比较几个标准化率时,应采用同一标准人口。,3、标准化后的标准化率,已经不再反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平。如比较城乡女性原发性骨质疏松症患病率时,经过标准化后的患病率,已不是两地当时实际原发性骨质疏松症患病水平,但它能够说明在共同标准下,城市和农村女性原发性骨质

18、疏松症患病水平相比较,谁高谁低。4、两样本标准化率是样本值,存在抽样误差。比较两样本的标准化率,当样本含量较小时,还应作假设检验。,第四节 动态数列及其分析指标,动态数列(dynamic series):是一系列按时间顺序排列起来的统计指标(可以为绝对数,相对数或平均数),用以观察和比较该事物在时间上的变化和发展趋势。常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。,动态数列的两个要素:时点或时期:统计指标:基期 报告期 末期,例5-7 某医院1991-1999年日门诊量的统计数据见表5-9第(1)、(3)栏,试作动态分析。,表5-9 某医院1991-19

19、99年日门诊量动态变化,一、绝对增长量,累计增长量(),即报告期指标与基期指标之差。逐年增长量(),即报告期指标与前一期指标之差。,绝对增长量是说明事物在一定时期增长的绝对值。,二、发展速度与增长速度,定基比,即报告期指标与基期指标之比,用符号表达为:a1/a0,a2/a0,.,an/a0。环比,即报告期指标与其前一期指标之比,用符号表达为:a1/a0,a2/a1,.,an/an-1。增长速度表示的是净增加速度。增长速度=发展速度1(100%)。,均为相对比,说明事物在一定时期的速度变化。发展速度表示报告期指标的水平相当于基期水平的百分之多少或若干倍,,三、平均发展速度和平均增长速度,平均发展

20、速度是各环比发展速度的几何平均数,说明某事物在一个较长时期中逐期(如逐年)平均发展的程度。平均增长速度是各环比增长速度的平均数,说明某事物在一个较长时期中逐期平均增长的程度。,其计算公式为,式中a0为基期指标;an为第n期指标。平均增长速度=平均发展速度1,对例5-7计算平均发展速度与平均增长速度:,动态数列分析还可以进行预测,即根据平均发展速度公式(5-7)计算几年后达到的指标。如根据表5-9资料预测2001年的日门诊量,本例2001年相当于,将已知数据代入公式(5-7),a10=1.141101200=4488(人次)即根据该医院1991-1999年的平均发展速度,预计到2001年该医院的

21、日门诊量可达4488人次。,第四节 计数资料统计推断,(一)总体率(构成比)的抽样误差率的标准误:,由上式可知,从同一总体中抽样,率p为定值,因此要减少率的标准误,降低抽样误差,只有加大样本含量。,(二)总体率的估计1、率的点估计:=P2、率的区间估计:与总体均数一样,是由抽样误差规律,按一定的概率估计总体率在哪个区间或范围。p服从正态分布。(1)总体率的可信区间为:P1.96.S(2)总体率的可信区间为:P2.58.Sp(其中P为样本率,p为率的标准误),某镇按人口的随机抽取人,作血清登革热血凝抑制抗体反应检验,发现阳性率为p=8.81%,标准误Sp=0.0156。问该镇血清登革热血凝抑制抗

22、体反应阳性率的95%可信区间是多少?1、点估计:=8.81%2、区间估计:p-1.96Sp p+1.96Sp,将上述数据代入公式:P 1.96.Sp,得:0.0881 1.960.0156=5.75%-11.87%该镇血清登革热血凝抑制抗体反应阳性率的95%可信区间是5.75%11.87%;或该镇血清登革热血凝抑制抗体反应阳性率的95%可能性是下列范围:5.75%-11.87%。,可信区间两要素,准确度:反映在可信度的大小,即可信区间包容的概率大小,愈接近1愈好。,精密度:反映在区间的长度,区间长度愈小其精密度愈高。,高精密度低,低准确度高,总体均数95可信区间:,总体均数99可信区间:,小样

23、本:n50,总体均数95可信区间,总体均数99可信区间,大样本:n50,A,B,疾病诊断指标选择原则:1、特异性强;2、灵敏度高;3、精度高:判断疾病病变程度的精确度。,四、参考值范围的制定方法、正态分布法:适用于正态分布的资料(n100)。参考值范围:,单侧参考值范围:,双侧参考值范围:,例:某地区正常成年男子130名,其红细胞均数为4.7941012/L,标准差为0.4091012/L,求该地区成年男子红细胞数的参考值范围。,将上述数据代入公式:X1.96.S X=4.7941012/L;S=0.4091012/L 4.794 1012 1.960.4091012/L 该地区成年男子红细胞

24、数的参考值范围为:,近十年来国外文献中经常采用“医学决定水平”,它是临床处理患者的“阈值”。同一试验可以定三个水平,检查所得数据高于或低于决定水平时医生即应采取对策,如:制定进一步的检查计划;采取治疗措施;估计预后。医学决定水平的制定不但根据“健康”人群的参考区间,也根据无关疾病患者的变化区间及有关疾病患者分型分期的测定值,同时要参考文献资料及对实验诊断有丰富经验的医生的意见。,Statland提出的生化试验的医学决定水平见表2-3表2-3 临床化学指标的医学决定水平.成分(单位)参考区间*水平 水平 水平(1)(2)(3).电解质(mmolL)钠 138146 115 135 150钾 3.

25、75.3 3.0 5.8 7.5氯 98109 90 112-总CO2 2330 6.0 20 33钙 2.252.65 1.75 2.75 3.38镁 0.61.2 0.4 0.9 2.5锂 0.51.2*0.4 0.8 1.5,表2-3 临床化学指标的医学决定水平.成分 参考区间*水平 水平 水平(1)(2)(3).锂 0.51.2*0.4 0.8 1.5(mmolL).举例来说,精神病患者用锂制剂治疗时,血中锂浓度往往在0.51.2范围内,0.4以下表示用药剂量不足应增量;0.8正处于有效浓度范围内,此时如不见效,应考虑改用其他疗法;1.5以上可能出现毒性反应,如手抖、多尿、甲状腺肿大、体重增加等,应减少剂量。,谢谢大家!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号