《05分类变量资料的统计描述.ppt》由会员分享,可在线阅读,更多相关《05分类变量资料的统计描述.ppt(23页珍藏版)》请在三一办公上搜索。
1、预防医学 分类变量的统计推断,分类资料的统计描述,分类变量的取值为某种属性,例如:血型(A、B、O、AB)人群中某病发生与否(发生、不发生)性别(男性、女性)视力等级(差、中、好)这些变量值无法直接进行统计运算,通常的做法是按照类别进行统计汇总,分别计算每一个类别的观察单位数,即某个分类的频数将上述频数绘制成频数分布表,某年某社区各年龄居民高血压患病情况,40与50年龄段为高血压的高危年龄段!,某年某单位各年龄居民高血压患病情况,60岁以上年龄段为高血压的高危年龄段!,相对数,对分类变量汇总后,通常这些频数不能直接比较;分类资料的统计描述与推断中通常使用相对数,而不是绝对数相对数指标是由两个有
2、联系的指标之比组成,常用的相对数指标,比(ratio)构成比(proportion)率(rate),1、相对比,相对比ratio含义:两个相关联的指标之比计算公式:特点:无量纲、取值可以超过1;A与B的量纲可以相同也可以不同,但是A与B互不包含常用指标有:性别比、每千人口的医生数、动态数列分析指标等,2、构成比,构成比proportion含义:反映事物内部某个部分占总体的比重;分子包含在分母中计算公式:特点:无量纲、在01间取值、不独立性、可加性常用指标有:性别构成、疾病构成、年龄构成、职业构成等,3、率,率rate含义:反映某一时间段内,某一事件出现的机会大小(近似于一段时间内发生某事件的平
3、均概率)计算公式:特点:多来源于随访性资料、分母中含有时间定义、取值有时会超过1(时间取半年、半月)常用指标有:发病率、死亡率、出生率等,应用相对数的注意事项,防止概念混淆;分析时不能以构成比代替率计算相对数的分母一般不宜过小 正确地合并估计率(平均率或合计率)相对数比较时要注意可比性,防止概念混淆,并非所有 含“率”的指标都表达是发生的可能性大小,很多情况下这些含“率”的指标是相对比例如:,某年某市高血压发病情况,某年某市畸胎发病情况,proportion vs.rate,相对数比较时的可比性,4、率的标准化,出现这种矛盾现象的原因在于两院不同科室病例构成不同甲院以内科病例居多,乙院却以外科
4、病例居多,而外科病例的治愈情况较内科好得多,造成乙院的治愈人数较多,在合计时乙院的总治愈率高于甲院可见这两组资料内部的构成不同(不同的科室治愈率是不同的),可比性差,不可直接比较总治愈或合计治愈率,率的标准化,采用统一的标准对内部构成不同的各组频率进行调整,而后对比各组标准化率的方法称为率的标准化法调整后的率为标准化率,简称标化率(standard rate),或调整率(adjusted rate)标准化的目的是使得不同构成的各组间比较时具有可比性;其做法是对那些在各组间分布不均衡,并且可能对研究结果造成影响的因素(混杂因素)进行调整、校正,使得它们对结果的影响在各组间一致常见的混杂因素有年龄
5、、性别、病情等,率的标准化,标准化率的计算,率的标准化的方法通常有直接与间接法两种两种方法的使用条件不同,直接标准化率,已知各构成组分的率时(或已知各组分的观察单位数与各组分观察阳性数),可采用该法在用直接标准化法计算标准化率(标化率)时要选择一个“标准人群”,例如:标准人口、标准年龄构成,等该标准不可随便选择,一般选用标准的方法有三种,直接标准化率标准选取,选择一个有代表性的、内部构成相对稳定的较大人群作为标准;例如全国人口、全省人口将要比较的两组资料合并后作为共同的标准将要比较的两组中任意一组作为共用标准,直接标准化率,期望生存人数ei=nipi,811,期望生存人数ei=nipi,649
6、,使用合并的人口数Ni作为标准人口甲院标化生存率=811/1138=71.23%乙院标化生存率=649/1138=56.99%排除了两院病例淋巴结转移情况不同后,甲院的生存情况较乙院好,直接标准化率,直接标准化法的一般公式:求得人群不同构成标准人口ni与原构成的率pi时,标化率p:,标准化法的注意事项,通常在不同群体间的内部构成不同时,如果欲对它们进行相互比较,可以考虑采用标准化法常见的内部构成因素有:年龄、性别、病情等因素标准化率并不是本身的“真值”,而是以标准人口作为参考,对各被标化组进行的调整后得到的相对的“率”,仅仅反映不同的组间的相对水平,标准化法的注意事项,标准化率随着标准人群的不同而不同;但是标化率的大小倾向是相同的;通常的“标准人群”有前述几种情况,不可随意选择对于总体资料,经过标准化后的调整率可以直接比较;而对于样本资料,标化后的率需要作假设检验如果资料出现“交叉”情况,慎用标准化,