《分类变量资料的统计分析课件.ppt》由会员分享,可在线阅读,更多相关《分类变量资料的统计分析课件.ppt(66页珍藏版)》请在三一办公上搜索。
1、2022/12/6,1,第四章 分类变量资料的统计分析,2,2022/12/6,第一节 分类变量资料的统计描述,一、常用的相对数指标(一)构成比(proportion) 构成比即一事物内部各组成部分所占的比重或分布。常用百分数表示。又称构成指标。,例4.1(P51) 手术治疗某支气管扩张患者,术后体温升至38,胸腔积液,手术前后检查白细胞记数和分类见表4-1。,术前中性白细胞构成比是71.66。,4,2022/12/6,构成比的特点:各组成部分的构成比之和为100 或1。事物内部某一部分的构成比发生变化,其它 部分的构成比也相应地发生变化。,5,2022/12/6,(二)率(rate) 又称频
2、率指标,说明某现象发生的频率或强度。即某现象发生的观察单位数与可能发生某现象的观察单位总数之比。可以百分率、千分率、万分率、十万分率等表示。,例4.2(P52) 在药物的不良反应监测中,调查了药物的皮肤过敏反应,结果见表4-2。,人全血过敏反应率是3.52%。,(),7,2022/12/6,(三)比(ratio) 也称相对比(ralative ratio),指两个有联系指标之比。,8,2022/12/6,例4.3(P52) 某地2005年城区肺癌死亡率为21.39/10万,郊区肺癌死亡率为13.99/10万,试用相对比来反映2005该地城区与郊区的肺癌死亡率情况。,该地城区肺癌死亡率与郊区肺癌
3、死亡率之比是1.53。,例:,4,(四)动态数列(dynamic series) 是按时间顺序排列起来的一系列统计指标(包括绝对数、相对数或平均数),用以说明事物在时间上的变化和发展趋势。 1、绝对增长量 累计绝对增长量 逐年绝对增长量 2、发展速度和增长速度 定基比发展速度 环比发展速度 定基比增长速度 环比增长速度,11,2022/12/6,常用相对数指标:,15,2022/12/6,二、应用相对数时应注意的问题,1、计算相对数的分母不宜过小2、分析时不能以构成比代替率3、正确计算平均率 对观察单位数不等的几个率,不能直接相加求其平均率,必须先分别进行分子和分母的相加,再计算平均率。,16
4、,2022/12/6,4、相对数比较时应注意资料的可比性 通常需注意三点: (1)研究对象是否同质 (2)其它影响因素在各组的内部构成是否相同 (3)同一地区不同时期资料的对比应注意客观 条件有无变化5、样本率或构成比的比较应做假设检验,17,2022/12/6,三、率的标准化法,例4.4( P54) 某省疾病控制中心欲进行甲、乙两地某病总死亡率的比较,收集资料见表4-5。,18,2022/12/6,(一)标准化法的意义和基本思想,意义:比较两个(或两个以上)总体率时,如果两个总体的内部构成有所差别,就不能直接拿两个总体率来做比较和下结论。,19,2022/12/6,基本思想:在两个或多个率(
5、或构成比)进行比较时,为了消除内部构成不同的影响,采用统一的“标准人口构成”,分别计算标准化率后再做对比的方法。这种消除内部构成差别,使总的率能够直接进行比较的方法就叫做标准化法。 采用统一标准调整后的率为标准化率,简称为标化率(standardized rate)或调整率(adjusted rate)常用 表示。,20,2022/12/6,(二)标准化率的计算1、选择标准人口选一个具有代表性的、内部构成相对稳定的较大人群作为标准将所比较的两组资料内部各相应小组的观察单位数相加,作为共同的标准从所比较的两组中任选一组的内部构成作为标准 本例选用两组合计人口做标准。,2、计算预期发生数 预期发生
6、数=标准人口数原发生率,表4-6 甲、乙两地用“标准人口数”计算标准化死亡率(1/10万),22,2022/12/6,3、计算标准化率,甲地标准化死亡率=2084/5317453=39.19/10万乙地标准化死亡率=2319/5317453=43.51/10万 乙地标准化率高于甲地。,表4-7 标准人口构成比计算标准化死亡率(1/10万),27,2022/12/6,(三)标准化时应注意的问题,内部构成不同的资料比较总率时需标准化,或进行多元统计分析。否则需分别比较各分组的率,也可得出正确结论。标准化后的率并不表示率的实际水平,只能表示相互比较资料间的相对水平。选定的标准不同,算得的标准化率也不
7、同。故只能对统一标准的标化率进行比较。 两样本标准化率是样本值,存在抽样误差,若想判断其总体率是否相同,还应作假设检验。,28,2022/12/6,第二节 分类变量资料的统计推断一、率的抽样误差和总体率的区间估计,(一)率的抽样误差和标准误,29,2022/12/6,例4.6(P56) 某地随机抽取500名儿童,乙肝感染率为4.50%,求乙肝感染率的标准误。,该地500名儿童乙肝感染率的标准误为0.93%。,30,2022/12/6,(二)总体率的可信区间 估计总体率可用点估计和区间估计进行。这里仅介绍区间估计。1、查表法,2、正态近似法,31,2022/12/6,改错,32,2022/12/
8、6,二、率的u检验,当 n50,且np和n(1-p)5时,即服从正态分布时,样本率与总体率、两样本率之间进行比较可采用u检验。(一)样本率与总体率的比较,33,2022/12/6,例4.7(P57) 根据以往经验,一般胃溃疡患者中有20%发生胃出血症状。某医院观察65岁以上溃疡病患者152例,有31.6%的患者出现胃出血症状。问老年人溃疡病患者是否容易发生胃出血?,34,2022/12/6,35,2022/12/6,(二)样本率与样本率的比较,36,2022/12/6,检验(chi-square test或称卡方检验)是用途非常广泛的一种假设检验方法。本节仅介绍用于两个或两个以上的率(或构成比
9、)的差异比较和配对四格表资料差异比较的方法。,三、 检验,37,2022/12/6,例4.9(P58) 某医师为了观察两种药物治疗慢性支气管炎的疗效,将病人随机分为两组,结果见表4-8,试对两组疗效进行比较(比较差异)。表4-8 两种药物治疗慢性支气管炎的效果,(一)四格表资料的卡方检验,基本数据是四个数据的表格称为四格表(fourfold table),其相应的资料就称为四格表资料。 a、b、c、d分别为四格表中的四个实际频数 n为总例数,39,2022/12/6,1、卡方检验的基本思想,40,2022/12/6,值的大小反映了实际数与理论数的相差情况,若零假设 成立,则理论数和实际数应相差
10、不大,较大的 值出现的概率较小。故根据资料计算的 值越大,就越有理由推翻零假设 。,41,2022/12/6,(1)建立假设,确定检验水准,(2)计算卡方值,(3)确定P值,做出结论,43,2022/12/6,2、四格表专用公式法 四格表专用公式只需计算最小理论值,而下面的基本公式必需计算出四个理论值。,3、四格表卡方值的校正,例4.10(P59) 某医院观察了28例肝硬化患者和14例再生障碍性贫血患者的血清中抗血小板抗体的阳性情况,结果见表4-10。问两类患者血清中抗血小板抗体阳性率有无差异。,48,2022/12/6,(1)建立假设,确定检验水准,(2)计算卡方值,(3)确定P值,做出结论
11、,50,2022/12/6,四格表资料差异(及关联)分析方法,51,2022/12/6,(二)配对资料的 检验,配对设计即所比较资料除研究因素外,其它的影响因素都尽可能相同的设计。配对设计的资料包括: (1)同一批样品用两种不同的处理方法 (2)观察对象根据配对条件配成对子,同一对子内不同的个体分别接受不同的处理 (3)在病因和危险因素的研究中,将病人和对照按配对条件配成对子,研究是否存在某种病因或危险因素。,配对资料若观察的结果只有阳性、阴性两种可能,清点这类资料只有四种情况: (a)甲+乙+, (b)甲+乙-,(c)甲-乙+,(d)甲-乙-。将(a)、(b)、(c)、(d)四种情况的对子数
12、填入表格,即得到如下配对四格表。,53,2022/12/6,例4.11(P60) 为比较两种检验方法(中和法和血凝法)检测关节痛病人的抗“O”结果,观察115例关节痛患者,结果见表4-11,问两种检验结果有无差别?,55,2022/12/6,(2)计算 值,(1)建立假设,确定水准,56,2022/12/6,(3)确定P值,(4)判断结果,补充,57,2022/12/6,三、行列表的 检验,1、多个样本率(或构成比)比较 基本数据的行数或列数大于2时,通称为行列表,简记为R C表。行列表资料的 检验可用于两个以上的率(或构成比)差异的比较。,58,2022/12/6,例4.12(P60) 某医
13、院研究急性白血病与慢性白血病患者的血型构成情况有无不同,资料见表4-12,问两组差别有无统计学意义。,(1)建立假设,确定水准,(2)计算 值,60,2022/12/6,(3)确定P值,(4)判断结果,61,2022/12/6,62,2022/12/6,例4.13(P61) 某城市欲调查不同环境污染程度下出生婴儿的致畸情况,资料见表4-13,问三个地区出生婴儿的致畸率有无差别。,(1)建立假设和确定水准,(2)计算 值,(3)确定P值,(4)判断结果,注意:如果假设检验的结论是拒绝零假设,只能认为各总体率或构成比之间总的来说有差别,但并不是说它们彼此之间均有差别。若需判断哪些组间有差别,还需进行两两比较(卡方分割)。,若不满足适用条件可采取以下措施: 增加样本含量 删去理论数太小的行和列 从专业上考虑如果允许,可将太小的理论数 所在的行或列的实际数与性质相近的邻近行 或列中的实际数合并(2)如果结论是拒绝零假设,只能认为各总体率或构成比之间总的来说有差别,但并不是说它们彼此之间均有差别。若需判断哪些组间有差别,还需进行两两比较。,2、行列表 检验的注意事项,