《列联表的SPSS分析概要课件.ppt》由会员分享,可在线阅读,更多相关《列联表的SPSS分析概要课件.ppt(37页珍藏版)》请在三一办公上搜索。
1、列联表资料的SPSS分析 在实验研究与基础实验研究中,所分析的指标可以是定量的,也可以是定性的。其定量指标,有时也转化成定性资料进行分析。这些定性资料或由定量资料转化而来的定性资料,一般都整理成列联表形式,根据资料性质和分析目的选择恰当的分析方法进行统计分析,并将统计分析结果与专业知识相结合,做出合理的解释。我们以实验研究列联表资料实例,运用SPSS软件包进行统计分析,对操作过程和结果解释予以详细说明,希望能给大家提供借鉴。,列联表资料的SPSS分析,一、一般四格表(2 2 列联表)资料 实验研究一般四格表(22 列联表)资料分析目的主要有 2 个,一是分析两个比率总体的差别有无统计学意义或两
2、样本某指标的分布(或构成)总体是否相同,二是分析两个分类特征是否有关联。例1.某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效,将200例颅内压增高患者随机分为2 组,见表1。表1 试验组和对照组降低颅内压疗效的比较,一、一般四格表(2 2 列联表)资料组别有效无效,数据录入:打开SPSS;点击Variable View 定义变量,变量 1 Name 为“group”,Type 为“String”;变量 2 Name 为“effect”,Type 为“String”;变量3 Name 为“count”;Type 为“Numeric”,Decimals 为“0”,其
3、它为默认设置;点击Data View 输入数据。分析过程:频数加权(所有列联表资料均需经过频数加权,以下例题分析中省略该过程):Data Weight Cases Weight Cases by:Frequency Variable:count OK,数据录入:,分析:Analyze Descriptive Statistics Crosstabs Rows:group Columns:effect Statistics:Chi-square:Continue OK,分析:,主要结果与解释:根据22表资料 c2 检验的应用条件:总例数(n)40 且所有的理论值(T)5 时,选用一般的 c2 检
4、验;P a 时,改用Fisher 确切概率法;n 40,有1 T 5 时,选用连续校正的检验;或改用Fisher确切概率法;n 40,或T 1 时,用Fisher 确切概率法。该资料n大于40,所有T 均大于5,可取Pearson c2 值和似然比(Likelihood ratio)c2值,二者 c2 值分别为12.123 和12.864,P 0.01,试验组和对照组的疗效差别有统计学意义,可认为异梨醇口服液降低颅内压的疗效优于氢氯噻嗪+地塞米松。,主要结果与解释:根据22表资料 c2 检验的应用条,例2.一项关于婴儿喂养方式与腹泻关系的研究,资料如表2;试分析腹泻与喂养方式间是否有关联。表2
5、 婴儿喂养方式与腹泻的关系,例2.一项关于婴儿喂养方式与腹泻关系的研究,资料,数据录入:定义变量,变量 1 Name 为“method”,变量 2 Name为“result”,变量 3 Name 为“count”,Type 均为“Numeric”,Decimals均为“0”,其它为默认设置;输入数据,method:1 为“人工喂养”,2 为“母乳喂养”;result:1 为“有腹泻”,2 为“无腹泻”。分析过程:Analyze Descriptive Statistics Crosstabs Rows:method Columns:result Statistics:Chi-square,Co
6、ntingency coefficient Continue OK,数据录入:,主要结果与解释:这里,n 40,且所有 T 5,取Pearson c2 检验结果,c2=9.981,P 0.01,可认为婴儿腹泻与喂养方式有关联;Pearson 列联系数 C=0.329,根据 C 0.7为高度关联、C 0.4 为中度关联、C 0.4 为低度关联的判断原则,二者关联强度较弱。,主要结果与解释:,二、配对四格表(22 列联表)资料 例3.某研究者对同一批标本进行两个指标的检测,结果见表3。问:两个指标的分布有无差别?两个指标有无关联?表3 同一批标本两个指标的检测结果,二、配对四格表(22 列联表)资
7、料甲指标乙指标+-,数据录入:定义变量,变量 1 Name 为“A”,变量 2 Name 为“B”,变量 3 Name 为“count”,Type 均为“Numeric”,Decimals 均为“0”,其它为默认设置;输入数据,A=1、B=1:甲指标“+”、乙指标“+”;A=1、B=2:甲指标“+”、乙指标“-”;A=2、B=1:甲指标“-”、乙指标“+”;A=2、B=2:甲指标“-”、乙指标“-”。分析过程:Analyze Descriptive Statistics Crosstabs Rows:A Columns:B Statistics:Chi square,Contingency c
8、oefficient,McNemar Continue OK,数据录入:,主要结果与解释:McNemar c2 检验(SPSS McNemar 检验法不给 c2 值),P=0.185,说明两个指标分布的差别无统计学意义;一般c2 检验,Pearson c2=235.821,P 0.01,说明两个指标存在关联,Pearson 列联系数 C=0.592,关联程度中等。,主要结果与解释:,例4.某研究者用胃镜和活检对1 321 例患者进行胃癌检查,结果见表 4。问胃镜和活检的结果是否一致?表4 1 321 例患者胃镜和活检结果,例4.某研究者用胃镜和活检对1 321 例患者进,数据录入:同例 3。分
9、析过程:Analyze Descr iptive Statistics Crosstabs Rows:A Columns:B Statistics:Kappa,McNemar,Continue OK,数据录入:,主要结果与解释:McNemar 检验,P 0.75 时,有极好的一致性。,主要结果与解释:,三、R C 表资料 1.双向无序 R C 表资料 例5.某医生研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表5,问三种疗法的有效率有无差别?表5 三种疗法治疗周围性面神经麻痹的疗效,三、R C 表资料疗 法有效无效合计有效率(%,数据录入与分析过程,见例1。主要结果
10、与解释:该资料的原因变量(疗法)与结果变量(有效与无效)均无序,属双向无序 RC 表资料,选用一般 c2 检验分析即可。RC 表资料c2 检验时,要求所有T 1 且T 5,取Pearson c2 值或似然比c2 值,c2=21.038(或21.559),P 0.01,认为3 种疗法有效率的差别有统计学意义。,数据录入与分析过程,见例1。,例6.测得某地 5 801 人的 ABO 血型和MN 血型结果,问两种血型系统之间是否有关联?表6 某地5 801 人 ABO 血型和 MN 血型分布,例6.测得某地 5 801 人的 AB,数据录入与分析过程:见例2。主要结果与解释:所有T 5,c2=213
11、.162(或248.143),P 0.01,认为该地 ABO 血型和 MN 血型系统之间有关联。列联系数C=0.188,关联性很弱。,数据录入与分析过程:,2.单向有序RC 表资料 例7 某医生用 3 种药物治疗某病患者,疗效如表7。问 3 种药物的疗效有无差别?表7 3 种药物对某病患者的疗效,2.单向有序RC 表资料 药物种类治愈显效好转无,数据录入:定义变量,变量1 Name 为“medicine”,变量 2 Name 为“result”,变量 3 Name 为“count”,Type 均为“Numeric”,Decimals 均为“0”,其它为默认设置;输入数据:medicine:1
12、为“A药”,2 为“B 药”,3 为“C 药”,result:1 为“治愈”,2 为“显效”,3 为“好转”,4 为“无效”。,数据录入:,分析过程:Analyze Nonparametric tests K Independent Samples Test Variable List:result Grouping Variable:medicine Define Range:Range for Grouping Variable:Minimum:1;Maximum:3;Continue Kruskal-Wallis H OK,分析过程:,主要结果与解释:该资料原因变量“药物种类”属于无序变
13、量,而结果变量“疗效”属于有序变量;可以选用秩和检验、Ridit分析或有序变量的Logistic回归分析,本例选用秩和检验分析。结果,c2(Hc)=61.146,P 0.01,说明3 种药物的疗效差别有统计学意义。,主要结果与解释:,3.双向有序且属性不同 RC 表资料 例8 某研究者对不同肥胖程度的高血压患者进行治疗,观察患者血压控制情况,试作分析。表8 不同肥胖程度高血压患者的血压控制情况,3.双向有序且属性不同 RC 表资料 肥胖程度,数据录入:定义变量,变量 1 Name 为“fat”,变量 2 Name 为“control”,变量 3 Name 为“count”,Type 均为“Nu
14、meric”,Decimals 均为“0”,其它为默认设置;输入数据,fat:1 为“不肥胖”,2 为“轻度肥胖”,3 为“中/重度肥胖”;result:1 为“良好”,2 为“尚可”,3 为“不良”。,数据录入:,分析过程:Analyze Descriptive Statistics Crosstabs Rows:fat Columns:control Exact:Exact:Continue/Monte Carlo:Continue Statistics:Chi-square,Continue OK Analyze Correlate Bivariate Variables:fat,con
15、trol Correlation Coefficients:Spearman,Kendall+s tau-b Test of Significance:Tow-tailed OK,分析过程:,主要结果与解释:该资料原因变量“肥胖程度”和结果变量“血压控制情况”均属有序(等级)变量,但属性不同,可通过c2检验判断高血压患者的血压控制情况和肥胖度之间有无相关性,并通过等级相关分析其相关程度。该资料有 3 个格子(33.3%)的理论值均小于5,不能取Pearson c2 检验或似然比 c2 检验结果,而应取Fisher 确切概率法检验结果,P=0.072 0.05,故尚不能认为高血压患者的血压控制情
16、况与其肥胖程度有相关关系。Kendall 和 Spearman 等级相关分析结果:t=-0.074,P=0.401;rs=-0.085,P=0.381,也不支持两者之间有相关关系。该资料若把“肥胖程度”视为无序的分组变量,则可按照“单向有序RC 表资料”进行秩和检验分析。,主要结果与解释:,4.双向有序且属性相同 RC 表资料 例9 两位放射科医生对一批矽肺胸片独自作出了矽肺分级诊断,请问他们的诊断结果是否一致。表9 两位医生对一批矽肺胸片的分级诊断结果,4.双向有序且属性相同 RC 表资料 甲医生乙,数据录入与分析过程:见例4。主要结果与解释:该资料两位医生的诊断结果有序(等级)且属性相同,
17、选用一致性检验。结果,Kappa=0.676 0.75,P 0.01,认为两位医生的诊断存在一致性,一致性中等。,数据录入与分析过程:,四、多个样本率间的两两比较 对于 K2 表或 2K 表资料,总体检验有统计学意义时,只能说明各总体比率(分布)之间总的说来有差别,但不能说明任两个总体比率(分布)之间有差别。若要对每两个总体比率(分布)之间做出有无差别的推断,需进一步分析。,四、多个样本率间的两两比较,1.组间全面比较 Bonferroni 法 设总的检验水准为a,进行比较的次数为m,令各次比较的检验水准 a=a/m,并规定P a 时拒绝 H0,基于这样的做法,就可以把 类错误的累积概率控制在
18、a。当多组间比较次数不多时,该法的效果较好。但是,当组间比较次数较多(如10 次以上)时,检验水准过低,导致结果过于保守,犯类错误的概率增加。以例5为例,分析三种疗法任两种疗法之间疗效有无差别。,1.组间全面比较 Bonferroni 法,求总的c2 值,P a 时,作两两比较。本例 Pearson c2=21.038,P 0.01;求各四格表的 c2 值及 P 值;按公式计算校正的 a 值,式中 k 为比较的组数,本例为 3;各 P 值与校正的 a 值比较,判别有无统计学意义。表10 三种疗法有效率的两两比较,求总的c2 值,P a 时,作两,结果与解释:物理疗法与药物治疗、物理疗法与外用膏
19、药比较,Pearson c2 值分别为6.756 和21.323,P 值分别为 0.009 和 0.000,均小于调整后的检验水准a(0.0125),差别有统计学意义,结合物理疗法、药物治疗与外用膏药的有效率分别为96.60%、90.11%和81.94%,可以认为物理疗法的有效率高于药物治疗和外用膏药;药物治疗与外用膏药比较,Pearson c2=4.591,P=0.032 a,表明尚不能认为此两种疗法有效率有差别。,结果与解释:,2.多个实验组与同一对照组比较 Brunden 法 若多个实验组与同一对照组进行比较时,设总的检验水准为a,样本率个数为k,则每个实验组与对照组比较的检验水准a,并
20、规定 P a时拒绝 H0。仍以例 5 为例,以外用膏药作为对照,分析物理疗法和药物治疗两种疗法与物理疗法之间疗效有无差别。,2.多个实验组与同一对照组比较 Brunden,求总的c2 值,P a时,作两两比较。本例Pearson c2=21.038,P 0.01;求各实验组与对照组四格表的c2值及P 值;按公式计算校正的a值;各P值与校正的a值比较,判别有无统计学意义。表11 物理疗法和药物治疗与外用膏药法有效率的比较,求总的c2 值,P a时,作两两,结果与解释:物理疗法与外用膏药比较,Pearson c2=21.323,P a,表明尚不能认为此两种疗法的有效率有差别。,结果与解释:,进行多
21、个样本率的多重比较时,除上述介绍的两种方法外,还有将RC 表分割成若干个四格表进行分析的 c2 分割法、通过调整检验界值进行多个样本率间两两比较的杜养志法和罗文海法以及通过计算两率之差的可信区间来推断比较组间有无差别的 Scheffe 法等可供选择。,进行多个样本率的多重比较时,除上述介,参考文献:李永红.实验研究列联表资料的 SPSS 分析J.中国热带医学,2007,7(10):19411958。程琮,程玮,范华.行列相关的测度J.中国卫生统计,2003,20(5):313315.伍小英,鲁婧婧,张晋昕,等.两两比较的Bonferroni 法J.循证医学,2006,6(6):361364.Pemeger TV.Whats wrong with Bonferroni adjustments J.BMJ,1998,316(7139):12361238.郭祖超.2 k 表c2 检验显著时进行两两比较的方法J.中国卫生统计,1986,3(3):5253.黄水平.多个率的多重比较方法的选择J.南京医科大学学报(自然科学版),2005,25(12):962965.,参考文献:,