《研究生统计学讲义第7讲R×C表资料分析.ppt》由会员分享,可在线阅读,更多相关《研究生统计学讲义第7讲R×C表资料分析.ppt(55页珍藏版)》请在三一办公上搜索。
1、第八章 RC表资料的分析,整理分类资料时,通常将分类频数排成R行C列的表格方式表达,称为RC列联表(RC contingency table),简称RC表(RC table)。RC表资料常用2检验。本章我们从2统计量的分布讲起,介绍多种RC表资料的检验方法。,预备知识 2分布,定义 如果u1,u2,.,un是n个相互独立的标准正态变量,则称随机变量,服从自由度为df=n的2分布(2-distribution)。,2=u12+u22+.+un2,2 分布曲线偏向左边,随自由度df的不同而不同,自由度越小越偏,自由度相当大时,2分布曲线接近正态分布曲线。,用2(df)表示自由度为df时水准的2界值
2、,P(2 2(df)=表示自由度为df时,2值大于界值2(df)的概率为。本书附表列出了按P(22(df)=编制的单侧2界值表。,例如,直接查附表,得单侧2界值20.05(5)=11.07,它表示自由度df=5时,2值大于11.07的概率为0.05,即 P(211.07)=0.05.显然,P(211.07)=0.95。,2分布的常用性质:,2分布具有可加性;2分布常用作某些统计量分布的近似。,例如,当处理组较多,各处理组样本含量较大时,Kruskal Wallis法的H分布可用2分布来近似。医学中2检验是常用的检验方法之一。,2 检验的基本思想是衡量实际频数(actual frequency)
3、和理论频数(theoretical frequency)之间的偏离度。检验统计量的意义和算法可用基本公式来说明:,8.2,式中Arc表示RC表中第 r 行(r=1,2,R)第c列(c=1,2,C)位置上的实际频数,简称实际数,简记为A;Trc表示与Arc相应(同位置)的理论频数(频数期望值),简称理论数,简记为T。,一、2 检验的基本思想,第一节 一般四格表的2 检验,理论数是根据检验假设 H0 来确定的,H0 为比较的各组处理效果相同,均等于合计的处理效果,据此推出第 r 行第c 列位置上理论数的计算公式为:,式中 nr 表示第 r 行的行合计,nc 表示第 c 列的列合计;n 表示总合计。
4、,例8.1 某中医院收治367例胃脘痛患者,随机分成两组,分别用新研制的中药胃金丹和西药治疗,结果如表10.1,探讨两种药物疗效有无差别。,表8.1 两药治疗胃脘痛的疗效四格表,胃金丹组占据部分,两组合计有效率,0.73400.9176=0.6735,假设两种药物的疗效相同,那么我们期望全部观察值中胃金丹组的理论有效率是67.35%总的观察数是376,而胃金丹组的期望有效数就是,0.6735 376=253.24,西药组的有效理论数T21=100345/376=91.76;同理,合计无效率为31/376=8.24%,T12=22.76,T22=8.24。,表8.1为成组设计(即完全随机设计)的
5、四格表,表中的基本数据A11,A12,A21,A22分别取271,5,74,26。本例系两样本率比较,先假设两种药物的疗效相同,均等于合计的有效率345/376=91.76%;据此,胃金丹组的有效理论数T11=276345/376=253.24,西药组的有效理论数T21=100345/376=91.76;同理,合计无效率为31/376=8.24%,T12=22.76,T22=8.24,从式(8.3)可以看出2值反映了实际数和理论数吻合的程度。如果检验假设H0成立,则实际数与理论数之差不会很大,2值应较小,出现大2值的概率P是很小的,按小概率事件不可能发生原理,一般应该不会发生。若根据试验结果算
6、出H0成立的2值为小概率(P检验水准),就怀疑H0成立,因而拒绝H0;若P,则没有理由拒绝H0。2与P值的对应关系(即分布的规律)可查附表6,2界值表。,表8-3 四格表2检验统计量的计算公式,基本公式,专有公式,校正公式,专有公式的校正,n40,T5,n40且1T5,对例8.1求解,本例H0:即两组疗效相同;H1:即两疗效不相同。=0.05。,=56.77,按自由度df=1查附表2,2界值表,20.05(1)=3.84,因220.05(1),P0.05,按=0.05水准拒绝H0,认为两药治愈率不同。,二、一般四格表的 2 检验,例8.2 某中医院将71例血栓闭塞性脉管炎期23级患者随机分成甲
7、、乙两组,甲组用活血温经汤,乙组用通塞脉1号治疗,结果如表10-4。问两药的疗效有无差别?,表8-4 两组疗效比较,H0:即两组疗效相同;H1:即两疗效不同。=0.05,如无统计软件,先计算理论数,本四格表最小理论数(行合计、列合计均为最小值所在位置上的理论数)T12=933/71=4.18,因有理论数140,用式(10.8)计算校正2值:,本例若不用校正2,则2=4.06,查2界值表,得P0.05,可见未校正的P值偏低,将得出相反的结论,四格表2检验的注意事项(1)2近似计算法种类很多,式(10.3)是2检验的基本公式,式(10.6)是由式(10.3)推导出的四格表专有公式。由于2界值表是以
8、正态分布为基础的连续性理论分布计算出来的,而分类变量不具有连续性,由此计算的2值是不连续的,特别是自由度为1的四格表,在总样本例数n40,有理论频数1T5时,用不校正的2值查2界值表,所得概率偏低,误差较大,须予校正。式(10.8)是式(10.4)的连续性校正公式。式(10.8)是由式(10.7)推导出的四格表专有校正公式。(2)如无软件,为了省去计算每个格子的理论数的麻烦,四格表2检验常用四格表专有公式计算2值。如用专有公式计算2值,虽然公式中没有理论数,但要先计算最小理论数(行合计、列合计均为最小值所在位置上的理论数),以便选择合适的公式。,时,u20.05=20.05(1)(即1.96
9、2=3.84),u20.01=20.01(1)(即2.5758 2=6.63),故n较大时的两样本率比较,既可用u检验,又可用2检验。(3)凡能用测量值做指标计算均数或能划分等级的资料,因为按分类资料,在划分阳性、阴性时信息量损失太大,而且划分界限不同,得出的统计结论也可能不同,如表10-6中,右边第一、第二两种划分的数据来自同一资料,但统计结论却完全相反。故此,在资料的划分归类时,必须结合专业知识,具备充分的理由才能确定某一划分界限。诚然,如果有明确的专业规定,例如:舒张压在90mmHg以上列为高血压,SGPT大于40单位列为异常,为了作出符合临床习惯的结论,也可将定量资料转为分类资料进行处
10、理。,(4)四格表 2 检验法不宜用于数据中有零的资料,此时误差很大,宜改用确切概率法,第五节 McNemar和kappa检验,1配对四格表 两分类变量配对设计时,例如,同一对象接受两种处理,同一血样经甲乙两法化验,或同一患者经治疗前后两次检查等,每一对象的计数情况有四种可能:即甲(+)乙(+),甲(+)乙(),甲()乙(+),甲()乙()。对于这类配对设计资料排成的四格表,称之为配对四格表,以区别不反映配对关系的四格表。,2配对四格表资料的独立性 2 检验 H0为配对的两种属性相互独立,彼此无关。目的是推断配对的两种属性(因素)是否有关。独立性的对立面就是相关,配对四格表的独立性检验即行列属
11、性的相关性检验。在配对两法相关即不独立时,可认为差异无统计意义。在配对两法无相关即独立时,可认为差异有统计意义。统计量仍用四格表的 2 检验公式(见表10.3),如两种属性有关,可进而确定关系的密切程度。,3.不同疗程的疗效比较问题,例8.6 用复方鱼腥草片合剂治疗老年性慢性支气管炎100个病例,先后共观察两个疗程,结果第一疗程有效率为60%;第二疗程有效率为75。本例两疗程资料为配对资料,这100例可有四种情况:,两疗程均有效;第一疗程有效但第二疗程无效;第一疗程无效而第二疗程有效;第一、二疗程均无效。如果整理成表10-5的四格表,其内容并未提供上述四种情况的数据,无法进行配对2检验。,不同
12、疗程的疗效比较宜整理成配对四格表,以便进行配对2检验。而配对四格表在周边合计不变即(a+b)、(c+d)、(a+c)、(b+d)四个数不变的条件下,表中的a、b、c、d可有许多组合,不同组合的配对资料,统计学结论有不同。如表10-6至表10-7都满足100个病例时,第一疗程有效率60与第二疗程有效率75的要求,但它们的配对2检验结论却截然相反,一个是两疗程疗效差异无统计学意义,一个是两疗程疗效差异有统计学意义。但若该组补充a、b、c、d中任何一个数据,便可作出正确判断。例如报道两个疗程均无效者为15例,则其四格表一定为表8-6,用配对2检验,得0.01p0.02,可认为两个疗程的疗效高于一个疗
13、程。,4.左右两侧比较的 2 检验 体内有些器官可分为左右两部分,在自然的正常状态下,左右大多是对称的,可是由于解剖、生理、病理等原因,某些改变在左右两部分受累的概率并不均等。左右两侧比较可使用2检验。如以a、b分别代表左右两侧的实际频数,则:2(a-b)2(a+b),df=1,例8.8 某医院神经科对近三年收治的96例内囊出血病人的发生部位进行分析,结果发生于左侧者为55例,右侧者4l例,试问内囊出血是否好发在左侧?,H0:左右,H1:左右。,2(a-b)2(a+b)(55-41)2(55+41)=2.042,P0.1,可认为内囊出血左右两侧发生率无差别。,第三节 分层四格表的2M-N检验,
14、例8.4 痛痹胶囊治疗骨性关节炎期临床实验,采用3个中心随机双盲、双模拟、阳性药平行对照试验法,将合格受试者以11的比例分配至两组,临床试验在3家医院同时进行,每个试验中心各等比例完成50例,4周3天血常规异常者清单结果如表10-8。试分析两组药物及中心效应。,表8-7是分层四格表,如使用SPSS11.5统计软件:以分组、疗效、中心,建立数据文件L10.8.sav以后,,(1)先加权频数变量,操作过程和界面同例10.2:Data,Weight Cases,选择Weight Cases by,将例数送入Frequency Variable框,OK。,(2)进行分层四格表的2M-N检验:Analy
15、ze,Descriptive Statistics,Crosstable(交叉表),指定行变量为疗效、列变量组别、分层变量为中心,Statistics,选 Risk(危险度),选 Cochrans and Mantel-Haenszel statistics(分层变量的独立性及同质性检验),Continue,OK。,输出结果:除频数分布表、分层(各中心内)两组比较的Pearson2检验结果之外,还有分层危险度估计(Risk Estimate)、三种心R值的一致性检验(Test for Homogeneity of the Odds Ratio):,上表表示:分层卡方检验统计量=3.451,概率
16、P0.0630.05,表明去除中心混杂作用后,疗效与分组无关。一致性检验给出了4种,概率P0.8460.05,表明不同中心间的OR值相同,上表表示:调整中心混杂作用后的综合OR值、自然对数值及置信区间,表明去除中心混杂作用后,正常的危险度大约为异常的1.714倍,第二节 四格表确切概率法,四格表确切概率法(exact probabilities for 22 table)又称Fisher确切概率法(Fishers exact test)。系英国统计学家Fisher利用超几何分布于1934年提出。四格表资料:当总样本含量n40时;用其它假设检验方法所得概率接近检验水准时;四格表中有实际频数为0或
17、有理论数T1时,都无法用2检验,常用四格表确切概率法作为四格表2检验应用上的补充。,四格表资料确切概率的计算公式为:,四格表确切概率法检验的基本思想是:在四格表的周边合计不变的条件下,用式(10.8)分别计算出a,b,c,d四个数据各种组合之确切概率,按检验假设取单侧或双侧的累计概率,即可根据规定的检验水准作出推断结论。Fisher确切概率计算步骤为:,(1)确定一个统计量,例如2值,计算原表的2值记为02;(2)列出边际和固定的全部四格表,对于每一个可能的四格表计算2及P;(3)符合202的那些四格表的P值之和,就是确切概率P值。因计算量较大,宜用统计软件完成。这里介绍用SPSS11.5统计
18、软件的计算步骤。,例8.3 研究某药改善周围血管闭塞性病变患者的皮肤微循环状况,以安慰剂作对照,将38个病例随机分到2组,结果如表10-9,试分析该药的疗效,表8-6 缺血组织的皮肤循环改善状况,使用SPSS11.5软件,以处理、疗效及例数为变量名,建立2行2列如图10-6的数据文件,第四节 RC表的统计分析,RC表资料有双向无序RC表、单向有序RC表、双向有序但属性不同的RC表、双向有序且属性相同的RC表。不同的RC表,所使用的统计检验方法是有不同的。,一、双向无序RC表,双向无序RC表即行列皆无序的RC表,如表10-10。满足2检验条件的RC表资料(表中没有小于5的理论频数,总例数很大)时
19、,用2检验法,按式(10.12)计算Pearson卡方检验统计量2值,可推断两个或多个样本率(或构成比)间的差异,也可推断行与列的属性间有无关系。,例8.5 某医院将用三种治疗方法治疗199例消化性溃疡住院病人,资料如表10-10。为避免中医不同证型对疗效比较的影响,试分析三种疗法治疗的病人按中医分型构成比有无差别。,H0:三组的中医分型构成比相同;H1:三组的中医分型构成比不同。=0.05 H0:三组的中医分型构成比相同;H1:三组的中医分型构成比不同。=0.05,以自由度df(R1)(C1)(31)(41)6查2界值表,20.10(6)10.64,P0.10。,如使用SPSS11.5统计软
20、件:建立数据文件L10.10.sav以后,操作过程和界面都同例10.2。,。按0.05水准不拒绝H0,可认为三组病人中医各型的构成比相同。,注意事项:12检验要求理论数T不太小,否则将导致分析的偏性。一般认为RC表中不宜有20%以上格子的T5,不能有T1。理论数太小时的处理办法:最好增加样本例数以增大理论数。删去理论数太小的行和列。将太小理论数所在行或列的实际数与性质相近的邻行邻列合并,使重新计算的理论数增大。须知,后两法可能会损失信息,也会损害样本的随机性,不同的合并方式有可能影响推断结论,故不宜作为常规方法。不满足2检验条件的RC表资料,最好计算RC表的确切概率。,2RC表的确切概率法计算
21、概率的步骤:(1)确定一个统计量,例如2值,计算原表的2值记为02;(2)列出边际和固定的全部可能的RC表,对于每一个表计算该统计量(比如2值)及其P值。(3)凡统计量(比如2值)大于原始表的统计量值(即202)的那些RC表的P值之和,即为确切概率P值。,用SPSS11.5,在数据编辑窗建立配伍格式数据文件以后,AnalyzeDsecriptive statisticCrosstabs,选择“行变量”进入Rows,选择“列变量”进入Columns。Statistics,选 Chi-squareContinue Exact:Monte Carlo:Continue;OK。即输出确切概率P值。,3
22、 2检验拒绝H0时,只能说明有差异,不能说明优劣。,例8.6 用某种药物的三种剂量各治疗100例病人,治愈情况如表8-9.2=8.33,df=2,P0.025,按=0.05水准,可认为治愈与药物剂量有关,结合表中实际数字可推论治愈率在所用药物剂量范围内随剂量增加而升高。,实际数字仍如表8-9,但将第1,2列对换,列如表8-10,计算结果完全一样,这时虽可得出治愈与药物剂量有关的结论,但不能推论治愈率随药物剂量增加而升高。由于用RC表的2检验作两个或多个样本率(或构成比)比较时,未考虑等级顺序关系。当处理效应按强弱或优劣分为若干个有序级别(如分为,三个等级)时,其试验结果整理为单向有序RC表,宜
23、用秩和或检验Ridit分析(见第十一章)比较各处理组的效应有无差别。,4多个样本率(或构成比)的2检验,结论为拒绝H0时,只能认为各总体率(或构成比)之间总的来说有差别,不能说明它们彼此间都有差别,或某两者间有差别,二、单向有序RC表单向有序RC表即行与列之一分类标志为有序的RC表。1当实验分组变量(如药物浓度或剂量)有序,而指标分组变量(染色体损伤的类型)无序时,统计处理仍可用双向无序RC表分析方法。2当实验分组变量(如治疗方式)无序,而指标变量(如疗效为痊愈,显效,有效,无效)有序时,多选用秩和检验,大样本时也可使用Ridit分析。见第十一章。(1)当无序分类标志为2个(如疗法为甲、乙两种
24、)时,为2独立样本检验,常用两样本比较的Wilcoxon秩和检验法,,(2)当无序分类标志为多于 2 个(如治疗方式为三个或三个以上)时,为K个独立样本检验,常用Kruskal-Wallis 秩和检验,统计量为H。,三、双向有序且属性不同的RC表处理双向有序且属性不同的RC表资料时,常常希望弄清两有序变量之间是否存在线性相关关系或是否存在线性变化趋势,故需选用定性资料的相关分析或线性趋势检验。,例8.7 就表8-11资料,推断老年环的混浊度与眼底动脉硬化级别是否有关联?如有关联,关系的密切程度如何?,表8-11 不同级别眼底动脉硬化患者老年环混浊程度分布,注:()内为小于5的理论数。,关联性分
25、析H0:老年环的混浊度与眼底动脉硬化级别无关;H1:老年环的混浊度与眼底动脉硬化级别有关。0.05。可用Corerelation法检验双向有序且属性不同的RC表中,行列属性的线性关系。可以用Pearson2检验统计量。线性趋势检验 H0:眼底动脉硬化级别与老年环的混浊度无线性关系,H1:眼底动脉硬化级别与老年环的混浊度存在线性关系,仍然使用Corerelation法检验,如用计算器计算,先计算小于5的理论数情况,因为本例表中理论数小于5的格子数有8个,达32%,超过了20%,故将B级和级合并后,再求2值:,用自由度df(R1)(C1)(41)(51)12,查2界值表,得20.025(12)21
26、.03,今20.025(12)220.025(12),故0.025P0.05,按0.05水准拒绝H0,接受H1。可认为老年环混浊度与眼底动脉硬化级别有关联。,进而确定相关的密切程度,计算Pearson列联系数:,Pearson列联系数P=,本例Pearson列联系数:P=0.280,为低度相关。,如使用SPSS11.5统计软件:以混浊程度(标签老年环的混浊程度)、硬化级别(标签眼底动脉硬化级别)及例数为变量名,建立25行3列的数据文件L10.12-3.sav以后,,输出结果:Chi-Square Tests 给出2=22.654,双侧P=0.0311,由Symmetric Measur 给出P
27、earson 列联系数 P=0.210,可以认为低度相关:Ordinal by Ordinal Spearman Correlation(有序对有序等级相关系数)=0.222,近似概率=0.000,单侧检验拒绝H0可以认为老年环混浊度组患者眼底动脉硬化级别两个变量间存在线性关系,眼底动脉硬化级别越高,老年环混浊程度越深。,Chi-Square Tests,a 4 cells(20.0%)have expected count less than 5.The minimum expected count is1.67.,Symmetric Measures,a Not assuming the
28、null hypothesis.b Using the asymptotic standard error assuming the null hypothesis.c Based on normal approximation.,本例,如果研究者关心的是不同老年环混浊度组患者眼底动脉硬化级别之间的差别是否有显著性意义时,虽然“年龄与疗效老年环的混浊度与眼底动脉硬化级别”都是有序的,亦可仍按单向有序RC表2检验法来处理。对于双向有序且属性相同的RC表,R=C时为行数与列数相同的配伍计数资料(paired enumeration data),可用方表统计分析的McNemar检验或Kappa检验。
29、,第五节 McNemar检验和Kappa检验,补充:两组可比性(均衡性)分析,临床药理实验特别是新药申报资料,首先要求做可比性分析.各组病例治疗前的基线资料必须具有可比性(即均衡),才有可能消除待比较的两种疗法或两种药物在非特异性效应(药物净疗效以外的其它各种疗效)方面的影响因素,两药显示出来的疗效差别才是两药特异性效应之间的差别.,必须做的可比性检验项目和要求是:,1.性别比例;2.年龄组;,3.病情轻、中、重:中医可用中医证候积分表示;,4.疾病亚型(包括病程,合并症等,中医证型);,5.治疗前实验室及其器械检测指标:选择疗效评定指标;,6.主要的安全性指标:血压,心率,心电图,血尿常规,
30、肝肾功能等;,检验统计量和公式:与疗效分析的假设检验相同,以P0.05为合格.,例:性别,病情,的轻、中、重可比性分析,1.两组性别的可比性分析,=0.0000,查卡方界值表,因为 所以P0.05。,结论:两组性别比例的差别无统计学意义,可比性合格。,2.两组多列资料的可比性分析-病型的可比性分析,分组 证 型,受试组 100 59 49 19 85 312对照组 59 29 16 19 86 209 合计 159 88 65 38 171 521,命门火痕 心脾受损 肝郁不舒惊恐伤肾湿热下注 合计,解:因为行列都是无序变量,所以采用卡方检验。,结论:两组阳痿病人中医证型比例差别有统计学意义,两组中医证型不均衡,可比性不合格。,