卡方检验及SPSS分析ppt课件.pptx

上传人:小飞机 文档编号:1406154 上传时间:2022-11-20 格式:PPTX 页数:109 大小:4.67MB
返回 下载 相关 举报
卡方检验及SPSS分析ppt课件.pptx_第1页
第1页 / 共109页
卡方检验及SPSS分析ppt课件.pptx_第2页
第2页 / 共109页
卡方检验及SPSS分析ppt课件.pptx_第3页
第3页 / 共109页
卡方检验及SPSS分析ppt课件.pptx_第4页
第4页 / 共109页
卡方检验及SPSS分析ppt课件.pptx_第5页
第5页 / 共109页
点击查看更多>>
资源描述

《卡方检验及SPSS分析ppt课件.pptx》由会员分享,可在线阅读,更多相关《卡方检验及SPSS分析ppt课件.pptx(109页珍藏版)》请在三一办公上搜索。

1、卡方检验Chi-Square Test,预防医学教研室张杰,课程内容,第一节:四格表(fourfold data)资料的x2检验*第二节:配对(paired data)资料的x2检验*第三节:RC表资料的x2检验*第四节:分层卡方检验第五节:多个样本率间的多重比较 课程小结,SPSS统计分析,交叉表(Crosstabs)过程(一)四格表(fourfold data)资料的x2检验(二)配对(paired data)资料的x2检验(三)RC表资料的x2检验(四)两分类变量有无关联分析及列联系数C卡方(Chi-Square)过程 (五)拟合问题-比较样本与已知总体的分布,第一节 四格表资料的 检验

2、 x2 test of fourfold data,目的:推断两个总体率(构成比)是否有差 别要求:两样本的两分类个体数排列成四格表 资料,一、2 检验的基本思想,2是一种用途较广的计数资料的假设检验方法,属于非参数检验的范畴。根本思想:在于比较理论频数和实际频数的吻合程度或拟合优度问题。,x2检验:以x2分布为方法的理论基础,2 检验的基本公式,A为实际频数(actual frequency),T为理论频数(theoretical frequency)nR是行和,nC是列和,n是四格数之和2表示观察值与期望值之间的偏离程度。1900年由英国统计学家Karl Pearson首次提出,故被称为P

3、earson 2 。,8,*例1:四格表资料的x2检验,x2 检验基本步骤,建立检验假设 H0 : 两总体龋患率相等 H1 : 两总体龋患率不等 计算理论频数计算 x2 统计量确定P值,作出推论,四格表 检验的条件: 1) 2) 3),校正公式:,SPSS操作过程,建立数据文件:例1.sav数据格式:包括4行3列的频数格式,3个变量即行变量(group)、列变量(effect)和频数变量(freq)。说明频数变量:数据 加权个案 Data Weight Cases x2检验:从菜单选择 分析 描述统计 交叉表 Analyze Descriptive Statistics Crosstabs结合

4、例1数据演示操作过程。,首先建立数据文件,如下。,注意:由于上表给出的不是原始数据,而是频数表数据,应该进行预处理。,*指定加权变量(weight cases),在实际的统计中,经常需要计算数据的加权平均数。例如,希望了解不用牙膏使用者的平均患龋量。如果仅以各种牙膏的患龋量的平均数作为平均患龋量是不合理的还应考虑到各牙膏使用者的患龋量对平均患龋量的影响。因此,以各牙膏使用者的患龋量作为权重计算各牙膏患龋率的加权平均数,才是我们需要求的数据。在SPSS处理中就需要将各牙膏的患龋量作为加权变量。,“Weight Cases”对话框,交叉表(Crosstabs)过程,Crosstabs过程用于对分类

5、资料和有序分类资料进行统计描述和统计推断。统计描述过程可以产生2维至n 维列联表,并计算相应的百分数指标。统计推断包括了常用的x2检验、Kappa值,分层X2(X2M-H),以及四格表资料的确切概率(Fishers Exact Test)值。,Crosstabs过程详解,界面说明-行Rows框用于选择行列表中的行变量。-列Columns框用于选择行列表中的列变量。-层Layer框指定分层变量,即控制变量。如果要指定不同的分层变量做分析,则将其选入Layer框,并用Previous和Next钮设为不同层。-Display clustered bar charts 复选框:显示复式条图-Suppr

6、ess table复选框:不在输出结果中给出行列表。,Crosstabs过程详解,界面说明精确(Exact)子对话框:针对22以上的行列表设计计算确切概率的方法。统计量(Statistics)子对话框:用于定义所需计算的统计量-Chi-square 复选框:计算pearson卡方值,对四格表资料自动给出校正卡方检验和确切概率法结果。-Correlations复选框:计算行列变量的pearson相关系数和Spearman等级相关系数。,Crosstabs过程详解,界面说明-Kappa复选框:计算Kappa值,即内部一致性系数,介于00.7071之间;-Risk复选框:计算比数比OR值、RR值;-

7、McNemanr复选框:进行配对卡方检验的McNemanr检验(一种非参数检验)-Cochrans and Mantel-Haenszel statistics复选框:计算X2M-H统计量、X2CMH,可在下方输出H0假设的OR值,默认为1。,Crosstabs过程详解,界面说明单元格(Cells)子对话框:用于定义列联表单元格中需要计算的指标。-Counts复选框:是否输出实际观察数(Observed)和理论频数(Expected)-Percentages复选框:是否输出行百分数(Row)、列百分数(Column)以及合计百分数(Total)-Residuals复选框:选择残差的显示方式格式

8、(Format)子对话框:用于选择行变量是升序还是降序排列。,表示含氟牙膏与一般牙膏患龋率的比较,除了观察值以外,还有期望值。,SPSS结果输出,结论:22.82,P0.093,按 = 0.05水准,不拒绝H0,尚不能认为使用含氟牙膏比使用一般牙膏儿童的龋患率低。,Pearson卡方连续校正卡方似然比卡方Fisher确切卡方线性相关检验样本数,注意检查样本例数n和理论频数T是否满足条件:N40且理论频数T5。,*例2. x2检验-校正公式将116例癫痫患者随机分为两组,一组70例接受常规加高压氧治疗(高压氧组),另一组46例接受常规治疗(常规组),结果如下。问两种疗法的有效率有无差别?,T5,

9、,按 检验水准不拒绝 ,尚不能认为组有效率不等。,本资料若不校正时, ,结论与之相反。,*例3. x2检验-Fisher确切概率法,(一)适用条件 T1或 n40 P,(二)基本思想(超几何分布),在四格表周边合计不变的条件下,直接计算表内四个数据的各种组合之概率。找出 的所有表格并将概率求和,若这些表的合计P ,则推翻H0假设。,*例3. x2检验-Fisher确切概率法,(三)检验步骤,假设H0、H1,2. 计算最小理论频数 及 值,边缘合计不变条件下,变动表中数据,3. 找出边缘合计中的最小值,对应的格子中的数据从0 到 ,排出所有 可能的四格表。,5. 选出 值的所有表,分别求P值后相

10、加。,SPSS操作过程,建立数据文件:例3.sav数据格式:包括4行3列的频数格式,3个变量即行变量(group)、列变量(effect)和频数变量(freq)。说明频数变量:数据 加权个案 Data Weight Cases x2检验:从菜单选择 分析 描述统计 交叉表 Analyze Descriptive Statistics Crosstabs结合数据(例3.sav)演示操作过程。,第二节 配对资料的 检验 x2 test of paired fourfold data,与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,计数资料推断两个总体率(构成比)是否有差别也有成组设计和

11、配对设计,即四格表资料和配对四格表资料。,例4某抗癌新药的毒理研究,将78只大鼠按性别、窝别、体重、年龄等因素配成39对,每个对子的两只大鼠经随机分配,分别接受甲剂量和乙剂量注射,试验结果见下表。分析该新药两种不同剂量的毒性有无差异。,配对(paired data)资料的x2检验,上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有四种可能:,两种剂量方法皆为阳性数(a);两种剂量方法皆为阴性数(d);甲剂量注射法为阳性,乙剂量注射法法为阴性数(b);乙剂量注射法为阳性,甲剂量注射法为阴性数(c)。,其中,a, d 为两法结果一致的两种情况, b, c为两法结果不一致的两种情况。,检验统

12、计量为,注意:,本法一般用于样本含量不太大的资料。因为它仅考虑了两法结果不一致的两种情况(b, c),而未考虑样本含量n和两法结果一致的两种情况(a, d)。所以,当n很大且a与d的数值很大(即两法的一致率较高),b与c的数值相对较小时,即便是检验结果有统计学意义,其实际意义往往也不大。,检验步骤:,SPSS操作过程,建立数据文件:例4.sav数据格式:包括4行3列的频数格式,三个变量分别为行变量、列变量和频数变量。说明频数变量:数据 加权个案 Data Weight Cases x2检验:从菜单选择 分析 描述统计 交叉表 Analyze Descriptive Statistics Cro

13、sstabs统计量Statistics: McNemar Kappa,选中进行配对卡方检验,Pc),48,例4的问题改为:试评价两种剂量对老鼠致死率的一致性。(评价两种方法对同一样本的一致性),在Pearson 卡方检验中,对行变量和列变量的相关性作检验,其中行变量和列变量是一个事物的两个不同属性。在实际中,还有一种列联表,其行变量和列变量反映的是一个事物的同一属性的相同水平,只是对该属性各水平的区分方法不同。Kappa一致性检验目的:检验两种方法对同一个样本(研究对象)的检验结果是否一致,一致性检验,一般认为, 当Kappa0.75时,表明两者一致性较好; 0.75Kappa 0.4时,表明

14、一致性一般; Kappa0.4时,表明两者一致性较差。,一致性检验,Kappa系数=0.1980.05,说明两种方法的吻合度没有统计学意义,且吻合度较差。,Pc),两种结论一致,52,*例5 用A、B两种方法检查已确诊的乳腺癌患者140名,A法检出91名(65%),B法检出77名(55%),A、B两法一致的检出56名(40%),问哪种方法阳性检出率更高?,练习题(课后自行练习),注意!,计数资料的配对设计常用于两种检验方法、培养方法、诊断方法的比较特点:对样本中各观察单位分别用两种方法处理,然后观察两种处理方法的某两分类变量的技术结果,第三节 行列表资料的 检验 test of RC tabl

15、e,比较某市重污染区、一般市区和农村三个地区的出生婴儿的致畸率。以母乳、牛乳、混合三种不同方式喂养的新生儿体重增长的构成是否一致。推断2个分类变量是否有关联,如:研究冠心病与眼底动脉硬化的关系。 。,行列表资料,多个样本率比较时,有R行2列,称R 2表;两样本的构成比比较时,有2行C列,称2C表;多个样本的构成比比较,以及双向无序分类资料关联性检验时,有行列,称R C表。,检验统计量,3.1 多个样本率的比较,例6 用A、B、C三种不同方法分别处理新生儿脐带,发生感染的情况见下表,试比较3种不同方法的脐带感染率有无差异。 三种脐带处理方法的脐带感染情况,SPSS操作过程(行列表卡方检验),建立

16、数据文件:例6.sav数据格式:包括6行3列的频数格式,3个变量分别为行变量、列变量和频数变量。说明频数变量:数据 加权个案 Data Weight Cases x2检验:从菜单选择 分析 描述统计 交叉表 Analyze Descriptive Statistics Crosstabs结合例6数据(例6.sav)演示操作及界面。,结论:按=0.05检验水准拒绝H0,接受H1,可以认为三种处理脐带感染率有差别。,3.2 两组构成比的比较,例7 为研究某种新药对尿路疼痛的止痛效果,将有尿路疼痛的患者144例随机分为两组,每组72例,一组服该新药(治疗组),另一组服安慰剂(对照组)。两组患者尿路疼

17、痛的原因见下表,问两组患者尿路疼痛原因的分布有无差异?,两组患者尿路疼痛原因的分布,结论:按=0.05检验水准不拒绝H0,尚不可认为两组患者尿路疼痛原因的分布有差异。,3.4 多组构成比的比较,例8 在某项疼痛测量研究中,给160例手术后疼痛的患者提供四种疼痛测量量表,即直观模拟量表(VAS),数字评估量表(NRS),词语描述量表(VDS),面部表情疼痛量表(FPS),患者首选的量表以及患者的文化程度见下表,问患者首选疼痛量表与文化程度是否有关?,不同文化程度患者首选疼痛量表的类型,结论:按=0.05检验水准不拒绝H0,尚不能认为术后疼痛患者首选测痛量表类型与文化程度有关。,3.5 双向无序分

18、类资料的关联性检验,表中两个分类变量皆为无序分类变量的行 列表资料,又称为双向无序 表资料。注意: 双向无序分类资料为两个或多个样本,做差别检验(例7);若为单样本,做关联性检验(例9) 。,例 9 测得某地5801人的ABO血型和MN血型结果如下表,问两种血型系统之间是否有关联?,(单样本,做关联性检验),上表资料,可用行列表资料 检验来推断两个分类变量之间有无关系(或关联);若有关系,可计算Pearson列联系数C进一步分析关系的密切程度:,列联系数C取值范围在00.7071之间。0表示完全独立;0.7071表示完全相关。,检验步骤,由于列联系数C=0.1883,数值较小,故认为两种血型系

19、统间虽然有关联性,但关系不太密切。,SPSS操作过程,建立数据文件:例9.sav数据格式:包括12行3列的频数格式,三个变量分别为行变量、列变量和频数变量。说明频数变量:数据 加权个案 Data Weight Cases x2检验:从菜单选择 分析 描述统计 交叉表 Analyze Descriptive Statistics Crosstabs统计量Statistics: Chi-square 名义 相依系数Contingency coefficient,SPSS输出结果,结论:按=0.05检验水准拒绝H0,接受H1,可认为两种血型系统间有关联,但由于列联系数C=0.1883,数值较小,故认

20、为两种血型系统间虽然有关联性,但关系不太密切。,1行列表中的各格T1,并且1T5的格子数不宜超过1/5格子总数,否则可能产生偏性。处理方法有三种:,增大样本含量以达到增大理论频数的目的(首选)。根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。这样做会损失信息及损害样本的随机性。 例如:不同年龄组可以合并,但不同血型就不能合并。改用双向无序RC表的Fisher确切概率法。,R C表 检验的注意事项,练习题例 10. 某实验室为研究乙肝免疫球蛋白预防小白鼠胎儿宫内感染HBV的效果,将33例HBsAg阳性小白鼠(孕鼠)随机分为预防注射组和非预防组,结果见下

21、表。问两组新生小白鼠的HBV总体感染率有无差别?,第四节分层资料的卡方检验Tests of Conditional Independence,例 11. Doll和Hill以709例肺癌患者做病例,709个非肿瘤患者做对照,按性别分层,研究吸烟与肺癌的关系,调查结果如下,试做肺癌的病例对照分析。,Weight cases,关于OR值与RR值,相对危险度RR:是一个概率的比值,指试验组人群反应阳性概率与对照组人群反应阳性概率的比值。数值为1,表明试验因素与反应阳性无关联;小于1时,表明试验因素导致反应阳性的发生率降低;大于1时,表明试验因素导致反应阳性的发生率增加。优势比OR:是一个比值的比,是

22、反应阳性人群中试验因素有无的比例与反应阴性人群中试验因素有无的比例之比。暴露者的疾病危险度为非暴露者的多少倍。OR1说明疾病的危险度因暴露而增加,暴露与疾病为“正”关联;OR1说明疾病的危险度因暴露而减少,“负”关联。 当关注的事件发生概率比较小时(0.1),优势比可作为相对危险度的近似。,第五节多个样本率间的多重比较Multiple comparison of sample rates,一、基本思想(卡方分割法),因分析目的不同,k个样本率两两比较的次数不同,故重新规定的检验水准的估计方法亦不同。通常有两种情况:,例12 某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗

23、效,资料见下表。问三种疗法的有效率有无差别?,检验步骤,本例为3个实验组间的两两比较,三种疗法有效率的两两比较,例 11(2) 以例11资料中的药物治疗组为对照组,物理疗法组与外用膏药组为试验组,试分析两试验组与对照组的总体有效率有无差别?,本例为各实验组与同一对照组的比较,SPSS进行两两比较,结果同前,但因为会损失很多信息,一般不提倡采用此方法,本章小结,1、研究目的:率 or 构成比的假设检验(大样本率或 小样本率)2、资料类型:计数资料3、基本思想: 根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。4、应用条件检验两个样本率之间差别的显著性;检验多个样本率或构成比之间差

24、别的显著性;检验两个双向无序分类变量是否存在关联;配对计数资料的比较。,Any Questions?,Thank You!,(五)比较样本与已知总体的分布Chi-square test 过程,目的:用于检验某分类变量的各部分所占百分比与已知的期望百分比是否相同,从而推断该样本与已知总体的分布是否相同。 SPSS操作:分析非参数检验 卡方(chi-square),实例分析,SPSS自带文件Eployee data.sav考察员工职务类别(jobcat)变量所在总体的构成比是否和已知总体的构成比相同?,练习题:,1)如果希望分析甲乙两药对疾病治疗情况有无差别,应当选择什么分析方法,为什么?2)可以用到SPSS的什么过程实现?请给出具体的P值和分析结论。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号