《《统计学卡方检验》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《统计学卡方检验》PPT课件.ppt(52页珍藏版)》请在三一办公上搜索。
1、第七章 2检验,2检验用途,单个频数分布的拟合优度检验 完全随机设计两组频数分布2检验多组频数分布的2检验配对设计下两组频数分布2检验,*四格表的确切概率法,2分布和拟合优度检验,2分布 2分布是一种连续型随机变量的概率分布。如果Z服从标准正态分布,那么Z2服从自由度为1的2分布,其概率密度在(0,)区间上表现为L型,如图7-1对应于自由度=1的曲线,取较小值的可能性较大,取较大值的可能性较小。,2分布和拟合优度检验,图7-1,2分布的形状依赖于自由度的大小,当自由度2时,随着的增加,曲线逐渐趋于对称,当自由度趋于时,2分布逼近正态分布。各种自由度的2分布右侧尾部面积为时的临界值记为 列于附表
2、8。,2分布和拟合优度检验,拟合优度检验拟合优度检验是根据样本的频率分布检验其总体分布是否等于某给定的理论分布。拟合优度检验步骤:1建立检验假设H0:总体分布等于给定的理论分布H1:总体分布不等于给定的理论分布,2分布和拟合优度检验,2计算检验统计量 实际观察到的频数用A表示,根据H0确定的理论频数用T表示,则大样本时统计量,自由度=K-1-(利用的参数个数),2分布和拟合优度检验,以上两个公式2检验的基本公式,所有其它形式的2检验公式都来源于此。2值反映了样本实际频数分布与理论总体分布的符合程度。如果原假设成立,2值不会太大;反之,A若与T差距大,2值也大;当2值超出一定范围时,就有理由认为
3、原假设不成立。3确定相应的概率P,作出推断结论,2分布和拟合优度检验,例7-1 对表7-1所示数据作正态分布拟合优度检验。136例体模骨密度测量值的均数=1.260;标准差=0.010检验的假设:H0:总体分布等于均数为1.260,标准差为0.010的正态分布H1:总体分布不等于该正态分布,表7-1 136例体模骨密度测量值频数分布表及拟合优度检验统计量的计算,2分布和拟合优度检验,表7-1 中第3列、第4列正态分布函数值可通过对作标准正态变换后查正态分布表或利用相应的SAS程序得到,第5列为第4列与第3列的差值,第6列理论频数T等于总例数136与各组段概率的乘积,第列各数之和即检验统计量2值
4、。,2分布和拟合优度检验,计算统计量:推断结论:自由度=10-1-2=7,查附表8,得到P0.50,可以认为该样本服从正态分布。,计算T I 时的参数有2个(均数和标准差),完全随机设计两组频数分布2检验,二分类情形22列联表 例7-2 某医师研究用兰芩口服液与银黄口服液治疗慢性咽炎疗效有无差别,将病情相似的80名患者随机分成两组,分别用两种药物治疗,结果见表7-2。,表7-2慢性咽炎两种药物疗效资料,完全随机设计两组频数分布2检验,问题:这两个频数分布的总体分布是否相等?或者这两份样本是否来自同一个总体。因为这里是二分类变量,问两个总体分布是否相等就相当于问两个有效概率是否相等。,完全随机设
5、计两组频数分布2检验,(1)建立检验假设H0:1=2 两药的有效概率相同H1:12 两药有效概率不同 检验水准=0.05(2)计算检验统计量,完全随机设计两组频数分布2检验,自由度=(2-1)(2-1)=1(3)确定p值查附表8,=1对应的临界值,P0.025。(4)结论:拒绝H0,两样本频率的差别具有统计学意义。可以认为,兰芩口服液和银黄口服液的总体有效概率不同,前者(91.1%)高于后者(68.6%)。,完全随机设计两组频数分布2检验,对于四格表资料,四格表专用公式,完全随机设计两组频数分布2检验,当n40时,如果有某个格子出现1T5,一般需用校正公式,完全随机设计两组频数分布2检验,例7
6、-3 将病情相似的淋巴系肿瘤患者随机分成两组,分别做单纯化疗与复合化疗,两组的缓解率见表7-4,问两疗法的总体缓解率是否不同?(1)建立检验假设H0:1=2,两法总体缓解概率相同 H1:12两法总体缓解概率不同 检验水准=0.05,完全随机设计两组频数分布2检验,完全随机设计两组频数分布2检验,2)计算检验统计量=(2-1)(2-1)=1 3)确定P值:P0.1,高于检验水准,不能拒绝H0,差别无统计学意义,尚不能认为两种治疗方案的总体缓解概率不同。,完全随机设计两组频数分布2检验,特别注意:当四格表出现T1或n40时,校正2值也不恰当,这时必须用四格表的确切概率计算法(见本章第6节)。,完全
7、随机设计两组频数分布2检验,多分类的情形2C列联表 定性变量具有多分类时,两个频数分布的数据可表示为一个2C列联表。例7-4 北京市1986年城市和农村20至40岁已婚妇女避孕方法情况如表7-5所示(据王绍贤等调查资料),试分析北京城市和农村采用不同避孕方法的总体分布是否有差别。,表7-5 北京城市和农村已婚妇女避孕方法情况,完全随机设计两组频数分布2检验,(1)建立检验假设H0:北京城市和农村已婚妇女避孕方法的总体概率分布相同H1:北京城市和农村已婚妇女避孕方法的总体概率分布不同检验水准=0.05。,完全随机设计两组频数分布2检验,(2)计算检验统计量H0成立时,两组概率分布相同,均近似地等
8、于合并计算的频率分布。,完全随机设计两组频数分布2检验,=(2-1)(4-1)=3,查附表8P0.001,按=0.05水准拒绝H0。可以认为,北京城市和农村已婚妇女避孕方法的总体概率分布不同。据调查数据,城市使用男用避孕套的频率高于农村;宫内节育器是城市和农村的主要避孕方式,但农村使用宫内节育器的频率比城市高。,完全随机设计多组频数分布2检验,设有一个定性变量,具有个可能的“取值”;现有R组独立样本的频数分布,其数据以表7-7的形式表示。这样的数据形式称为RC列联表。,完全随机设计多组频数分布2检验,例7-5 为研究某镇痛药的不同剂量镇痛效果是否有差别,研究人员在自愿的原则下,将条件相似的53
9、名产妇随机分成三组,分别按三种不同剂量服用该药,镇痛效果如表7-8。,表7-8某药不同剂量的镇痛效果,完全随机设计多组频数分布2检验,(1)建立检验假设H0:三种剂量镇痛有效的概率相同。H1:不同剂量镇痛有效的概率不全相同。检验水准取为=0.05按公式(7-13)计算2统计量,完全随机设计多组频数分布2检验,自由度=(3-1)(2-1)=2,查附表8,P0.025,按0.05水准,拒绝H0,差别有统计学意义。可以认为三种剂量镇痛有效的总体概率有差别。对于比较多组独立样本的2检验,拒绝H0只能说各组总体概率不全相同,即多组中至少有两组的有效概率是不同的,但并不是多组有效概率彼此之间均不相同。若要
10、明确哪两组间不同,还需进一步作多组间的两两比较,完全随机设计多组频数分布2检验,不同剂量有效概率间的两两比较结果见表7-9,配对设计下两组频数分布的2检验,二分类情形22列联表 例7-6 设有28份咽喉涂抹标本,把每份标本一分为二,依同样的条件分别接种于甲、乙两种白喉杆菌培养基上,观察白喉杆菌的生长情况,结果如表7-10,问两种培养基上白喉杆菌的生长概率有无差别?采用McNemar 检验,表7-10 两种培养基白喉杆菌生长情况,注:“阳性”表示生长,“阴性”表示不生长,配对设计下两组频数分布的2检验,H0:两种培养基上白喉杆菌生长的阳性概率相等H1:两种培养基上白喉杆菌生长的阳性概率不相等检验
11、水准=0.05。若H0成立,白喉杆菌生长状况不一致的两个格子理论频数都应该是(b+c)。,配对设计下两组频数分布的2检验,由2检验基本公式(7-1)有化简后不难得到,2统计量的计算公式为,配对设计下两组频数分布的2检验,因b+c40,P0.05,按=0.05水准拒绝H0,差别有统计学意义,可以认为,两种培养基上白喉杆菌生长的阳性概率不相等。鉴于甲培养基阳性频率为40/56=71.4%,乙培养基为24/56=42.9%,可以认为,甲培养基阳性概率高于乙培养基。,配对设计下两组频数分布的2检验,多分类的情形RR列联表例7-7 对150名冠心病患者用两种方法检查室壁收缩运动的情况,检测结果见表7-1
12、2。试比较两种方法测定结果的概率分布有无差别。,配对设计下两组频数分布的2检验,配对设计下两组频数分布的2检验,H0:两种测定方法的概率分布相同H1:两种测定方法的概率分布不相同=1.60,P0.05 故尚不能认为甲法测定结果的概率分布与乙法测定结果的概率分布不同。,2检验要注意的问题,关于2检验的条件 使用2检验在任何情况下都要注意理论频数 T不能太小。一般要求各格的理论频数均应大于1,且T5的格子数不宜多于格子总数RC的1/5 2.关于似然比 2统计量 作2检验,既可以计算Pearson 2统计量,也可以计算似然比 2(Likelihood ratio chi-square)统计量,,四格
13、表的确切概率法,基本思想是:在四格表边缘合计固定不变的条件下,利用公式(7-18)直接计算表内四个格子数据的各种组合的概率,然后计算单侧或双侧累计概率,并与检验水准比较,作出是否拒绝H0的结论。应用条件:理论数小于1或n 40或作2检验后所得概率P 接近检验水准,,四格表的确切概率法,a、b、c、d为四格表中的四个频数,n为总例数。例7-8 将23名精神抑郁症患者随机分到两组,分别用两种药物治疗,结果见表7-14,问两种药物的治疗效果是否不同。,表7-14 两种药物治疗精神抑郁症的效果,四格表的确切概率法,本例n 40,只能选用四格表的确切概率法。其假设检验的步骤如下:建立检验假设H0:1=2 两种药物治疗效果相等,H1:1 2 两种药物治疗效果不等=0.05,四格表的确切概率法,2、计算概率,见表7-153、确定P值和作出推断 双侧检验的P值是指表7-15 中 p1 p2 0.310的各种组合的四格表确切概率相加所得到的累计概率 本例的研究目的是甲乙两种药物的治疗效果何者为优,所以用双侧检验。将表7-15 中 p1 p2 0.310的8个四格表的P值相加,得累计概率P=0.214。按=0.05水准不能拒绝原假设,两组药物疗效的差别无统计学意义,尚不能认为两药治疗精神抑郁症的效果不同。,