四格表的确切概率法.ppt

上传人:sccc 文档编号:5382407 上传时间:2023-07-01 格式:PPT 页数:30 大小:2.02MB
返回 下载 相关 举报
四格表的确切概率法.ppt_第1页
第1页 / 共30页
四格表的确切概率法.ppt_第2页
第2页 / 共30页
四格表的确切概率法.ppt_第3页
第3页 / 共30页
四格表的确切概率法.ppt_第4页
第4页 / 共30页
四格表的确切概率法.ppt_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《四格表的确切概率法.ppt》由会员分享,可在线阅读,更多相关《四格表的确切概率法.ppt(30页珍藏版)》请在三一办公上搜索。

1、卫生统计学(第五版),卫生统计学与数学学教研室,检验水准调整:,第二节 完全随机设计下两组频数分布的卡方检验,卡 方 检 验,一、使用X2检验的基本公式,二、四格表资料的检验,五、小结,三、行列表的检验,四、行列表资料的检验的注意事项,第四节 配对设计下两组频数分布的卡方检验,一、二分类情形列联表,计数资料的配对设计常用于两种检验方法,培养方法、诊断方法的比较。其特点是对样本中各观察单位分别用两种方法处理,然后观察两种处理方法的某两分类变量的计数结果。,表7-10 两种培养基白喉杆菌生长情况,例7-6 设有56份咽喉涂抹标本,把每一份标本一分为二,依同样的条件分别接种于甲、乙两种白喉杆菌培养基

2、上,观察白喉杆菌的生长情况,结果如表7-10,问两种培养基上白喉杆菌的生长概率有无差别?,本例是以每份标本一分为二,分别同时接种于两种培养基上,属于配对设计;两份样本实质上是一样的,不是互相独立的,观察白喉杆菌生长与否,指标为二分类的定性变量;目的是通过样本资料来推断两方法的阳性概率有无差别。,观察结果甲培养基的阳性率等于40/56,乙培养基的阳性率等于24/56,比较总体阳性概率不能用前面第二节的办法,原因是前面的办法针对的是“两组独立样本”,而现在我们遇到的实质上是一组样本,即使分成了两份,也是“两份互不独立的样本”需要另想方法。,表7-11 两个变量阳性率比较的一般形式和符号,这类问题的

3、原始数据可以表示为表7-11所示的四格表形式。表7-11和表7-3的区别仅在设计上,前面是两个独立样本,行合计是事先固定的;而这里的“两份样本”互不独立,样本量都是n,固定的,而行合计与列合计却是事先不确定的。,由表7-11不难看出,,变量1的阳性率,变量2的阳性率,变量1的阳性率变量2的阳性率,可见,两个变量阳性率的比较只和b、c有关,而与a、d无关。,回到表7-10,两种培养基白喉杆菌生长状况一致的两个格子频数分别为,其中,a,d,为两法观察结果一致的两种情况,b,c为两法观察结果不一致的两种情况。当两种处理方法无差别时,对总体有B=C。由于在抽样研究中,抽样误差是不可避免的,样本中的b和

4、c往往不相等。为此,需进行假设检验。该法一般用于样本含量不太大的资料。,这两个频数的大小显示不出两种培养基上白喉杆菌生长状况的差别。比较两种培养基的阳性概率是否有差别,需要考察白喉杆菌生长状况不一致的两个格子,我们只对其中的频数,两种培养基上白喉杆菌生长的阳性概率相等,两种培养基上白喉杆菌生长的阳性概率不相等,检验水准,若 成立,,白喉杆菌生长状况不一致的两个格子理论频数都应该是,由检验 基本公式(7-1)有,化简后不难得到,统计量的计算公式为,(7-12),若 公式(7-14)校正公式为,(7-13),对于例7-6数据,因为 按式(7-15)计算,由 临界值表,,可以认为,两种培养基上白喉杆

5、菌生长的阳性概率不相等。鉴于甲培养基阳性频率为40/56=71.4%,乙培养基为24/56=42.9%,可以认为,甲培养基阳性概率高于乙培养基。,我们将两个变量不一致的总例数(b+c)视为固定值,在此条件下进行推断无需考虑两变量一致的总例数a和d的大小。这类方法在统计学中称为条件推断方法。当然,也有文献报道对此类问题进行非条件推断的方法,这时a和d的信息都能用上,但十分复杂,超出了本书的范围。,以上检验称为 检验。,二、多分类的情形RR列联表,例7-7 对150名冠心病患者用两种方法检查室壁收缩运动的情况,检测结果见表7-12。试比较两种方法测定结果的概率分布有无差别。,表7-12 两种方法检

6、查室壁收缩运动情况,类似于例7-6,这里是配对设计,只是定性变量有3种可能的“取值”;甲方法的测定结果,是一组频数分布;乙方法的测定结果 是另一组频数分布。,需要检验的是,两种测定方法的检查结果的概率分布相同,两种测定方法的检查结果的概率分布不相同,检验水准,表7-13 配对设计下多分类资料的RR列联表,配对设计下多分类资料一般可表示为表7-13的形式。表7-13是表7-11的推广,这里的定性变量1和变量2都有R个可能的“取值”,R2。,现在的问题是:,基于一份配对的多分类样本,我们得到了两组频数分布,要了解它们的总体概率分布是否相同,即,两变量的概率分布相同,两变量的概率分布不相同,检验水准

7、,我们采用的检验统计量为,(7-14),其中k为类别数,分别为第i行合计和第i列合计。,成立时(7-14)式中统计量服从自由度为k-1的 分布。,当k=2时,(7-14)式便回到(7-12)式,这说明本节的方法 是检验的推广。,例7-7,,故尚不能认为甲法测定结果的概率分布与乙法测定结果的概率分布不同。,=1.60,搜集n对同胞,每一对中必须有一位是某疾病的患者,另一位未患该疾病;变量1为该病患者在某位点的等位基因类别,变量2为未患者在该点的等位基因类别。要检验的是:同胞对中患病者与未患病者在该位点上等位基因的概率分布是否相同。如果两个概率分布不同,则该基因位点可能与该疾病有关。,将上述方法用

8、于多等位基因传递不平衡检验,第五节 检验要注意的问题,1.理论数不宜太小,一般不宜有1/5以上格子的理论频数小于5,或有一个理论频数小于1。对理论数太小有三种处理方法:最好增加样本含量以增大理论频数;根本的方法。删去理论频数太小的行和列;此法不好。将理论频数较小的行或列与邻行或邻列合并以增大理论频数。但后两法可能会损失信息,,2.当多个样本率(或构成比)比较的检验,结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间不全相等,但不能认为彼此间都不相等。若要比较彼此间的差别,可用行列表的分割法。3.对于行列表单向等级资料(单向有序资料)组间的比较,宜用第八章秩和检验,如作卡方检验法只说明各处

9、理组的效应在构成比上有无差异,而不能说明组间整体效应的差异。,假设检验基础,一、二分类情形列联表,一、二分类情形列联表,第六节*四格表的确切概率法,前已述及,四格表若有理论频数T小于1,或n40时,尤其是用其他检验方法所得概率接近检验水准时,宜用四格表的确切概率法(exact probabilities in 22 table),即四格表概率的直接计算法。本法的基本思想是:在四格表周边合计不变的情况下,获得某个四格表的概率为:,例7-14 抽查两批食品的卫生状况,作大肠杆菌检查,检查结果见表6-10。问两批食品的卫生状况有无差别?,表7-14 甲乙两批食品大肠杆菌检查结果,计算 P 值,表7-

10、14中甲批食品阳性率P1=0.4167,乙批食品阳性率P2=0.1000,两者之差|p1p2|=0.3167。在周边合计数不变的条件下,可能还有其它组合的四格表,其阳性率之差0.3167,所有这些比当前四格表更极端的情况都应考虑进去,因为这些极端情况在H0条件下都有可能发生。,表7-11中|p1p2|0.3167的四格表为序号(0)、(1)、(5)、(6)的情形,按公式求得序号(1)的概率为,表7-11 确切概率计算表(四格表周边合计数不变),余仿此,P(0)=0.0124,P(5)=0.0405,P(6)=0.0028,因此所求概率为:,推断结论 按=0.05的水准,不拒绝H0,差异无统计学意义。还不能认为两批食品卫生状况有差别。,P=P(0)+P(1)+P(5)+P(6)=0.0124+0.1061+0.0405+0.0028=0.1618,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号