循证医学4流行病学研究中的常见偏倚 课件.ppt

上传人:小飞机 文档编号:4041703 上传时间:2023-04-02 格式:PPT 页数:87 大小:432.50KB
返回 下载 相关 举报
循证医学4流行病学研究中的常见偏倚 课件.ppt_第1页
第1页 / 共87页
循证医学4流行病学研究中的常见偏倚 课件.ppt_第2页
第2页 / 共87页
循证医学4流行病学研究中的常见偏倚 课件.ppt_第3页
第3页 / 共87页
循证医学4流行病学研究中的常见偏倚 课件.ppt_第4页
第4页 / 共87页
循证医学4流行病学研究中的常见偏倚 课件.ppt_第5页
第5页 / 共87页
点击查看更多>>
资源描述

《循证医学4流行病学研究中的常见偏倚 课件.ppt》由会员分享,可在线阅读,更多相关《循证医学4流行病学研究中的常见偏倚 课件.ppt(87页珍藏版)》请在三一办公上搜索。

1、流行病学研究中的常见偏倚及其控制,上海交通大学公共卫生学院 施榕,偏倚(bias)指观察值与真值之间的偏离,是一种随机误差以外误差的误差,属系统误差(systemic error)它是由某些较为恒定的不能准确测量的因素所造成。偏倚可发生在流行病学研究的设计、实施分析等各个阶段,如选择对象中以志愿者代替随机样本,使调查对象不能代表总体。重复抽样或加大样本含量并不能使这种误差减少或消失。流行病学研究中常见的偏倚主要有三大类,即选择偏倚、信息偏倚、混杂偏倚。,第一节 选择偏倚及控制,一、选择偏倚概念及类型选择偏倚(selection bias)是由于选择研究对象的方法有问题,使入选者与未入选者在某些

2、特征上存在着系统差异,从而导致研究结果偏离真实情况。在各类流行病学研究中均可发生选择偏倚,以病例对照研究中较为常见,如入院率偏倚、现患病例-新病例偏倚、检出症候群偏倚等。,1.入院率偏倚(admission rate bias),入院率偏倚是由于各种疾病的入院率不同而致的偏倚。现举例说明。某研究者计划研究A病与X因素的关系,A病例取自某医院,同时,他以同一医院随机抽取相应人数的B病人作对照。,OR1,2检验差异无显著性,说明A病与X因素无关系。,假设A病住院率为25,B病住院率为60,具有X因素也有一定的入院率为40。现就上述不同的入院率计算住院人数:A病无X因素住院人数48000.25120

3、0人A病有X因素住院人数12000.25(1200300)0.4660人B病无X因素住院人数48000.62800人B病有X因素住院人数12000.6(1200720)0.4912人,表6-2 医院为基础的病例对照研究,P0.01,,上述结果表明人群中A病与X因素本无关联,而以医院病例作为样本所得观察结果则是有关联的。,2.现患病例-新病例偏倚(prevalence-incidence bias),在病例对照研究,调查时选择的病例往往是存活的现患病例,无法对那些因患病已死亡的病例或轻型、非典型或已痊愈的病例进行调查,而队列研究中常采用新发生的病例,因而病例对照研究得出的结论与队列研究的结果可能

4、发生差异,此即现患病例-新病例偏倚,也称为奈曼偏倚(Neyman bias)。,例如,Friedman等人在美国弗明汉地区对心血管系统疾病的研究中发现:男性居民在队列研究中,具有高胆固醇水平者,患冠心病的RR值为2.40,而另一项病例对照研究中,病例组与对照组却无明显差异,OR=1.16(表)。,表6-3 费明汉地区男性居民血胆固醇水平与冠心病关系,进一步调查发现,患冠心病病人在被诊断为该病后,其后来的生活习惯或嗜好发生改变,如开始戒烟、多食低胆固醇食物、进行体育锻炼,从而使血中胆固醇水平降低,因此病例对照研究的结论存在明显的差异。,3.检出征候群偏倚(detection signal bia

5、s),检出征候群偏倚是指某因素与某疾病在病因学上虽无关系,但由于该因素的存在会引起该病的临床症状或体征的出现,从而使患者及早就医,接受多种检查,导致该人群有较高的检出率,致使过高地估计该因素与该疾病的关联。,例如,1975年,Ziel等以病例对照研究,从美国加州洛杉矶妇女中调查口服雌激素与子宫内膜癌的关系,结果表明子宫内膜癌患者雌激素暴露比例明显高于对照组,认为子宫内膜癌与服用雌激素密切相关。,表6-4 更年期服用雌激素与子宫内膜癌的关系,1978年,Horwitz指出,这一结论是由检出征候偏倚所致,两者之间的高度关联是虚假的。因为在人群中有一定量的无症状的子宫内膜癌早期病人,她们若不服用雌激

6、素,子宫不致出血,因而不去医院就诊,而不能被发现。,4.志愿者偏倚(volunteer bias),一般情况下,志愿者与非志愿者在关心健康、注意饮食习惯、禁烟、禁酒及体育锻炼等方面可能存在系统的差别,因而,志愿者被入选为观察对象,而非志愿者落选,这样的研究结果往往有选择偏倚。例如,一项以体育锻炼预防冠心病的研究,干预组都是志愿者,而将非志愿者作对照,以比较该项措施的效果,这样就可能会得出不正确的结论。,从上例可以看出选好对照组是十分不容易的,它同研究者的临床知识,经验,及关于研究变量的特征,对象选入的方法等都有关。有时还需将多种对照同时观察更能说明问题。,5.无应答偏倚(nonresponde

7、nt bias),无应答者是指研究对象中未按设计要求对被调查的内容予以应答者。某个特定样本中的无应答者的患病情况及某些因素的暴露情况与应答者可能不同,因此而产生的偏倚称为无应答偏倚。此种偏倚在分析性研究和实验性研究中均可发生。,如Seltze等报道,以函访调查人群吸烟状况时发现,85%的非吸烟者在一个月内回函应答了调查内容,但在吸烟者中,应答率仅占67%,这样对男性吸烟的估计是明显低估的。,6.失访偏倚(loss to follow up bias),失访也是无应答的一种表现,只是它主要发生在队列及实验性研究中。在随访研究过程中,研究对象未能按计划被随访,它是此类研究选择偏倚的主要原因之一。,

8、失访一般有两种情况,一种是由于观察期限短于原规定的观察危险期,一般与所观察的暴露因素或结果无关,且经过统计学处理能把他们当作截尾数据(censored data)处理。虽观察不到他们发生某事件的概率,但与留在观察组中的非失访者是相同的,一般较少引起偏倚。,另一种失访是在随访过程中因种种原因拒绝继续留在观察组中,他们的失访是主动的,多半同所研究的暴露因素或结果有关。若数量不大,不致引起偏倚,但若数量较大,则有可能产生偏倚。一项研究的失访率最好不超过10或稍高,否则应慎重考虑对结果的解释。,二、选择偏倚的测量与防制,(一)、选择偏倚的测量,选择偏倚在理论上可以通过总人群与实际抽样人群疾病与暴露分布

9、情况进行测量。下面以病例对照研究为例,总人群与实际抽样人群中疾病与暴露因素的分布分别如表6-5和表6-6所示:,表6-6 实际抽样人群疾病与暴露分布,表6-5 总人群疾病与暴露分布,总人群比数比:,样本比数比:,选择概率为:,根据选择概率:,选择偏倚,或,若 偏倚=0 即,=1,则不存在选择偏倚,偏倚0,即,1,则存在正向选择偏倚,偏倚0,即,1,则存在负向选择偏倚,现以前述入院率偏倚为例,=660/1200=0.55=1200/4800=0.25=912/1200=0.76=2880/4800=0.6,偏倚=,-1=0.74,(二)选择偏倚的防制,1、正确的研究设计首先研究者对整个研究可能会

10、产生的各种选择偏倚有充分的了解。在设计中,应注意使被比较的各组有同等的概率受到调查。应考虑可能出现的各种偏倚,以及会在那些环节出现,只有在设计时考虑周全,并采取相应措施,在各个环节中阻断偏倚产生的可能性,才能防止或减少其发生。,2、尽量采用多种对照理想的是以人群中全体病例和非病例(或其有代表性的样本)作为研究对象。如以医院病例为研究对象,宜在多个医院选择对象,且最好有2个对照组,其中一个对照组来自社区一般人群,在队列研究中,最好也应设多种对照,以减少选择偏倚对结果的影响。,3、严格掌握研究对象入选与排除的标准使研究对象能较好地代表其相应的总体。如病例对照,一般可规定病例的入选原则为新发的确诊病

11、例,以避免Neyman偏倚。在实验性研究中,应严格按照随机分配的原则,将研究对象分组,使两组除所观察因素外应具有均衡性、可比性。应避免将志愿者分为一组,非志愿者分为另一组,病情轻者分在一组,病情重者分在另一组等情况的发生。,4、提高研究对象的依从性在研究中应采取相应措施,尽量取得研究对象的合作,尽可能提高应答率,减少无应答率和队列研究中的主动失访,要做好组织、宣传工作,调查手段要简便易行,对调查中的问题应采取适当的处理技巧。若无应答或失访者超过10%,应对无应答者或失访者进行随机抽样调查,对失访者和已随访者的特征做比较分析。对研究结果可能有影响有关数据与应答者进行分析比较,若两者差异有显著性,

12、说明对结果有影响,在结论中应加以说明并应作慎重的分析。,第二节 信息偏倚及控制,一、信息偏倚的概念及类型信息偏倚(information bias)是指在研究的实施阶段中从研究对象获取研究所需的信息时产生的系统误差,其原因是由于诊断疾病、测量暴露或结局的方法有问题,导致被比较各组间收集的信息有差异而引入的误差。各种类型的流行病学研究中均可产生信息偏倚,病例对照研究中常见的信息偏倚有回忆偏倚、报告偏倚、调查者偏倚、诱导偏倚等。错误分类偏倚则在病例对照研究和队列研究中都可产生。,1回忆偏倚(recall bias),指比较组间在回忆过去的暴露或既往史时,其完整性与准确性存在系统误差而引起的偏倚。回

13、忆偏倚在病例对照研究中最常见,主要原因有:(1)研究对象对调查的内容关心程度不同,一般情况下,病例组患者对调查的事件回忆认真程度高于对照人群,因而导致两组对象在回忆以往事件的准确性存在差异。(2)调查的事件或因素发生的频率较低,未给研究对象留下深刻印象而遗忘。(3)调查事件是很久以前发生的事情,研究对象记忆不清。,2报告偏倚(reporting bias),被调查者有意隐瞒真实情况,夸大或缩小某些信息而导致研究结果产生偏倚,故亦称说谎偏倚。常见于敏感问题,如未成年人的吸烟史、冶游史。例如,有些人有冶游史,可能会难于陈述实情。而对于一些职业危害进行调查,研究对象因涉及劳保福利等原因可能会夸大某些

14、暴露信息。,3诊断怀疑偏倚(diagnostic suspicion bias),由于研究者事先了解研究对象对研究因素的暴露情况,于是带着“先入为主”的倾向性,怀疑其患某病或在主观上倾向出现某种阳性结果。如对暴露组或实验组进行非常仔细地检查,而对非暴露组或对照组则不然,从而使研究结果出现偏差,由此而产生诊断怀疑偏倚,此类偏倚多见于队列研究和临床试验。,4暴露怀疑偏倚(exposure suspicion bias),与上述的诊断怀疑偏倚一样,研究者在收集并确定病例组的暴露比例时所具有的认真、细致程度远高于对照组,从而导致错误结论,此即暴露怀疑偏倚。这类偏倚多见于病例对照研究,如采用病史记录作为

15、分析资料,因为询问病史的医生知道某些因素和某病发病有关,因此对病例组患者在询问病史时特别仔细,常有阳性的记录,而调查对照组时则漫不经心,阴性结果很多。对两组对象以不同的调查方法进行调查,从而产生偏倚。,5错误分类偏倚(misclassification bias),调查中使用的方法如果偏离了金标准,则将产生错误分类偏倚。在度量疾病状态和暴露状态都可能发生。每项诊断试验或测定仪器都有一定的灵敏度和特异度,但两者都不大可能是100%,于是就会出现假阳性和假阴性,这就发生了错误分类,即本应是病人,但错将他分入了对照组,而本应是非病人,则将他分入病例组。,无差异性错误分类和差异性错误分类,第三节 研究

16、的偏倚,表8-3,无差异性错误分类,差异性错误分类,错误分类数据,错误分类数据,研究真实数据,研究真实数据,(1)无差异错分(nodifferential misclassification)当se=se、sp=sp 时产生,其实测结果往往低于真值,现以下例说明。表6-7是某队列研究暴露组和非暴露组病例的真实分布情况。,表6-7 暴露组和非暴露组病例的真实分布情况,RR=2,表6-8 暴露组人员错分后的分布情况,现假设某诊断疾病方法的se=0.8、sp=0.9,则暴露组病例400人,该方法诊断为病人400*0.8=380人,另有80人漏诊,但另有600*(1-0.9)=60人误诊,故实际诊断为

17、病人380人,诊断非病人为620人(表6-8)。,表6-9 非暴露组人员错分后的分布情况,非暴露组中该方法诊断病人为2000.8=160 人,误诊800*(1-0.9)=80,实际诊断病例数为240 人诊断为非病人760人(表6-9)。,表6-10 暴露组、非暴露组病例的实际分布情况,RR=1.583错分偏倚=(RR-RR)/RR=(1.583-2)/2=-0.209,(2)有差异错分(differential misclassification)当两组测定方法的灵敏度和特异度不同,则可产生有差异错分,资料的实际估计值可高于真值,也可低于真值,即可能高估也可低估研究因素与疾病之间的联系。,二、

18、信息偏倚的控制,1搞好研究方法的质量控制。调查表的设计时,对所有调查内容、指标要规定明确、客观的标准,并力求量化所询问方式的调查内容;每个问题的答案应标准化。对调查人员要进行统一培训,使其充分了解调查的目的、意义,统一标准,统一调查技巧,调查询问方式相同,有相同的深度和广度。对所有调查方法应规定质量控制方法及标准。另外,还要对研究对象做好宣传、组织工作,以取得研究对象的密切合作。,2资料的校正方法根据调查所得资料灵敏度、特异度可对含有信息偏倚(错分偏倚)的资料予以校正,下面介绍两组资料测定方法敏感度与特异度较近时的校正方法,校正公式如下,现以表6-11资料为例说明信息偏倚的校正方法。A=(Sp

19、n1-c)/(se+Sp-1)B=(Spn2-d)/(se+Sp-1)C=n1-A D=n2-B,表6-11 某病例对照研究研究因素的暴露情况,本病例组及对照组敏感度为0.9,特异度为0.7,代入公式计算得OR=2.1。A=(0.7100-34)/(0.9+0.7-1)=36/0.6=60B=(0.7100-52)/(0.9+0.7-1)=18/0.6=30C=100-60=40 D=100-30=70,3尽可能采用“盲法”设计在调查中采用双盲设计,使调查人员和研究对象均不知晓分组情况,以避免诊断怀疑偏倚、暴露怀疑偏倚、报告偏倚等。对在调查过程仍可有可缺发生的信息偏倚,如错误分类,则由于比较组

20、间资料的准确度相似,即使发生错误分类,属于无差异错误分类的可能性较大,可应用上述校正方法,作出相应估计。,4.利用客观指标或客观方法收集资料在研究中应尽量采用实验室检查结果。研究对象的体格检查记录或诊疗记录等客观治疗信息来源。对只能通过调查询问方法收集主观资料时,应尽量采用封闭式提问方式。条件许可时,收集资料时可包括一些“无关”的信息。以分散被调查者的注意力,减少主观因素的影响。,第三节 混杂偏倚及控制,一、混杂偏倚概念混杂偏倚(confounding bias)是在研究暴露与疾病的联系时,假如有一种外界因素既是与研究疾病的危险因素有联系,又在被比较各组中的分布不同,那么这一因素则称为混杂变量

21、。由于混杂变量的存在,造成了观察到的联系强度偏离了实际情况,则称为混杂偏倚。,图混杂偏倚示意图,混杂因素的基本特点:(1)必须是研究疾病的独立危险因子(2)必须与研究因素有关(3)不是研究因素与疾病因果链上的中间变量,继发关联(secondary association)定义 是一种纯粹由混杂偏倚产生的关联 即怀疑的病因(暴露)E与疾病D并不存在因果关系,而是由于两者(E,D)有共同的原因C,E,D同C存在关联,从而继发产生E与D的关联。,第三节 研究的偏倚,C,?,D,E,例如 高血清胆固醇是冠心病的危险因素,高血清胆固醇可产生沉积于眼睑的黄色瘤,从而导致黄色瘤与冠心病的继发关联。另外,E与

22、C也可以由于相关(因果方向不明)而产生继发关联。例如 吸烟是胰腺癌的危险因素,吸烟又与喝咖啡存在相关(没有确定的时间先后),从而造成喝咖啡与胰腺癌的继发关联。,第三节 研究的偏倚,直接因果关联的歪曲 如果怀疑病因E与疾病D既存在直接关联,又存在间接关联(图A)或与其他危险(保护)因素F存在相关(图B),暴露E与疾病D的直接因果关联程度或方向将可能受到混杂干扰,即得到歪曲的关联估计值。,第三节 研究的偏倚,F,D,E,F,D,E,?,?,A,B,例如 静脉吸毒E与性乱F都是HIV感染D的危险因素,吸毒者易发生多性伴行为,即吸毒同HIV感染既存在直接关联(ED)又存在间接关联(EFD)(图8-3,

23、(2)),吸毒与多性伴没有确定的时间先后而呈双向相关(图8-3,(3)),多性伴F将对吸毒E与HIV感染D的直接因果关联起混杂或歪曲作用。,第三节 研究的偏倚,第三节 研究的偏倚,图8-3,图混杂因素成立与不成立的几种情况示意图,不存在混杂偏倚的几种情况,存在混杂偏倚的几种情况,二、混杂因素的测量:,进一步测量某一可疑混杂因子的混杂作用,可疑通过将含有该因素时(如RR、OR),与扣除该因素后的估计值进行比较分析来实现。研究因素与疾病的估计值为cRR或cOR,称为粗RR或粗OR;按该可疑因素调整后的估计值为aRR(f)或aOR(f),称作调整RR或调整OR,aRR(f)可用Mentel Haen

24、szel分层分析方法计算。现以估计值RR说明测量方法(OR测量方法相同)。,(1)若CRR=aRR,f 无混杂作用(2)若 CRR aRR,f有混杂作用。CRRaRR为正混杂:混杂偏倚的存在使研究中暴露与疾病之间存在的真实联系被夸大。CRRaRR为负混杂,由于f的混杂作用,使cRR低估研究因素与疾病之间的联系。(3)混杂偏倚=(CRR-aRR)/aRR。若值=0,无混杂。若值0,有正混杂;若值0为负混杂。,对混杂因素的分析,可将含有该因素时研究因素与疾病的估计值与按该因素分层后,研究因素与疾病的估计值进行比较,若两者不一致,则有可能存在混杂偏倚,现举例说明如下。某队列研究调查粉尘与呼吸道疾病的

25、关系,吸烟(F)可能是混杂因素,,计算粗RR,RR=1,按吸烟与否分层:,RR=0.58,RR=3.06,分层前RR与分层RR后不一致,说明吸烟很可能是一个混杂因素,分析吸烟与呼吸道系统疾病是否关联。,RR=1.42,表明吸烟是呼吸道系统疾病危险因素。,任何一个外界因素本身并不固有混杂因素的特性,必须有另一暴露因素同时存在,且它在暴露组与非暴露组的分布不均匀,才可能成为混杂因素,三、混杂偏倚控制,1研究阶段(1)限制(restriction)如果认为某个或某些因素是可能的或已知的混杂因素,在设计过程中,可对研究对象的选择条件进行规定,但限制条件不宜太多。如研究冠心病与吸烟的关系,年龄与性别可能

26、是混杂因素,就规定本次调查仅限与40-50岁的男性居民。,(2)配比(matching)个体配比将每个指示病例选择一个或多个对照,该对照与病例具有某些相同的特征,如年龄、性别等,在各比较组有相同的分布,以达到清除混杂作用的目的。频数配比将使对照组在某个潜在的混杂变量的分布与指示病例组的分布相同,如暴露组30-39岁为30%,40-49岁为30%,50-59岁为40%,那么非暴露组应与暴露组有相同的年龄分布。(3)随机化(randomization)一般用于实验性研究,其目的之一就是将混杂因素均匀地分配在各组中。,2资料的分析阶段(1)分层分析 在对研究的因素与疾病的联系进行分析时,可首先按某个

27、潜在的混杂因子进行分层,如不存在研究因素与混杂因素对疾病的交互作用,可用Mantel-Haenszel法,求出合并的ORMH及 MH,队列研究(1)累计发病率资料,第三节 研究的偏倚,表8-4,(2)发病密度资料,第三节 研究的偏倚,表8-5,病例对照研究,第三节 研究的偏倚,表8-6,(1)按可能的混杂因素吸烟分层,第三节 研究的偏倚,表8-7,表8-8,ai bi m1i ci di m0ini n0 ti,(2)判定层间关联效应水平是否同质,按是否吸烟分层后,两层内的饮酒与肺癌的关联效应大小是同质(同质性检验)的,可以应用M-H方法计算综合OR,第三节 研究的偏倚,(3)计算综合或调整O

28、R,并与粗OR比较,P 0.25,第三节 研究的偏倚,(4)结论,吸烟对饮酒与肺癌的关联(cOR=3.69)有混杂作用(cOR ORMH)控制吸烟的混杂作用后,饮酒与肺癌无关联(=0.6509,P0.25)注意针对ORMH的2检验是在排除了混杂偏倚的基础上再排除随机误差,而针对cOR的2检验是建立在没有排除混杂偏倚的基础上的,第三节 研究的偏倚,分层分析法分层前:,分层后:,COR=ad/bc,的方差:,例如,病例组为某地医院诊疗的25-49岁患心肌梗死的妇女234名,对照组为该地年龄为25-49岁妇女的随机样本1742名。病例组和对照组均按同一方法和标准收集三个月前避孕药的暴露情况。不考虑对

29、口服避孕药与心肌梗死的关系其粗比数比为1.86(表6-17),表6-17 口服避孕药与心肌梗死的关系,=5.84,OR=1.86,年龄与口服避孕药与心肌梗死的关系列于表6-18,表6-18 年龄与心肌梗死与口服避孕药的关系,自上表可发现年龄与心肌梗死和口服避孕药均不关联。且在病例组和对照组分布不均。年龄有可能为混杂因子,应予调整,按年龄分层,口服避孕药与心肌梗死的关系列于表6-19,按Mantel-Halnszel方法估计调整比数比aOR(f),列于表6-20。,表6-19 按年龄分层心肌梗死与近期使用口服避孕药的关系,表6-20 M-H法计ORMH、MH,ORMH=23.71/5.97=3.97 ORMH OR,OR的95%可信区间:,混杂偏倚=,表明年龄对口服避孕药与心肌梗死的关系起负向混杂作用,使比数比低57.57%。,(2)数学模型对于二项分类变量(患病,不患病),亦可用Logistic回归模型分析,仍以上例痢疾发病病因资料说明如下:,冷饮史 X1=,1 阳性,2 阴性,用膳地点 X2=,1 本部食堂,2 西部食堂,y=3.101X1+0.325X2,P0.05,表示控制了用膳地点,冷饮史仍为危险因素。,表示控制冷饮史后,用膳地点的作用消失了,结论与分层分析一致,P0.05,P0.05,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号