《临床研究中的误差和控制.ppt》由会员分享,可在线阅读,更多相关《临床研究中的误差和控制.ppt(77页珍藏版)》请在三一办公上搜索。
1、第五讲 临床研究中的误差和控制Error and Control in Clinical Studies,2,主要内容,概述偏倚的概念及分类临床研究中的常见偏倚偏倚的防止与处理,3,第一节 概述,一、误差的概念及分类二、随机误差三、系统误差,4,一、误差的概念及分类,在临床研究中,由于各种因素的影响,所造成实际观察值与真实值不相等,即为误差(error)误差通常指研究中所获得的实际测量值与真实值之间的差异常见的误差有两种,一是随机误差(random error),二是系统误差(systematic error)这两种误差贯穿于临床流行病学研究的设计、实施、分析、推论的全过程,5,一、误差的概念
2、及分类,评价研究中用来反映是否存在误差及其影响程度的最常用指标就是真实性(validity)和可靠性(reliability),前者主要反映系统误差的大小,后者主要反映随机误差的大小,真实性差 真实性好 真实性好 真实性差可靠性好 可靠性差 可靠性好 可靠性差,6,内部真实性/外部真实性,内部真实性(internal validity):从当前研究对象得到的结果能否准确地反映目标/源人群的真实情况 外部真实性(external validity/generalizability):从当前研究对象得到的结果能否适用于目标人群以外的其他人群(外推性)内部真实性是外部真实性的先决条件,7,内部真实性
3、 vs.外部真实性,研究样本,?内部真实性,其他人群,?外部真实性(外推性),8,二、随机误差,随机误差(random error),又称为机遇误差(chance error),或称偶然误差(accidental error)由于研究对象常来自某个特定总体的样本,故样本与总体之间必然因被测定的生物学现象(或指标)的随机变异,以及测量方法本身的随机变异等原因而存在一定的差别,从而导致实测值与真实值出现一定差异,被称为“随机误差”随机误差包括抽样误差和随机测量误差等,9,二、随机误差,在流行病学研究中,通常采用变异系数(coefficient of variation,CV)和标准误()来衡量随机
4、误差或精度的高低,表5-1 三个医生测定婴儿头尾结果的随机误差大小评价,10,三、系统误差,系统误差是指在调查或测量时,由于某种确切原因,如实验方法不当、仪器不准等原因造成的,表现为研究结果有规律的偏大或偏小这种误差不能像随机误差那样可以用统计学方法去刻画和研究其规律性,并据此估计和控制其大小,11,随机误差和系统误差的区别,12,随机误差和系统误差的区别,表5-2 随机误差和系统误差的区别,13,第二节 偏倚的概念及分类,一、偏倚的概念二、偏倚的分类,14,一、偏倚的概念,偏倚(bias)是指在医学研究中的各个环节,包括研究设计、实施、分析和推断过程中存在的系统误差以及结果解释和推论中的片面
5、性,使得研究结果与真实值出现的倾向性差异偏倚是影响医学研究结果真实性的主要因素,它可能夸大或者缩小真实效应,从而导致研究因素与研究结局间的关联强度高于或低于真实的关联,偏倚是有方向性的,15,一、偏倚的概念,假定某效应真实值为,样本观察值为 偏倚的方向正偏倚(高估):负偏倚(低估):1 远离零效应值:1 颠倒偏倚:1,1 偏倚的大小,16,二、偏倚的分类,选择偏倚信息偏倚混杂偏倚,17,(一)选择偏倚(selection bias),主要发生在研究设计阶段当按一定的条件识别研究对象时,从所纳入的研究对象中获得的有关因素与疾病的联系系统地偏离了原人群中该因素与疾病之间的真实联系,即认为有选择偏倚
6、存在究其原因主要是被选入到研究中的对象与没有被选入者在与暴露或疾病有关的特征上的差异所造成的系统误差,18,(一)选择偏倚(selection bias),表5-3 更年期服用雌激素与子宫内膜癌间的关系,在同一个医院的肿瘤科和妇科分别选择研究对象,其研究结果却存在很大的差异?,19,(一)选择偏倚(selection bias),在肿瘤科,这些患者服用雌激素后出现子宫出血症状而会到医院就诊,从而能发现人群中的子宫内膜癌病人,且多为早期病人;而不服用者,无出血症状,从而不易及早被诊断出来,因而能得出两者之间较强关联的结论在妇科,这些患者多数接受常规妇科检查,一般不会考虑到肿瘤的影响,该科病人可能
7、多为中晚期的子宫内膜癌患者主要是所选病人处在疾病的不同时期所致,20,(二)信息偏倚(information bias),在获取暴露、结局或其他信息时所出现的系统误差或偏差叫信息偏倚。信息偏倚又称为错分偏倚(misclassification bias)来源:研究者、调查对象、测量工具、原始记录不准信息偏倚:同等发生于暴露组和非暴露组非特异性错分OR、RR1信息偏倚:不同等发生于暴露组和非暴露组特异性错分OR、RR 或高或低,21,(二)信息偏倚(information bias),表5-4 孕妇腹部X线暴露与小儿白血病间的关系,表5-5 不同方法获得的孕妇腹部X线照射史的比较,22,(三)混
8、杂偏倚(confounding bias),既与疾病有制约关系,又与所研究的暴露因素有联系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系,叫混杂偏倚;这种外来因素称为混杂因素混杂因素的条件必须是所研究疾病的危险因素之一 必须与所研究的暴露因素有关 必须不是研究因素与疾病病因链上的中间环节,23,(三)混杂偏倚(confounding bias),出生序次,图5-1 出生序次与Downs综合征患病率的关系,Downs综合征患者数/1000活产,24,(三)混杂偏倚(confounding bias),产妇分娩年龄(岁),图5-2 产妇分娩年龄与Downs综合征患病率的关系,Downs
9、综合征患者数/1000活产,25,三大类偏倚,表5-6 观察性研究中偏倚的寻找和结果的解释,26,三大类偏倚,表5-6 观察性研究中偏倚的寻找和结果的解释,27,第三节 临床研究中的常见偏倚,一、诊断与筛查研究中的常见偏倚二、预后研究中的常见偏倚三、治疗/预防效果评价中的常见偏倚四、病因与危险因素研究中的常见偏倚五、其他偏倚,28,一、诊断与筛查研究中的常见偏倚,(一)工作偏倚(work-up bias)(二)疾病谱偏倚(spectrum bias)(三)领先时间偏倚(lead time bias)(四)病程长度偏倚(length bias)(五)志愿者偏倚(volunteer bias)(六
10、)参考试验偏倚(reference test bias)(七)测量偏倚(measurement bias),29,(一)工作偏倚(work-up bias),也称证明偏倚(verification bias),是指在评价诊断或筛检试验时,只对诊断或筛检试验出现阳性结果者才进一步用金标准方法加以确诊,而结果阴性者则不再做进一步检查就简单地认定无病,造成假阴性资料的缺乏,使观察到的灵敏度增加而特异度降低。该偏倚在肿瘤诊断试验中较普遍,如AFP检测诊断肝癌,AFP阴性者常会被认为无癌,但实际上原发性肝癌中AFP灵敏度只有60%左右,这样会出现很大一部分假阴性的病人,造成灵敏度虚高,特异度虚假。,30
11、,(二)疾病谱偏倚(spectrum bias),又称疾病谱效应(spectrum effect),是常用来描述疾病异质性的一个术语,是指诊断或筛检试验的灵敏度和特异度在不同的病人亚组间存在差异,如果所选择的对象不能充分的代表各不同亚组,即可产生疾病谱偏倚 在临床上有些诊断试验的研究对象只对明确的健康者与诊断明确的病人进行比较和评价,而没有纳入与该病混淆的其他疾病,亦即没有纳入检验结果呈“灰色带”的病人,从而高估该诊断试验的各项参数。,31,(三)领先时间偏倚(lead time bias),领先时间,32,(四)病程长度偏倚(length bias),33,(五)志愿者偏倚(voluntee
12、r bias),也称为病人自我选择偏倚(self-selection bias)筛检参加者与不参加者之间,某些特征可能存在不同,使得通过筛检发现的病例的预后较临床期确诊的病例的预后好。如参加筛检者可能因文化水平、卫生保健知识水平较高,平时比较注重健康问题,对吸烟、饮酒等不良生活习惯较为注意,对身体出现的异常症状也较为警惕,有较好的医疗依从性,这些都会对今后的存活率产生影响,从而导致偏倚。,34,(六)参考试验偏倚(reference test bias),由于金标准不够准确,会造成错分,即将有病者判为无病者,而将无病者判为有病者,将会影响诊断试验评价的准确性。任何一个金标准只是在特定历史条件下
13、医学发展的产物,其真实性是相对的,过去可能是金标准,现在不一定是,因此认真选择金标准是提高诊断试验研究与评价质量的关键参考试验偏倚是指诊断试验的金标准不妥造成的偏倚,35,(七)测量偏倚(measurement bias),在诊断或筛查研究中,由于对研究对象进行观察和测量时,调查表的设计有缺陷、记录不完整、调查员的询问方式和态度不同,所用的仪器、设备、试剂不合格或不统一,试验观察者技术熟练程度不同、操作规范化程度不一样等均可影响测量结果,从而导致错判,称为测量偏倚,36,二、预后研究中的常见偏倚,(一)失访偏倚(lost to follow-up bias)(二)零点偏倚(zero time
14、bias)(三)集合偏倚(assembly bias)(四)迁移性偏倚(migration bias),37,(一)失访偏倚(lost to follow-up bias),预后研究一般需要对研究对象进行前瞻性的随访,由于观察时间较长,研究对象中有人因搬迁、死亡、药物效果差或药物副作用等原因而退出研究队列,从而影响结果的真实性,由此产生的偏倚称为失访偏倚为了减少此类偏倚,预后研究通常要求失访率不应超过10%,38,(二)零点偏倚(zero time bias),零点是指被观察疾病的起始时刻,如患者进入观察时是处于该疾病的早期、中期还是晚期。在疾病预后研究中,不同的患者应用不同的随访起点,可影响
15、研究结果的真实性,由此造成的偏倚称为零点偏倚理想的状态是每个研究对象的随访起点应当是该病发展的同一起始阶段,否则预后的结果就会产生偏倚,39,(三)集合偏倚(assembly bias),也称集中偏倚、就诊偏倚,是一种选择偏倚指进入研究队列的患者之间除研究因素以外尚存在某些不一致的其他因素,而这些因素本身会对疾病的结局发生影响,如疾病的严重程度、病程长短、是否有合并症及有无治疗或不同的治疗措施等。由于各医院的性质、医疗条件和医务人员的专业水平不同,收治患者的病情、病程和临床类型可能不同,就诊患者的经济收入在不同的地区也可能不同,这些因素都可影响疾病的预后。,40,(四)迁移性偏倚(migrat
16、ion bias),当病人从原来的队列或观察组换到另一队列或观察组时,称为迁移。如果迁移的例数多,则可影响结果的真实性,由此造成的偏倚称为迁移性偏倚由于从两个队列或两个观察组中迁出的成员是非随机的,而且是不均衡的,这样就可能破坏原来严谨的研究设计,影响两个队列或两个观察组间的可比性,最终影响研究的结论,41,三、治疗/预防效果评价常见偏倚,(一)向均数回归(regression to the mean)(二)霍桑效应(Howthorne effect)(三)安慰剂效应(placebo effect)(四)干扰(cointervention)和沾染(contamination),42,(一)向均
17、数回归(regression to the mean),有些测量指标,如血压或其他生理指标,在初试时有些患者可以在异常水平,然而在没有治疗或干预的情况下,再次测试又回复到正常水平,这种现象称为向均数回归这种向均数回归现象可能是一种正常的生理波动,并不是治疗或干预的结果。它可以造成误认为治疗有效的假象。在临床试验中,如所测试的指标可能存在着向均数回归现象,那么就应采取对同一个体进行不同时间的多次测定,如取均值,以排除其干扰,43,(二)霍桑效应(Howthorne effect),在临床试验中,研究者对自己感兴趣的试验组的研究对象较对照组更为关心,而受到“关照”的研究对象由此而产生某种心理变化,
18、进而改变了他们的行为,这往往会夸大治疗效果,这种现象称为霍桑效应,44,(三)安慰剂效应(placebo effect),某些疾病的患者,由于依赖医药而表现的一种正向的心理效应,即使服用无任何疗效的安慰剂也会表现出一定的疗效,即安慰剂效应。因此当以主观症状的改善情况作为疗效评价指标时,其效应中可能包含安慰剂效应,45,(四)干扰(cointervention)与沾染(contamination),干扰指实验组或对照组额外地接受了类似试验药物的某种制剂,从而人为地夸大疗效的假象沾染是指对照组的患者额外地接受了试验组的药物,从而人为地造成一种夸大对照组疗效的现象干扰和沾染的控制办法就是在临床试验中
19、使用盲法并严格按治疗方案进行,在实施过程中不要随意增加和减少药物种类,46,四、病因/危险因素研究中的常见偏倚,(一)奈曼偏倚(二)检出偏倚或检出症候偏倚(三)伯克森偏倚(四)易感性偏倚(五)无应答偏倚(六)回忆偏倚(七)报告偏倚和诱导偏倚(八)诊断怀疑偏倚和暴露怀疑偏倚(九)生态学偏倚,47,(一)奈曼偏倚(Neyman bias),又称现患-新发病例偏倚(prevalence-incidence bias)如果调查对象选自现患病例,即存活病例,所得到的信息中,很多信息可能只与存活有关,而未必与该病的发病有关,从而高估了某些暴露因素的病因作用。另一种情况是,某病的幸存者改变了生活习惯,从而降
20、低了某个危险因素的水平,或当他们被调查时夸大或缩小了病前生活习惯上的某些特征,导致某一因素与疾病的关联误差,48,(一)奈曼偏倚(Neyman bias),注:*胆固醇值系第1次检查时的观测值;*胆固醇值系第6次检查时的观测值,在Framingham心血管病的研究中,采用队列研究获得结果不同于另一项病例对照研究的结果,具体结果见表5-7,表5-7,49,(二)检出偏倚或检出症候偏倚(detection bias/detection signal bias),也称暴露偏倚(unmasking bias)。病人常因某些与致病无关的症状而就医,从而提高了早期病例的检出率,致使过高地估计了暴露程度而产
21、生的系统误差,表5-8,50,(三)伯克森偏倚(Berksons bias),又称入院率偏倚(admission rate bias)如果以医院病人作为研究对象的来源时,因为所选的病例或病人对照仅是某种疾病病人中的一部分,而不是其所对应目标总体的无偏样本,而且由于医院的医疗条件、居住地区、社会经济文化等多方面因素的影响,病人对医院以及医院对病人都有一定的选择性,所以医院为基础选择的病例代表性较差,从而产生入院率偏倚。,51,(三)伯克森偏倚(Berksons bias),假如在某医院进行一项病例对照研究,以B病为对照,研究A病与某因素X的关系。设人群中患A病与B病者各为1000人,暴露于因素X
22、者各为200人,不暴露于因素X者各为800人,X的暴露率为20%,表5-9,52,(三)伯克森偏倚(Berksons bias),设患A病、患B病及暴露于因素X患者的住院率不同,且A病、B病、因素X是独立的。A病患者住院率20%,B病患者住院率50%,暴露于因素X者的住院率40%,OR1,OR1.86,表5-10,53,(四)易感性偏倚(susceptibility bias),疾病的发生不仅与外环境暴露因素有关,还与个体自身对暴露的易感性有关,由于各比较组研究对象的易感性不同而产生的偏倚称为易感性偏倚健康工人效应(health worker effect)即当以某一特定职业人群为研究对象(如
23、在医院接受健康体检的人群)时,受雇佣的特定职业人群与一般人群或失业者比较往往有较好的健康状态,54,(五)无应答偏倚(non-response bias),无应答偏倚主要发生于现况调查,表现为调查对象不合作、不参与,或因迁移、外出等原因无法获取研究对象的相关信息,因此从本质上讲和失访偏倚一样这些无应答对象通常不能代表所研究人群,且无法判断其暴露或疾病状况,因此当无应答率较高时,如大于15%,由于选择偏倚的存在,从应答人群中得出的有关研究因素与疾病的联系可能不能反映两者间的真实联系。,55,(六)回忆偏倚(recall bias),回忆偏倚多发生于病例对照研究和回顾性队列研究中由于所调查的因素发
24、生于过去,回忆的准确性和完整性受回忆间期长短、所回忆因素对研究对象的意义和该因素的发生频率的影响,造成对研究结果的有偏估计,56,(七)报告偏倚(reporting bias)和诱导偏倚(inducement bias),与回忆偏倚不同,报告偏倚是因为研究对象有意夸大或隐瞒某些信息导致了对疾病或暴露程度的错误分类如果调查者将个人倾向性的观点体现在收集资料过程中,就容易发生诱导偏倚,如认为病例应有可疑危险因素的暴露,对照原则上应为非暴露者,询问时就会对病例组相关因素重点询问,甚至启发,而对非病例组的询问则草率了事,这样,病例组与对照组该因素暴露率的差异则夹杂着调查者的部分人为因素,57,(八)诊
25、断/暴露怀疑偏倚(diagnostic suspicion/exposure suspicion bias),由于研究者或被研究者的主观倾向、愿望或偏见所导致的对疾病结果和/或暴露因素的错误判断,从而歪曲了暴露同疾病间的真实联系,分别称为诊断怀疑偏倚或暴露怀疑偏倚若研究者事先已认为暴露于研究因素可能与疾病的发生有关,则可能对暴露或干预组进行非常严格细致的检查,则会造成诊断怀疑偏倚若研究对象认为所研究因素或干预措施对疾病结果有影响,则可能会有意无意地强调或判断自身已有相应症状或疾病结果发生,此类偏倚称为暴露怀疑偏倚,58,(九)生态学偏倚(ecologic bias),生态学研究被大量地应用于对
26、可疑危险因素和疾病关系的相关分析中,生态学研究测量的是群体信息,因此,由组群间暴露水平与疾病发生的差异得出的生态学联系可能与相应的个体暴露水平与疾病发生的关系迥然不同,从而可能导致生态学谬误或生态学偏倚,59,五、其他偏倚,发表偏倚(publication bias)主要是指有统计学意义的临床研究结果比无统计学意义的研究结果更容易被投稿和发表。发表偏倚可能会过分夸大治疗(干预)效果或因果关联强度,导致临床个体治疗与卫生决策的失误,60,第四节 偏倚的防止与处理,一、设计阶段二、实施阶段三、资料分析阶段,61,一、设计阶段,(一)选择适宜的研究方案(二)随机化(三)限制(四)匹配,62,二、实施
27、阶段,(一)严格遵守设计方案(二)精心培训调查人员(三)采用盲法收集资料(四)提高调查技巧,减少无应答率(五)仪器设备的校准,63,三、资料分析阶段,(一)核实数据,避免过失错误(二)信息偏倚的灵敏度分析(三)标准化(四)分层分析(五)多因素分析,64,(一)核实数据,避免过失错误,对资料进行核查,包括缺失数据的检查,误填、漏填项目的核准、修正等原始数据尽量采取双人双机独立录入,同时结合专用程序对数据核实,避免录入错误为减少无应答、失访、不依从或排除对结果的影响,尚须对此类人员进行核实,并进行详细的描述和分析,如果失访或无应答人员较多,则应重新比较研究组间各相关指标间的差异,同时慎重考虑结果的
28、解释和推论,65,(二)信息偏倚的灵敏度分析,针对研究过程中可能出现的错误分类,可用灵敏度(sensitivity,Se)和特异度(specificity,Sp)指标来分析错分类型并估计调整的联系强度对于病例对照研究,灵敏度为暴露对象被正确分类为暴露的概率,特异度为非暴露对象被正确分类为非暴露的概率。如果病例组灵敏度和特异度与对照组分别相等,则两组发生错分程度相同,为无差异性错分;如果两组灵敏度和特异度各不相同,则发生错分程度不同,为差异性错分,66,(二)信息偏倚的灵敏度分析,假定两组灵敏度及特异度一样,则 Se24/370.649 Sp31/380.816则调整后四格表内A、B、C和D为:
29、A(Spn1-c)/(Sp+Se-1)=(0.816251-179)/(0.816+0.649-1)56 B(Spn2-d)/(Sp+Se-1)=(0.816251-193)/(0.816+0.649-1)=25 Cn1-A251-56=195 Dn2-B251-25=226,表5-11 不同方法获得的孕妇腹部X线照射史的比较,67,(二)信息偏倚的灵敏度分析,则调整后的OR值为:而调整前的OR值为1.34,表5-12 不同方法获得的孕妇腹部X线照射史的比较,68,(三)标准化,表5-13 冠状动脉旁路移植术的病死率比较,69,(四)分层分析,分层分析是资料分析阶段控制混杂偏倚最基本的方法按可
30、疑混杂因素分层后分析指标与分层前有较大差别,如各层OR值的齐性检验无统计学差异,则说明可能存在混杂偏倚,可采用Mantel-Haenszel或其它公式进行合并,计算总ORM-H值;如齐性检验差异有统计学意义,则说明可能存在交互作用,70,(四)分层分析,表5-14 病例对照研究分层资料整理表,71,(四)分层分析,表5-15 OC与MI关系的病例对照研究资料整理表,表5-15 OC与MI按年龄分层的整理表,72,(四)分层分析,分析步骤:(1)计算分层OR OR1 a1d1/b1c1 2159/(1726)2.80 OR2 a2d2/b2c2 1895/(788)2.78(2)同质性检验 计算
31、各层lnORi、Var(lnORi)、wi:Var(lnORi)=1/a+1/b+1/c+1/d wi=1/Var(lnORi)卡方检验,73,(四)分层分析,(2)同质性检验,0.0001357,P0.05,经同质性检验两层OR差异无统计学意义,表5-16,74,(四)分层分析,(3)计算总 和总OR E(ai)27.26 V(ai)11.77(21+1827.26)2/11.77=11.71,可见,OR1和OR2分别为2.80 和2.78,均大于未分层OR 值2.20,ORMH值2.79大于未分层OR值 2.20,说明由于混杂因素年龄的作用,稀释了口服避孕药与心肌梗死的关联强度,75,(四
32、)分层分析,表5-17 OC与MI按年龄分层的整理表,值得注意的是,本项有关口服避孕药与心肌梗死的关联性研究中,除了考虑年龄的混杂作用外,还需要考虑吸烟因素的混杂作用。据后续的研究报道,西方女性口服避孕药与心肌梗死的关联主要是由于吸烟的混杂所造成的,因为服用避孕药的女性中吸烟者的比例明显高于不服用者,从而造成了口服避孕药明显增加心肌梗死危险性的假象。,76,(五)多因素分析,广义线性模型(generalized linear models,GLM,其中主要包括Logistic回归模型、Poisson模型、Cox模型、对数线性模型等)线性混合效应模型(linear mixed models,LMM)广义线性混合效应模型(generalized linear mixed models,GLMM),77,Thanks!,