《第八章(二) 流行病学研究的真实性课件.ppt》由会员分享,可在线阅读,更多相关《第八章(二) 流行病学研究的真实性课件.ppt(74页珍藏版)》请在三一办公上搜索。
1、第九章 流行病学研究的真实性,偏倚及其控制 Bias and Control,南京医科大学公共卫生学院流行病与卫生统计学系地址:南京市汉中路140号一号教学楼(南)307-1(210029)电话:86-25-86862815 (o) 13851545125 (m) 电邮:,喻 荣 彬,流行病学教学工作室,1、如何认识和评价个体和群体的变异?2、随机误差和系统误差的区别?3、有人研究HBsAg携带者孕妇宫内传播HBV的频率, 共检查16例引产死胎,其中4例胎儿肝内HBsAg阳 性,从而得出HBsAg携带者孕妇发生宫内HBV传播 的频率高达25%的结论。4、有人调查公鸭和母鸭患某病的情况,检查市场
2、上出 售的公鸭3028只,母鸭239只,其患病率分别为4.9% (148/3028)和19.7%(47/239)。因而作者得出某病母 鸭患病率比公鸭高的结论。,问题与案例讨论,5、有人调查喝生水与某病的关联,进行了病例对照研 究。病例组当面询问其喝生水的情况,对照组用电 话询问,结果如下:,结论:喝生水和某病有关联。,讲课提纲,概 述,一、研究结果的变异性(variability),1: the quality of being subject to variation syn: variableness, variance ant: invariability, invariability
3、2: a quality of variability and lack of uniformity syn: unevenness ant: evenness, evenness,Variability,变异的来源,生物学变异测量变异,随机变异系统变异,变异的水平,180 ,174,215,305233,276,146,195205,188,190,295170,164,248,162220,219,228,250,295,146,220,162,228,219,164,190,188,233,305,195, 276,215,170,源群体,样本A,样本B,样本C,高胆固醇率,= 40%,
4、= 20%,= 0%,高胆固醇率 = 25% (240mg/dL),源群体与样本高胆固醇率的样本变异性示例,膳食与药物预防心机梗死的样本变异性示例,6%,9%,6%,9%,二、研究的真实性和可靠性,真实性/准确性/效度 validity, accuracy可靠性/可重复性/精密度/信度 reliability, reproducibility, repeatability, precision,概念 研究收集的数据、分析结果和所得结论与客观实际的符合程度。也称“有效性”、“效度”。,真实性(Validity),Validity refers to the extent to which an
5、assessment method produces accurate, meaningful, and useful measures of the skills and knowledge it was designed to assess. The primary issue is content validity, which is whether an assessment and instructional program align (match).,随机误差系统误差,影响真实性的因素,真实性的两个方面,内部真实性外部真实性,Are we measuring what we th
6、ink we are measuring?,内部真实性(internal validity) 定义 研究结果与实际研究对象真实情况的符合程度,回答一个研究本身是否真实或有效。,Internal Validity refers to the extent to which the findings of a study accurately represent the causal relationship between an exposure and an outcome in the particular circumstances of that study. The internal
7、validity of a study can be suspect when certain types of biases in the design or conduct of a study could have affected outcomes, thereby obscuring the true direction, magnitude, or certainty of the effect.,限制研究对象类型 限定研究的环境条件 限定干预措施,改善措施,外部真实性(external validity) 研究结果与推论对象真实情况的符合程度,又称普遍性(generalizabi
8、lity),回答一个研究能否推广应用到研究对象以外的人群。,External Validity refers to the extent to which the findings obtained from an investigation conducted under particular circumstances can be generalized to other circumstances. To the extent that the circumstances of a particular investigation (e.g., patient characterist
9、ics or the manner of delivering a treatment) differ from the circumstances of interest, the external validity of the findings of that investigation may be questioned.,推论代表性不好,内部真实性可能好,而外部真实性差。增加研究对象的同质性(如限制类型如年龄、职业、体质特征或疾病分型等),可改善内部真实性。增加研究对象的异质性,可改善外部真实性。在实际研究需综合考虑研究对象的同质性和异质性问题。,内部真实性与外部真实性的联系,真实性
10、差可靠性好,真实性好可靠性差,真实性 vs 可靠性,真实性 vs 可靠性,真实性好可靠性好,真实性差可靠性差,影响真实性与可靠性的因素,随机分布的,不可预测的不可避免的可估计误差大小通过增加样本量或重复测量取均值可以减小,系统的偏离真实值可避免的是必须控制的,(偏倚 bias),随机误差和系统误差的区别(一),随机误差和系统误差的区别(二),(偏倚 bias),系统误差、随机误差和样本大小的关系,在流行病学研究设计和实施中由于方法的局限或错误所产生的系统误差使研究结果系统地偏离真实值,以及解释结果的片面性,称为偏倚(bias)。,三、偏倚 (bias),概念,Bias (600-540BC),
11、Bias是古典文化中七贤人之一Lydia国王克利萨斯向Bias咨询建造、部署战舰防御爱奥尼亚人的最好方法,Bias为了避免战争、流血,骗克利萨斯国王说,爱奥尼亚人正在买马准备陆地战,后来,Bias向克利萨斯国王承认说了谎,爱奥尼亚人实际上也在建造战舰,国王对Bias的本意表示赞许,与爱奥尼亚人讲和。后人将“背离事实”称为“bias”。,Hunter D. Father of all bias? BMJ 2002;324:1071,Bias背离事实,描述性研究分析性研究实验性研究,偏倚的后果, 样本对总体的推断出现系统误差 也可得出虚假和间接联系的假设, 产生虚假和间接联系的结论, 统计学联系的
12、本质 病因 + 偏倚 + 机遇 偏倚可导致:虚假联系间接联系 偏倚的种类 概括起来三大类 选择性偏倚 信息偏倚 混杂偏倚, 偏倚的方向, 正向偏倚:Overestimate away from the null “1”,负向偏倚:Underestimate toward the null “1”,1、定义 由于选择研究对象方法上的错误或缺点使研 究结果系统地偏离真实值。2、实质 被选入的研究对象与没有被选者特征上的差 异所造成,造成样本不能代表总体,或两个 样本(或两组研究对象)不是来自同一总体, 后者造成研究之外的因素在两组分布不均衡。,第一节 选择性偏倚(selection bias),(
13、1)任意挑拣样本结构(sampling frame),即所谓“典型 样本”。常见于现况研究和病例对照研究(2)主观挑拣研究对象 “随便抽样”或“随意抽样” (3)失访或无应答(lost to follow-up or non-respondent)(4)入院率的影响(5)根据暴露信息作出诊断的病例,再用这类病例去 研究该暴露与疾病的联系。,3、来源,4、种类,入院率偏倚(admission rate bias ) Berksons bias 现患病例或新发病例偏倚(prevalence-incidence bias ) Neyman bias 检出信号偏倚(detection signal b
14、ias ) 易感性偏倚(susceptibility bias ) 排除偏倚(exclusive bias 无应答偏倚(non-respondent bias ),入院率偏倚(admission rate bias ) Berksons bias,选择性偏倚的一种形式,是指利用医院就诊或住院病人作为研究对象时,由于入院率的不同而导致的偏差。当利用医院病人作为病例和对照时,由于对照是医院的某一部分病人,而不是全部目标人群的一个随机样本,又由于病例只是该医院或某些医院的特定病例(因为病人对医院及医院对病人双方都有选择性),所以作为病例组的病例也不是全体病人的随机样本。由此产生的病例和对照就与人群中
15、的研究对象存在着某些差异,难免产生偏倚。,举例:入院率偏倚,皮肤癌和高血压关系的病例对照研究,一、病例和对照的选择 病例组:皮肤癌患者 对照组:骨折患者,二、某社区全部人群调查结果,三、某医院中调查全部病人的结果,假定三种疾病的入院率分别为: 皮肤癌60% 骨折25% 高血压40%,则有: 皮肤癌 not 高血压0.648002880 骨折 not 高血压0.2548001200 皮肤癌 with 高血压0.612000.4(1200720)912 骨折 with 高血压0.2512000.4(1200300)660,现患病例或新发病例偏倚(prevalence-incidence bias
16、),奈曼偏倚(Neyman bias),在进行病例对照研究或现况研究时,用于研究的病例一般是研究时的现患病人,不包括死亡病例和那些病程短、轻型或不典型的病例。此外一些病人在患病后,有可能会改变其原来对某些研究因素的暴露情况。这样用于研究的病例类型显然会与队列研究或实验性研究有所不同,如在队列研究中,研究者可以随访观察到各种临床类型的新病例。由此产生的偏倚称为现患病例新发病例偏倚。,检出症候偏倚(detection signal bias ),指某因素与某些疾病在病因学上虽无关联,但由于该因素的存在而引起了该病相关症状或体征的出现,使患者及早就诊,接受检查,从而使该人群有较高的检出率,以致得出该
17、因素与该疾病相关联的错误结论。,1、雌激素可以刺激子宫内膜生长,易出血,易被早期诊断;未服雌激素者不易得到及早诊断。2、 Ziel etc. 等的研究早期病人占的比例较高。3、另一调查发现:暴露雌激素的子宫内膜癌患者 79为早期病人非暴露雌激素子宫内膜癌患者 55为早期病人,举例,雌激素和子宫内膜癌的关系 ( Ziel etc. 1975),检出症候偏倚存在的原因分析,易感性偏倚(susceptibility bias ),研究对象暴露于某一可疑致病因素与否,与很多主、客观因素有关。这些因素均可直接或间接地影响观察人群或对照对所研究疾病的易感性,从而导致某因素与某疾病间的虚假联系,由此而产生的
18、偏倚被称为易感性偏倚。,健康工人效应(healthy worker effect),职业流行病学研究队列研究,志愿者偏倚,排除偏倚(exclusive bias ),在选择研究对象的过程中,没有按照既定的原则或标准自观察组或对照组中排除某些不符合标准的研究对象所导致的对某因素与某疾病之间联系的错误估计,称为排除偏倚。,例:阿司匹林与心肌梗死关系的病例对照研究不应包括慢性关节炎患者也不应包括慢性胃溃疡患者,方法:在理论上可以通过比较总人群与实际抽样人群研究 疾病与暴露因素的分布的两个四格表进行测量。 举例:以病例对照研究为例,5、测量,总人群,样本人群,根据选择概率,选择偏倚的大小和方向可表示为
19、:,若选择偏倚 = 0,即 ,则不存在选择偏倚若选择偏倚 0,即 ,则存在选择偏倚,此时若选择偏倚 0,即 ,则存在选择偏倚,此时,6、控制,研究设计阶段 建立和利用健康监测系统信息。掌握全人群有关暴露和疾病发病的信息,最大限度地获取人群有代表性的样本 。采用严格科学的研究设计。明确定义源人群和样本人群,根据研究性质预测获取样本过程中可能产生的各种选择偏倚,采取措施减少或控制 。 明确对象纳入标准、统一疾病诊断和监测程序。,资料收集阶段 加强随访、提高应答率。在资料收集阶段尽可能多地收集有关暴露史的各种信息,包括暴露程度、暴露时间、暴露改变以及改变的原因等。,数据分析阶段可以对无应答或中途退出
20、者与应答或完成随访者作一些基线变量比较。也可以根据先前的知识来估计可能存在的偏倚及其方向,并进行灵敏度分析。还可以利用一些附加的方法学研究来量化预期存在的偏倚,如用不同对象入院率来估计伯克森偏倚等。,1、定义 在收集资料的过程中,由于测量暴露或/和 结局的方法缺陷,致使获 得的信息产生系 统误差。2、本质 通常表现为研究对象的某种特征被错误分类 (misclassification),也即使用的方法偏离了 金标准。在对疾病状态和暴露状态判断时都 有可能发生。,第二节 信息偏倚(information bias),又称观察偏倚、测量偏倚、衡量偏倚,检测方法不统一 诊断标准不统一 观察条件不统一
21、询问方式不统一 研究对象引起,如记忆不准、态度的影响等 综合引起的偏倚,“诱、供、信”造成,3、来源,4、种类,(1) 回忆偏倚(recall bias) (2) 报告偏倚(reporting bias) “说谎偏倚” (3) 诊断怀疑偏倚(diagnostic suspicion bias) 又称“疑诊偏倚” (4) 暴露怀疑偏倚(exposure suspicion bias) (5) 测量偏倚(detection bias)(6) 诱导偏倚(inducement bias),回忆偏倚(recall bias),报告偏倚(reporting bias),是指研究对象在回忆以往发生的事情或经
22、历时,由于在准确性或完整性上的不同而产生的系统误差。在病例对照研究中尤为常见,其产生与许多原因有关。,是指由于研究对象有意夸大或缩小某些信息而导致的系统误差,也称“说谎偏倚”。,诊断怀疑偏倚(diagnostic suspicion bias),研究者事先了解研究对象对研究因素的暴露情况,怀疑其已患病,或在主观上倾向于应该出现某种结果,于是在作出诊断或分析时,倾向于自己的判断。如对暴露者或实验组非常细致地进行检查,而对非暴露者或对照组则不然,从而使研究结果出现偏差。由此造成的偏倚称为诊断怀疑偏倚,多见于临床试验和队列研究。,暴露怀疑偏倚(exposure suspicion bias),研究者
23、如果事先了解研究对象的患病情况或某些结局,可能会对其以与对照组不可比的方法探寻认为与某病或某结局有关的因素,如多次认真地询问病例组某因素的暴露史,而漫不经心地询问对照组,从而导致错误结论,此即暴露怀疑偏倚。,5、测量 以队列研究资料为例,论述错分偏倚产生的条件和类型,错分不产生偏倚的条件是 RR=RR, 也即,当暴露组和非暴露组检查的灵敏度(Se)和阳性预测值(PPV)都相等时,即可满足上述条件。,暴露组,非暴露组,若SeSe,PPV=PPV,根据各组检查的灵敏度(Se)和特异度(Sp)是否相同,分为无差异错分偏倚(非特异性错分偏倚)和有差异错分偏倚(特异性错分偏倚)两种。,非特异性错分同等发
24、生于暴露组和非暴露组 SeSe,SpSp 但RRRR或OROR 偏倚方向趋向 1特异性错分同等发生于暴露组和非暴露组 Se与Se或Sp与Sp至少有一对不等 且RRRR或OROR 偏倚方向不确定,非特异性错误分类,示例1,病例组,对照组,特异性错误分类,示例2,病例组,对照组,信息偏倚的测量,若信息偏倚 = 0,则不存在选择偏倚若信息偏倚 0,则存在选择偏倚,此时若信息偏倚 0,则存在选择偏倚,此时,或,6、控制,研究设计阶段暴露因素必须有严格、客观的定义,力求指标定量化。要有统一、明确的疾病诊断标准。调查表项目应易于理解和回答。研究对象应清楚地了解本次研究的目的、意义和要求,以获取其配合和支持
25、。调查员需经过严格培训,能严谨客观地从事资料收集工作。研究者应定期检查资料的质量,并设立质量控制程序。,资料收集阶段应尽量选用客观定量指标,可选用回忆指征帮助对象回忆,也可利用实物或照片来准确获取信息。为了避免主观诱导对象,除了严格培训调查员外,在临床试验和某些现场研究中,应尽可能采用“盲法”以消除主观因素对研究结果的影响,但在采用“盲法”的同时需考虑其伦理学可行性。研究中的各种测量仪器、试剂和方法都应标准化。,统计分析阶段错分偏倚的校正,校正方法 以病例对照研究为例,则校正后,校正后,(示例1数据),示例3,1、定义 当研究某一暴露因素与疾病的联系时,由于一 个或多个既与疾病关联又与暴露因素
26、关系密切 的外来因素的影响,从而掩盖或夸大了所研究 的暴露与疾病的联系。2、本质 既与研究疾病有关,又与研究因素有关的混杂 因子或外来因子(extraneous factor)在比较的 人群组中分布不均所造成。,第三节 混杂偏倚(confounding bias),举例吸烟、火柴与肺癌,烟草公司的研究者坚持认为火柴暴露可以引起肺癌,他们开展了一项大型的病例对照研究来检验这个假说。研究者通过人群登记系统找到了1000名肺癌病例,其中820人曾携带过火柴;从人群中随机抽取了1000名对照,经X线确认未患肺癌,其中340人曾携带过火柴;根据这批数据,定量估计火柴与肺癌之间的关联。,火柴、吸烟与肺癌,
27、火柴、吸烟与肺癌,OR粗= 8.8 (7.2, 10.9)OR吸烟者 = 1.0 (0.6, 1.5)OR不吸烟者= 1.0 (0.5, 2.0),吸烟、火柴与肺癌,OR粗 = 21.0 (16.4, 26.9)OR携带火柴 = 21.0 (10.7, 41.3)OR不携带火柴 = 21.0 (13.1, 33.6),(1)必须是所研究疾病的独立危险因子 (2)必须与研究因素(暴露因素)有关 (3)一定不是研究因素与所研究疾病因果链上的中间 变量,3、混杂因素的基本特点,4、混杂的后果,继发关联直接因果关联的歪曲,C,E,D,D,E,F,D,E,F,(1)继发关联,(2)直接因果关联的歪曲,(
28、3)直接因果关联的歪曲,?,?,?,HIV感染D,性乱F,静脉吸毒E,?,直接因果关联的歪曲,5、测量,原理 比较含有该因素时研究因素与疾病的效应估计 值cRR或cOR和排除该因素后的效应估计值aRR( f ) 或aOR( f )。,(1)若cRRaRR( f ),则 f 无混杂作用(2)若cRRaRR( f ),则 f 有混杂作用(3)若cRR aRR( f ),则 f 为正向混杂,使cRR高估(4)若若cRR aRR( f ),则 f 为负向混杂,使cRR低估,判定方法,测量,若值 = 0,无混杂 值 0,为正向混杂 值 0,为负向混杂,(1)限制(restriction) (2)随机化(randomization) (3)匹配(matching) (4)层化或标化(stratification) (5)多因素分析,如Logistic回归分析等,6、控制,设计阶段,分析阶段,混杂偏倚与交互作用的区别,总 结,流行病学研究设计的主要目的是:估计随机误差、控制偏倚,凸现出真实的联系。,