《实习8偏倚及其控制ppt课件.ppt》由会员分享,可在线阅读,更多相关《实习8偏倚及其控制ppt课件.ppt(59页珍藏版)》请在三一办公上搜索。
1、偏倚及其控制,目的:了解偏倚的类型及常见偏倚的测量与控制方法时间:3-6学时内容:大课回顾、实习题目,误差的概念 一般地讲,真实值与研究结果(实际测量值)之间的差异。误差的种类 随机误差:随机误差主要来源于研究的抽样过程。 系统误差:由研究设计(方法的本身特点、设计的 缺陷等)与实施过程的失误所致。流行病学调查研究中的各种系统误差又称偏倚。,误差(error),error in medical research,Systematic,Random,Error,Sampling,Measurement,随机误差(random error),定义 由于某事件发生的概率造成的测量值和真实值之间的误差
2、,是随机性的,通常造成的差异在真实值的两侧波动,并且是较小的误差,可以通过统计学中计算标准误的方法估计其大小。,随机误差主要与研究对象的变异程度、抽样方法、样本大小等有关。随机误差是流行病学研究中的精确性(precision)问题。由于随机误差难以避免,所以流行病学研究的精度具有相对性。,系统误差(systematic error),定义 人为造成的错误,是由于研究设计、实施和分析不正确造成的测量值与真实值之间的差异。误差向量的方向一致或基本一致。系统误差是流行病学研究中的真实性(validity)问题。通常把流行病学研究中的各种系统误差称称为偏倚(bias)。,Random error an
3、d Bias,Random error,Bias,偏倚(bias),偏倚的定义 :指在研究中所获得的结果系统地偏离真实值的情况。 偏倚的大小:偏倚的大小通常以相对数表示。 设 OR:实际测量值; OR:真实值 BIAS=(OROR)/ OR 则 若该值为0 ,无偏倚 若该值为正,正偏倚 若该值为负,负偏倚,偏倚的分类(1)选择偏倚(Selection bias)(2)信息偏倚(Observation bias or information bias)(3)混杂偏倚(Confounding bias),选择偏倚,定义 在流行病学研究中,由于选择研究对象的方法不当,使得被选择的对象在某些特征上与没
4、有被入选者之间相差很大,或是两组或几组研究对象的选择标准不统一,而致使研究结果偏离真实情况。,选择偏倚的分类,入院率偏倚现患-新发病例偏倚检出症候偏倚无应答偏倚易感性偏倚(以健康工人效应为例)排除偏倚志愿者偏倚迁移性偏倚非同期对照偏倚,入院率偏倚(Admission rate bias or Berksons bias) 是指在进行病因研究、临床试验、预后判断等研究时,利用医院就诊或住院病人作为研究对象,病例与对照入院率或就诊机会不同而导致的偏倚。,因不同住院率而住院的A、B病患者及其与因素X的关系,2000.5+100 0.4,800 0.5,2000.2+160 0.4,800 0.2,造
5、成不同疾病入院率不同的原因:医院技术特长;患者疾病严重程度、经济状况,就诊方便程度等(医院病人双向选择)。,现患-新发病例偏倚(Prevalence-incidence bias or Neymans bias) 是指病例对照或现况研究中的病例为现患典型病例,不包括死亡、病程短、轻型等病例。因此 对估计暴露因素的作用会有一定偏倚;或病例因疾病改变了生活习惯,从而低估了暴露因素的作用。,检出症候偏倚(Detection signal bias) 某因素本与疾病无关,但可引起所研究疾病的症状或体征,从而促使患者早就诊,提高了早期病例检出率,过高的估计了暴露程度。 例:病例对照研究发现:服用雌激素与
6、子宫内膜癌发病有正关联。 原因:雌激素促进子宫内膜生长,导致出血,频繁接受检查,促使早期发现子宫内膜癌患者。,无应答偏倚(Non-response bias) 研究对象未按要求回答调查内容,而无应答者的患病或因素的暴露情况与应答者又不同,从而造成该偏倚。,健康工人效应 在研究某些职业暴露的危害而以一般人群作参比时,由于职业工人相对于一般人群健康,从而降低了暴露因素与疾病之间的真实联系。,非同期对照偏倚(non contemporary bias) 例:当前用口服红霉素治疗猩红热,其治愈率优于40年前青霉素等药综合治疗的结果,但这种现象并非由于红霉素的疗效真正优于青霉素所致,而是因为猩红热的病原
7、体随着时间的推移发生变异,毒力减弱所致。,Exclusions,Lost to follow-up,Non-participants,Sampling scheme,Inclusion criteria,Informed consent,信息偏倚,定义 指在流行病学调查、采集各种信息资料的过程中,由于测量暴露或结局的方法有缺陷,使所获得的信息偏离真实值的一种结果。,信息偏倚的分类,回忆偏倚(recall bias)诱导偏倚(inducement bias)报告偏倚(reporting bias)测量偏倚(detecting bias)临床资料遗漏偏倚(missing clinical data
8、 bias)家庭信息偏倚(family information bias)暴露怀疑偏倚(exposure suspicion bias)诊断怀疑偏倚(diagnostic suspicion bias),报告偏倚(reporting bias) 由于研究对象有意扩大或缩小某些信息造成的偏倚。 例:缩小信息:性乱史;青少年吸烟史 扩大偏倚:职业危害(为获取福利),暴露怀疑偏倚(Exposure Suspicion bias) 研究者事先了解研究对象的患病或结局,可能会对其以与对照组不可比的方法探询认为与某病或结局有关的因素。对同一组研究对象以不同的方法调查,结果会出现很大差异。,诊断怀疑偏倚(D
9、iagnostic suspicion bias) 由于研究者事先了解被研究者的暴露情况,怀疑被研究者已经患某种与因素相关的疾病,因而在诊断或分析时做出带倾向性的判断。如对暴露组的检查细致程度大于对照组。,混杂偏倚,定义 在研究的设计阶段未能对混杂因素加以控制和在资料分析阶段未能进行正确校正所造成的偏倚。,混杂因素(confounding factor),定义 指与研究因素和研究疾病均有关联,可以掩盖或夸大研究因素与疾病之间真正关联的因素。特点 混杂因素必须是所研究疾病的独立危险因素 混杂因素必须与所研究暴露因素存在统计学联系 混杂因素不应是暴露因素与疾病因果链中的一个环节或中间变量,如何判断
10、混杂因素,几种情况: E E E E E:研究因素 D D D D D:疾病 F F F f F F:外来因子 E E E E f:伴随因子 D D D D :因果关系 F F F F :一般相关(1-3混杂成立,4-8混杂不成立),混杂因素的测量,根据表1计算的OR为粗OR(cOR) 按混杂因素分层后,计算各层OR: OR(f+) OR(f-)1.如果 OR(f+)= OR(f-)= cOR, f不是混杂因素。2.如果 OR(f+)= OR(f-)cOR, f为可疑混杂因素,计算aOR,若aORcOR,则f是混杂因素。3.如果 OR(f+) OR(f-),应对分层OR进行同质性检验,若无显著
11、性差异,计算aOR,如aORcOR,则f为混杂因素;若差异有显著性,认为各层资料不属同质资料,考虑 f为效应修饰因素。,偏 倚 的 控 制,选择偏倚的控制措施,随机化设立多种对照严格掌握研究对象的诊断、入选、排除标准提高应答率,减少失访(失访率20%),信息偏倚的控制措施,采用盲法收集资料收集客观指标的资料使用统一的标准收集资料保证研究人员的科学态度适当采用一些调查技巧,回忆偏倚资料的校正举例,以病例组回忆偏倚为例,Se= a1/(a1+c1) Sp=c2/(a2+c2),灵敏度(Se):真阳性率。实际有病而按该筛选试验的标准被正确地判为有病的百分比,设:按一定的Se,Sp获得暴露的测量结果,
12、也可以得到一个测得的OR值,我们可以根据以下公式计算出该暴露的真实分布,从而求得真实的OR(aOR)A=(Spn1-c)/( Sp+Se-1)B=(Spn2-d)/( Sp+Se-1)C= n1-AD= n2-B由这些数据就得到了暴露的真实分布,并求其aOR,并可按前述公式进一步求得回忆偏倚的值。(课后习题四及此类题型,待会不再详述),混杂偏倚的控制措施,设计阶段限制匹配随机化 分析阶段分层分析标准化多因素分析,实 习 题 目,课题一 表8-1不同来源研究对象估计药物与疾病关系OR值,问题,如何解释表8-1中两种不同来源研究对象研究结果的差异?原因?据表显示,与以社区人群为研究对象相比,对以医
13、院为研究对象研究结果所产生的偏倚大小与方向予以测量如何控制该偏倚,答案提示,该差异由于入院偏倚根据前面所给公式分别计算各类药物OR值的偏倚设多组对照,其中一个应来自社区人群,如果通过不同对照组所获得的差异不大,则可认为无入院偏倚;相反,则提示有此偏倚存在,课题二(表略),考查点:以“健康工人效应”为例讨论易感性偏倚课题背景:某些报道显示,橡胶行业工人不但总死亡率较一般人群高,而且肿瘤、心血管等疾病死亡率也有升高的趋势。但本次研究结果显示橡胶行业工人全死因及其他一些死因观察死亡数低于期望死亡数。,问题,如何解释此现象?能否说明橡胶行业职业暴露对人类健康不但没有危害而且还有保护性作用?在研究某些职
14、业暴露的危害时,以一般人口作参比易受“健康工人效应”的影响,如何控制?,答案提示,问题1提示: 暴露组期望死亡数=暴露组实际人口数一般人口标准死亡率 期望死亡数是以一般人口死亡率作参比计算所得,因此,如果暴露组与一般人口在影响疾病或死亡的人群特征上(如年龄、性别、疾病易感性等)构成不一致时,计算出的期望死亡数不能反映其真实的理论死亡水平。职业工人相对于一般人群是健康的,即对疾病的易感性低,所以,观察死亡数低于期望死亡数不能说明职业暴露是保护因素。,问题2提示不以一般人群作对照,设立的对照组最好能使除了研究因素之外的其它影响疾病发病或死亡的因素与暴露组一致以一般人群作对照,所选人群应与暴露组相同
15、地区、相同年代、相同人群构成等通过实际观察获得能够代表本地区的职工和一般人群死亡率的比值,以此为校正系数乘以研究人群各亚组预期死亡数进行校正,课题三 表8-5 干预组应答者与无应答者随访死亡人数,问题,根据7455例应答者的资料能否反映干预组的情况?为什么?提示:通过考虑无应答率,及两组的总死亡率和死因别死亡率是否有差异,来推断无应答者对研究的影响是否重大,可能产生无应答偏倚的原因有哪些?如何控制和处理此偏倚?,调查者 调查方法 调查对象,加强宣传,充分了解研究的重要性,加强设计技巧(目的明确、指标具体)、询问技巧、选择合适调查方法,遗漏、研究目的不明确,技巧、项目设置不当等,信函调查电话调查
16、面谈调查,客观:不在家、文化程度低、疾病严重不能回答主观:不了解调查意义、对调查内容不感兴趣,若无应答率较高时,可对其做如下处理:子样估计法:从无应答者中随机抽取一个子样对其进行调查,然后比较其与原样本应答者的研究指标,看两者是否有差异多次访问法数理统计法,课题四答案提示,1.cOR=1.34 x2=2.03 p0.052.Se=24/37=0.65 Sp=31/38=0.823.真实分布,aOR=2.44 bias=-0.45,4.如何避免该偏倚: 1.选择一个与暴露史有联系的鲜明的记忆目标帮助研究对象联想回忆 2.尽量使用客观记录资料 3.加强宣传使研究对象了解研究的重要性,课题五,答案提
17、示,考查点:混杂偏倚1.根据表1计算2 和cOR28.47 p0.01; cOR=1.72. 分别计算OR1和OR2; 作各层OR的同质性检验,计算分层后的OR值及其显著性检验,有关计算数据见下表,式中:,2,OR1=1.805 OR2=1.873同质性检验 20.009 p0.05 aOR=1.83bias=(1.70-1.83)/1.83=-0.071,3. 根据混杂因素的特点 判断超重是否为混杂因素cORaor 即粗的OR值不等于分层调整后的OR值在非暴露组中,研究疾病与可疑混杂因素之间的OR值不等于1在非病例组中,暴露因素与可疑的混杂因素之间的OR值也不等于1所以超重是混杂因素,Thanks!,