《医学科研中常见的偏倚类型及控制方法.ppt》由会员分享,可在线阅读,更多相关《医学科研中常见的偏倚类型及控制方法.ppt(54页珍藏版)》请在三一办公上搜索。
1、医学科研中常见的偏倚类型及控制方法(BIAS AND CONTROL),Department of Health Statistics,SMMU,2011.6.18,主要内容,偏倚的类型混杂因素与交互作用偏倚的控制,偏倚的类型,误差(error)定义:指对事物某一特征的度量值偏离真实值的部分,即测量值与真实值之差分类:随机误差(random error)系统误差(systematic error),即偏倚(bias),举例:用动脉血压计测量某人血压(实际值为80mmHg),各次测量的均值为100mmHg。下图为系统误差和随机误差的示意图,随机误差定义:指由于个体差异和在研究过程中许多微小的不可
2、控制因素造成的误差(测量误差和个体差异)特点:不可避免具有规律性,一般呈正态分布重复是控制和缩小随机误差的主要方法,偏倚(系统误差)定义:指由于对实验因素或条件控制不严而发生的一种误差特点:研究结果系统的偏离真实情况 研究结果具有一定倾向性和周期性 研究过程中应加以控制甚至消除分类:选择偏倚、信息偏倚、混杂偏倚,一、选择偏倚(selection bias)研究者在挑选研究人群时由于选择条件受限制或设计失误所致的系统误差常见种类:就诊机会偏倚现患病例-新发病例偏倚诊断信息偏倚,就诊机会偏倚,又称伯克森偏倚(Berkson rate bias),或入院率偏倚,指利用医院就诊或住院病人作为研究对象时
3、,由于患者就医机会不同导致研究结果的偏差患者是否就医取决于就医条件和对某医疗单位的信任等多种因素,而患者就医机会不同将造成研究的结果不同,用住院病例进行研究时可能没有包括:抢救不及时而死亡的病例距离医院远的病例 无钱住院的病例 病情轻的病例,表8-1 呼吸道疾病与骨骼运动器官疾病的关系(一般人群),表8-1 呼吸道疾病与骨骼运动器官疾病的关系(住院6个月以上病人),现患病例新发病例偏倚,又称奈曼氏偏倚(Neymans bias),主要是由于研究中所用的病例类型不同所产生的差别病例对照研究结果与队列研究的结果会有差异,表8-2 冠心病与高胆固醇血症的关系(病例对照研究),表8-2 冠心病与高胆固
4、醇血症的关系(队列研究),诊断信息偏倚(detection signal bias),指某疾病与暴露因素之外存在另外一个临床症状或体征,这种症状或体征不是该疾病的危险因素,但人们往往因为这种症状或体征就诊,从而间接提高了该疾病早期病例的检出率,但过高估计了暴露因素的程度,造成暴露因素和该疾病关系的偏倚,表8-3 妇女绝经期服用雌激素与子宫内膜癌的关系(以阴道出血就诊的病例),表8-3 妇女绝经期服用雌激素与子宫内膜癌的关系(以刮宫和子宫切除的病例),选择偏倚的控制,对研究过程中可能出现的偏倚有充分的了解,在设计时考虑周全严格掌握研究对象的纳入和排除标准,保障较好的代表性病例对照研究中首选新病例
5、,对照组不应为慢性病病例队列研究中增大样本量,降低失访,必要时将失访人群特征与未失访人群对照采用多重对照,二、信息偏倚(information bias)在对研究对象的信息收集、测量时出现的系统误差可以来自被研究对象也可以来自研究者本身非盲法研究较易发生,信息偏倚常见的种类,无应答偏倚回忆偏倚说谎偏倚诊断怀疑偏倚沾染偏倚测量偏倚,来自被调查对象,来自调查者本身,来自研究对象的偏倚之无应答偏倚,无应答偏倚:研究对象拒绝回答或因研究对象失访而缺失答案所造成的偏倚是否有无应答偏倚取决于无应答者在疾病暴露因素方面的特征是否与应答者有差异,美国曾采用邮寄问卷形式,调查美国退伍军人吸烟习惯。30天后总结收
6、集的回复,结果发现,不吸烟者有85%回复了问卷,而吸烟者仅67%对于一些敏感问题的调查,容易引起不应答偏倚,例如我国南方调查农村婴儿死亡原因,有28%的人拒绝提供婴儿死亡原因,来自研究对象的偏倚之回忆偏倚,回忆偏倚:因研究对象的记忆失真或记忆不完整所造成的研究结果偏倚病例对照研究和回顾性队列研究最容易出现回忆偏倚回忆偏倚的产生与调查时间至事件发生时间、以及与事件的重要性有关,同时也与调查员的调查过程和询问技术有关,Wilcox等人在调查流产回忆准确性的研究中发现,调查10年前流产的有82%的回忆完整,调查20年前流产的有73%人回忆完整。在受孕前6周流产者能回忆起来的有54%。而在受孕13周流
7、产者能回忆起来的有93%病例组和对照组的回忆误差也可能不一致,病例组往往比对照组记忆准确。原因是调查事件的重要性对两组人是不一样的,选择不易忘记的指标做调查,并重视问卷和询问技术,有助于减少调查中的回忆偏倚,来自研究对象的偏倚之说谎偏倚,说谎偏倚:研究对象故意造成的容易发生在敏感问题上,如吸毒史、性行为和中、小学生吸烟等 与研究对象个人目的有关,来自研究者的偏倚之诊断怀疑偏倚,诊断怀疑偏倚:研究者已知研究对象的某些情况,因而在诊断过程中刻意寻求某种结果而造成的偏倚非盲法研究和队列研究中容易发生,在研究口服避孕药与下肢血栓性静脉炎关系的队列研究中,观察者会对口服避孕药的妇女更加频繁、仔细的收寻静
8、脉炎的证据,尤其是对病情较轻,需要仔细检查才能确诊的病例。而对未口服避孕药的妇女检查较马虎,造成暴露与疾病结果的偏倚在开放性的药物临床试验中,也容易发生诊断怀疑偏倚,来自研究者的偏倚之沾染偏倚,沾染偏倚:研究对象有意或无意地接受了研究内容不允许接受的措施而造成的研究结果偏倚对照组接受试验组的措施,导致组间差异缩小试验组接受更好的支持治疗,研究结果偏向试验因素,称为干扰偏倚,来自研究者的偏倚之测量偏倚,测量偏倚:研究者对研究的指标和数据进行测量时产生的系统误差常见的情况有:使用的仪器未校正、测定方法的标准和操作规范不统一、操作人员技术不熟练、记录有误等,信息偏倚的控制,严格的调查设计和研究人员的
9、科学态度,严格的质量控制措施尽量采用“盲法”收集资料尽量收集客观指标的资料采用调查技巧避免无应答、回忆和说谎偏倚收集资料的范围可以适当广泛些,借以分散调查人员和研究对象对某项因素的注意力,减少某些偏见带来的偏倚,三、混杂偏倚(confounder bias)暴露因素与疾病发生的关联程度受到其他因素的歪曲或干扰而造成的系统误差,在研究设计阶段和资料分析阶段未能对混杂因素加以控制或未进行校正,使得研究结果与真实情况不符混杂偏倚会影响病因研究的因果关系、疾病治疗的效果和预后因素的评价,混杂因素存在的条件,混杂因素对研究结果有影响混杂因素与暴露因素伴随存在混杂因素在比较人群中的分布不均衡,表8-4 心
10、梗与维生素E的关系,表8-5 维生素E与吸烟的关系,表8-7 控制吸烟因素后心梗与维生素E的关系,表8-6 控制维生素E因素后心梗与吸烟的关系,混杂因素与交互作用,交互作用,暴露因素按第三个因素分层后,暴露因素和疾病的联系强度在层间明显不同,此时称第三个因素有交互作用,称为效应修正因子(effect-modification factor),表8-8 暴露与疾病的关系,表8-9a 暴露与疾病的关系(F因素不存在),表8-9b 暴露与疾病的关系(F因素存在),表8-10 某疾病与暴露因素的关系,表8-11a 疾病与暴露的关系(F因素不存在),表8-11b 疾病与暴露的关系(F因素存在),混杂因子
11、和交互因子的区别,概念区别:混杂因子歪曲了暴露因素与疾病的关系,应防止和控制;交互因子揭示了某种效应,应加以挖掘识别方法:分层分析下结论前应进行统计学检验,偏倚的控制,偏倚可出现在整个研究过程,应当在各个阶段进行控制,将偏倚的影响减少到最低程度,力求研究结论的真实可靠,偏倚的控制,设计阶段控制:限制、随机分组和配对测量和结果判断的控制:盲法资料分析阶段的控制:分层分析、标准化分析、多因素分析,设计阶段的控制,限制(restrict):指在设计阶段对研究对象的纳入标准加以限制使研究对象选取限制在一定范围内,范围越窄,研究对象彼此的差别越小,越利于观察因素作出结论,由于对混杂因素进行限制,研究的结
12、果使得研究者不可能对暴露与混杂因素的交互作用加以分析和度量,只能对暴露和疾病之间的关系进行研究限制的缺点还在于,在限制混杂因素的同时,对暴露和疾病发生的范围也进行了限制,不能观察到疾病影响的全貌,设计阶段的控制,随机分配(randomized allocation):主要适用实验研究,即将研究对象随机分配到试验组和对照组随机分配的目的:使研究对象的非处理因素和混杂因素在各组间趋于均衡,组间基线情况有良好的可比性,而使得处理因素的真实差别得以显示随机分配有简单随机分配方法和分层随机分配方法,设计阶段的控制,配对或匹配(matching):配对是控制混杂因素常用的方法。特别是在病例-对照研究中较常
13、用对病例组的每一个成员,选择具有相似特征(除了要观察的暴露因素)的对象为匹配的对照匹配的特征一般包括年龄、性别、病情等因素配对的缺点:配对因素较多会使部分病例找不到对照,致 使信息的浪费 过度配对会掩盖暴露的真实作用 不能对配对掉的混杂因子及交互作用做分析,测量和结果判断的偏倚控制,盲法(blinding):是指病人、医生或研究者不知道病人接受的是治疗药或对照药的前提下,观察或测量研究对象结果的方法盲法是避免观察者和被观察对象发生信息偏倚最有效的方法。特别是判断结果是主观的评价指标(头痛、腹痛、乏力)尤为重要盲法的目的是为了有效地避免和减少研究者和受试者的期望偏倚和主观偏见,资料分析混杂因素的
14、控制,分层分析:是资料分析阶段控制混杂因素常用的方法。即将观察对象按照相似性的特点,分成亚组后再进行试验组和对照组的比较分层分析是揭示偏倚的重要方法,也是对结果是否有偏倚的显示和纠正分层因素主要为与比较指标有关的因素,如年龄、性别、病情等。按某混杂因素分层后,再用相应的统计方法进行处理,资料分析混杂因素的控制,标准化法:是分层分析法的补充。主要用于两组率的分析和比较,当比较组间存在混杂因素,而混杂因素的不同水平在比较组的构成分布不均衡时,同时比较组的亚组率比较结果与两组总暴露率的比较结果不一致标准化(standardization)的基本思想:采用某影响因素的统一标准构成以消除构成不同对合计率的影响,使通过标准化后的标准化合计率具有可比性,甲、乙两种疗法治疗某病的治愈率比较(直接法标化后),资料分析混杂因素的控制,分层方法主要用于样本例数较大时,而且控制的混杂因素较少时当样本例数不大,或混杂因素较多,希望同时考虑暴露因素和控制混杂因素对疾病的影响时,不宜采用分层方法多因素分析方法可控制混杂因素后分析暴露因素与疾病的关系。同时可分析因素间的交互作用常用的多因素分析方法有多元线性回归、多元方差分析、协方差分析、logistic回归模型、对数线性模型、COX模型等,