病例对照研究郑全庆流行病与卫生统计学教研室文档资料.ppt

上传人:sccc 文档编号:4695689 上传时间:2023-05-09 格式:PPT 页数:92 大小:307KB
返回 下载 相关 举报
病例对照研究郑全庆流行病与卫生统计学教研室文档资料.ppt_第1页
第1页 / 共92页
病例对照研究郑全庆流行病与卫生统计学教研室文档资料.ppt_第2页
第2页 / 共92页
病例对照研究郑全庆流行病与卫生统计学教研室文档资料.ppt_第3页
第3页 / 共92页
病例对照研究郑全庆流行病与卫生统计学教研室文档资料.ppt_第4页
第4页 / 共92页
病例对照研究郑全庆流行病与卫生统计学教研室文档资料.ppt_第5页
第5页 / 共92页
点击查看更多>>
资源描述

《病例对照研究郑全庆流行病与卫生统计学教研室文档资料.ppt》由会员分享,可在线阅读,更多相关《病例对照研究郑全庆流行病与卫生统计学教研室文档资料.ppt(92页珍藏版)》请在三一办公上搜索。

1、分析性研究(analytical epidemiology),病例对照研究(case-control study)和队列研究(cohort study)均属于分析性的研究。,病例对照研究是分析流行病学研究方法中最基本、最重要的的研究类型之一,是验证病因假说的重要工具,是一种由果及因的回顾性研究方式。,分析性流行病学常使用的术语 暴露(exposure)是指研究对象曾经接触过某些因素,或具备某些特征,或处于某种状态。这些因素、特征或状态即为暴露因素。暴露因素也叫研究变量(variable)。暴露因素可以是机体的特征,也可以是体外的;可以是先天的、人体固有的,也可以是后天获得的。它可以是有害的,也

2、可以是有益的。,危险因素:是指当此因素存在时能造成人群发病率上升的内外环境因素。保护因素:是指当此因素存在时能造成人群发病率下降的内外环境因素。,分析性流行病学常使用的术语,病例对照研究的定义:,比较患某病的人与未患该病的对照者暴露于某个可能的危险因素的差异,从而确定这种因素与该病之间是否存在联系及联系程度的研究。,病例对照研究基本原理,病例对照研究是以一组患有某种疾病的人(病例)和一组或几组未患这种疾病的人(对照)作为研究对象,调查他们过去对某个或某些可以病因的暴露情况(有无或暴露剂量),通过对病例组和对照组有关暴露情况的比较,推断研究因素(暴露)作为病因的可能性。,源人群,收集数据,统计学

3、检验,统计学关联,探索和检验病因假说,基本原理,病例和对照的选择,特定疾病的病人未患该病的人,特 点,是一种回顾性研究是一种从“果”到“因”的研究设有对照组,病例对照研究设计,病例对照研究资料整理表,OR:(a/c)/(b/d)=ad/bc,病例对照研究的用途,1.广泛地探索疾病的可疑危险因素。2.深入检验某个或某几个病因假说。3.为前瞻性队列研究提供明确的病因线索,(年轻女性阴道腺癌与母亲妊娠期服用乙烯雌酚的关系)研究背景 研究步骤 研究结果,实例,研究背景,美国波士顿Vincent纪念医院妇产科医生Herbst发现,19661969年收治7例阴道腺癌患者,均为15岁22岁女青年。通常阴道癌

4、仅占女性生殖系统癌的2%,阴道腺癌仅占阴道癌的5%10%,非常罕见,而这7例全是腺癌;过去年龄均大于25岁,而这7例全在15岁22岁之间,Herbst对阴道腺癌危险因素进行探索 7例病人加上另一个医院的例阴道腺癌患者作为病例组 每个病人配4个对照,共32个对照 用标准调查表对病例、对照与她们的母亲进行了调查研究,经统计学处理后的主要结果见表,研究步骤,表 阴道腺癌病例与对照的母亲主要暴露因素的比较,研究结果,研究结果,在比较的因素中,只有三个因素有显著差别母亲怀孕期间使用过己烯雌酚激素治疗(P0.00001)母亲以前流产史(P0.01)此次怀孕阴道出血史(P0.05)因有后两个因素存在才使用己

5、烯雌酚治疗做出结论:母亲在妊娠早期服用己烯雌酚使她们在子宫中的女儿以后发生阴道腺癌的危险性增加,(一)病例与对照不匹配(二)病例与对照匹配,病例对照研究的类型,(一)病例与对照不匹配,又称成组比较法,按与病例组可比的原则,选择一定数量的对照。,(二)病例与对照匹配,1、什么是匹配,匹配(matching)或称配比:要求对照在某些因素或特征上与病例保持一致。匹配:是一种常用的选择对照的方法。,2、为什么匹配,提高研究效率,表现为每个研究对象提供的信息量增加。控制混杂因素的作用,当然分层分析也可以控制混杂因素,3、怎样匹配,频数匹配(frequency matching):匹配的因素在对照组和病例

6、组所占的比例一致,即是匹配因素的分布相同。它是整体的匹配。比如某项研究中按性别匹配,病例组男女各半,则对照组也应如此。个体匹配(pair matching):以病例和对照的个体为单位进行匹配。有1:1,1:2,1:3,1:R匹配。两者的区别主要是匹配的单位不同。,关于何时运用频数匹配和个体匹配,应主要根据研究目的,所需样本量,匹配因素的性质,研究现场实际情况综合考虑。研究罕见病,病例少,多用个体匹配。按照年龄,匹配,多考虑用频数匹配。按照特定混杂因素多用个体匹配。注意以上只是惯常的思维,并不绝对。具体情况具体分析。,匹配因素必须选择那些明确(clearly)能引起混杂作用的因子。年龄,性别,常

7、被用于匹配。,4、匹配中的问题,匹配过头把不必要的项目列入匹配会造成匹配过头。增加了选择对照的难度,降低了研究效率。使病例与对照尽量一致,就可能徒然丢失信息。,一、提出假设二、拟订研究计划 1、选择适宜的对照形式 2、病例与对照的来源与选择 3、样本含量的估计 4、研究因素三、实施研究计划四、分析、写出研究报告,病例对照研究的步骤,提出假设 根据以往疾病分布研究或现况调查结果并结合文献,提出病因假设,明确研究目的,选择适宜的对照形式 原则广泛探索病因,采用不匹配或频数匹配罕见病采用个体匹配1:R的匹配法,R值不宜超过4 形式成组比较法匹配法,病例与对照的选择 进行病例对照研究时,病例组与对照组

8、的正确选择是该研究成败的关键。基本原则 代表性 病例能代表总体的病例 对照能代表产生病例的总体人群或源人群 可比性 两组主要特征方面无明显差异,病例的选择,要求诊断可靠,尽量使用金标准 病例内外部特征的限制 内部患病部位、病理类型。外部年龄、性别、种族。病例类型的选择 新发、现患、死亡。,病例的选择,来源总体人群中的全部病例或者随机样本人群中的全部病例 医院住院或门诊的病例,对照的选择,要求 候选对象必须来自产生病例的总体,即来自同一人群;未患此病的人(可以是其它疾病);对照一旦发生所研究的疾病便成为病例组的研究对象不能有共同危险因素的疾病病人;除研究因素外其它条件一致;来源研究的总体人群或抽

9、样人群中具有代表性的非病例 医院中患有其他疾病的病人 亲属、邻居、同事、同学等,样本大小的估计,1、有关的影响因素:(1)、研究因素在对照组中的暴露率;(2)、估计该因素引起相对危险度;(3)、希望达到的精确度;(4)、希望达到的检验把握度;(5)、是单侧还是双侧检验;2、估计的方法:样本只是一个估计值,过大、过小都不好。,(一)有关参数病例组的暴露率(P1)和对照组暴露(P0)优势比(odds ratio,OR)值 把握度1-,计算应用下列公式:非匹配设计的样本量计算,Z与 Z 分别为与及值对应的标准正态分布分位数,p0与p1分别为对照组及病例组估计的某因素暴露史的比例。,正态分布的分位数表

10、 Z(单侧检验)Z(双侧检验)或 Z(单侧和双侧)0.001 3.090 3.290 0.002 2.878 3.090 0.005 2.576 2.807 0.010 2.326 2.576 0.020 2.058 2.326 0.025 1.960 2.242 0.050 1.645 1.960 0.100 1.282 1.645 0.200 0.842 1.282,例如在一次吸烟与肺癌关系的研究中,估计对照组有20吸烟史,OR值约为2,要求=0.05,=0.1,求样本大小N?,用公式求:p1=(20.2)/(1-0.2+20.2)=0.333 q0=1-0.2=0.8 q1=1-0.33

11、33=0.6667 p=(0.2+0.3333)/2=0.2667 q=1-0.2667=0.7333 Z=1.96,Z=1.282 代入公式(1.96 20.26670.733+1.282 0.20.8+0.33330.6667)2 N=(0.3333-0.2)2=228.9 即每组约需230人。,11配对设计的样本量计算m为病例与对照暴露情况不一致的对子数M总对子数,研究口服避孕药与先天性心脏病的关系,设=0.05;=0.1,对照组暴露比例为p0=0.3,估计的OR=2;则p=2/3、m=90;p1=0.46;p0=0.3M=186,研究因素的选择,(一)变量(暴露因素)的选定:一项病例对

12、照研究可用来研究多个暴露因素与疾病之间联系。但是,研究的暴露因素也不是愈多愈好,所以要精心选择、仔细设计暴露因素。与研究目的有关的变量决不可少,且应当将变量尽量分解、分细。如:吸烟(二)变量的规定:每项变量要有明确的定义,尽可能地采用国际或国内统一的标准,以便交流和比较。如:吸烟的定义(三)变量的测量:1.定量指标;2.定性指标。尽可能定量。此外,变量的测量尽可能采用客观的手段。如询问疾病史时还要查阅病历、档案等。,例:吸烟史你吸烟吗?否 是(如答是,请回答问 题2)你过去吸烟吗?是 否(如答否,请回答饮酒史)2.你多大年纪开始吸烟 岁,共吸烟多 少年 年?戒烟时间 年 月 戒烟原因 3.你一

13、般平均每天吸多少支烟?()40支以上 20支以上,10支以上 10支以下,只是偶尔吸.,资料来源与收集1、资料来源 2、调查的含义及实施时遵循的原则3、调查表,1 资料来源 医院病案记录,疾病登记报告等摘录 检测病人的标本或病人的环境获得 对病例或对照的询问调查中取得,2、调查的含义及实施时遵循的原则含义 是信息传达、接受和反映的过程,是属于行为科学的范畴,被调查者要通过感受、回忆、思维、联想和反映等过程来回答问题 原则调查表的设计需要各专家参加讨论 调查员要经过严格的培训 调查员手册监督与审查,3、调查表 定义 也称“调查问卷”,通过把拟收集的数据项目用 恰当的措词构成一系列问题的答卷,是资

14、料收集的最主要工具内容调查表的名称、编号一般项目:姓名、性别、民族等研究项目:研究变量,疾病史、吸烟史等结尾部分:调查员签名、调查日期等,资料整理与分析,描述性分析 推断性统计分析 推论因素与疾病关联,数据资料的整理和分析,(一)资料的整理1.原始资料的再核查,目的是纠正错误或补救不足,保证资料完整性。2.资料的分组、归纳、编码、输入计算机。(二)资料的分析1.描述性统计:(1)描述研究对象的一般特征(年龄、性别、疾病类型等)(2)均衡性检验:比较病例组和对照组在研究因素以外其它主要特征有否可比性。两组间非研究因素均衡可比,才能认为两组暴露率差异与发病有关。2.推断性统计(1)病例组与对照组的

15、暴露率有无统计学差异。(2)暴露与疾病的关联强度。,描述性分析,1、描述研究对象的一般特征:研究对象人数及各种特征的构成、如性别、年龄、职业、疾病类型的分布等.2、均衡性检验:比较两组某些基本特征是否相似或齐同.目的是检验病例组与对照组是否有可比性。,推断性统计分析,成组(非配比)资料的分析,非匹配和频率匹配设计资料可以整理为:,(1)显著性检验2检验检验研究因素与疾病之间有否统计学联系?可用传统的四格表公式 也可用antel-Haenszel(M-H)方法(2)计算联系强度OR值及可信区间 估计研究因素与疾病之间联系强度,(1)显著性检验,判断暴露与疾病是否有统计学联系,一般采用2检验P0.

16、05,说明两组暴露率差异有统计学意义。,联系强度大小及方向 经假设检验,若病例组和对照组之间在暴露因素上的差别有统计学意义,需进一步估计联系强度的大小及方向,常用的指标是比值比。比值比(OR)计算与可信限的估计及意义 比值比OR:病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。,OR值的95%可信区间,(2)计算联系强度,1.相对危险度(relative risk,RR)RR=P1/P0 表示暴露阳性者发病危险是暴露阴性者的几倍。2.比值比,优势比(odds ratio,OR)OR=a d/b c,计算暴露与疾病关联的强度暴露与疾病的关联强度用相对危险度(relati

17、ve risk,RR)表示,即暴露组发病率(或死亡率)与非暴露组发病率(或死亡率)之比。在病例对照研究中,由于a/n1 和c/n0不能代表暴露组和非暴露组的发病率或死亡率,所以不能直接计算相对危险度。在病例对照研究中,如果所研究疾病的发病率较低(5%),可用比值比(odd ratio,OR)来估计相对危险度。,OR特点优势比反映暴露者患某种疾病的危险性较无暴露者高的程度 如果能满足2个条件 所研究疾病的发病率(死亡率)很低 病例对照研究中所选择的研究对象代表性好 OR RR,OR值:1.当OR=1时,表示暴露因素与疾病之间无联系。2.当OR1时,表示暴露因素与疾病之间存在“正”的暴露与疾病联系

18、,暴露因素是一种危险因素,或有害因素。疾病与暴露联系愈密切,比值比的数值愈大。3.当OR1时,说明存在“负”的暴露与疾病联系,暴露因素是一种保护性因素,或有益因素。OR值可信区间除了有助于估计变异范围的大小外,还有助于检验OR值的判断意义,如区间包含1,则暴露与疾病无关联,其意义与统计学假设检验差异无显著性相同。,OR值意义,95%的可信范围是在2.183.78之间,例:食管癌发病因素的研究,1.2 检验四格表的专用公式,M-H法公式,其中E()为a的期望值;V()为a的方差,两种方法计算结果一致,表明吸烟与食管癌有联系,但联系强度如何,要计算OR,2.OR计算与可信限的估计及其意义 Miet

19、tinen法的OR可信限:结果表明吸烟者患食管癌的危险性是不吸烟者的2.87倍,95%的可信范围是在2.183.78之间,不匹配的分层资料分析,分层分析是将可疑混杂因素进行分层,排除其干扰。按照各层特征的人群进行暴露于疾病关联的分析(计算各层OR值)。如果各层的OR值齐性,则可计算总的OR值(合并OR值ORMH)。,混杂因素作用的估计与分层分析 分层分析的方法识别混杂因素计算合并OR与2值,混杂因素具备的条件,1、是该疾病的危险因素之一2、与所研究的因素有联系3、不是所研究的因素与疾病之间发病机制的中间环节,如何判断可疑的混杂因素并是否需要调整cOR(粗的、未调整的OR)ORi(第i层的OR)

20、、视cOR ORi的比值而定。cOR ORi接近,可以不作调整。、混杂因素分布的差异有无显著性。,分层分析,分层分析的目的是排除混杂因素的干扰。分层就是把研究人群按其特征分为不同层次然后分别分析各层中暴露与疾病的关联性。年龄 例:肺癌 年龄可能是混杂因素 吸烟 混杂因素:是指与研究因素和研究疾病均有关。若在比较人群组中分布不均,可以歪曲因素与疾病之间真正联系的因素。,分层分析的步骤如下,(1)按归纳表整理资料,先不分层,计算X2和OR;(2)按估计的混杂因素分层,并计算各层Xi2和ORi(3)判断分层因素与研究因素和疾病的关系;(4)计算X2MN,ORMN和95%CI;(5)判断分层因素是否为

21、混杂因素:OR(分层前)ORMH 无混杂存在。OR(分层前)ORMH 正相关。OR(分层前)ORMH 负相关。,口服避孕药()与心机梗死的病例对照研究结果服未服合计对照合计cOR.19,口服避孕药()与心机梗死的病例对照研究结果表例按年龄分层后的结果=40岁(+)(-)合计(+)(-)合计 21 26 47 18 88 106对照 17 59 76 7 95 102合计 38 85 123 25 183 208 OR12.80 OR22.78 cOR/OR1=0.78 cOR/OR2=0.78,调整混杂因素的方法(分层分析),按可疑因素的特征分成不同的层次在每一层内分别分析疾病与暴露的联系比较

22、分层前与分层后的差异(按cOR ORi的大小)判断被分层的可疑因素是否存在混杂 存在混杂调整,调整混杂因素的方法(分层分析),Mantel-Haenszel氏法ORMH=(aidi/ti)/(bici/ti)参表例,ORMH=.79 cOR.19 计算总的卡方值和OR值的95%可信区间,分层资料Mantel-Haenszel,计算Mantel-Haenszel卡方值,E(ai)=m1in1i/ti,分层分析实例,如何控制混杂因素实验设计阶段:匹配资料分析阶段:分层分析,多因素logistic回归,剂量反应关系分析,趋 势 检 验 计 算 表 研究因素水平 合计 Y1 Y2 Y3.Yi 病例 A

23、1 A2 A3 Ai N1对照 B1 B2 B3 Bi N2合计 M1 M2 M3 Mi T,扩展卡方检验计算公式2=(AiYi)-E(AY)2/V(AY)E(AY)=(N1/T)(MiYi)V(AY)=(N1N2)T(MiYi2)(MiYi)2/T2(T-1),1:1配对资料的分析匹配资料是由病例与对照结合成对子,列成表的格式,表内的数字a、b、c、d 是病例与对照配成对的对子数,表 1:1配对研究中疾病与暴露的关系,应用McNemar公式计算卡方值:ORc/bOR的 95可信区间计算用Miettinen法。,公式,例:食管癌发病因素的男性研究资料 93对男性食管癌与对照的吸烟史,95%的可

24、信范围是在1.8410.08之间,表明男性吸烟者患食管癌的危险性是不吸烟者的4.3倍,95%的可信范围是在1.8410.08之间,病因分值,暴露病因分值(EFe)也称归因危险度百分比(attributable risk percent,ARP,或AR%)AR%是指暴露者中由该暴露所致的危险性,占其总危险性的百分比例;或即在暴露人群的总发病率中,由该暴露所致发病率占的百分比例AR%=(Ie-Iu)/Ie 100%。,AR%=100%,偏倚:指在全部实验设计、进行及资料分析过程中出现的所有误差。由于这些误差导致对由暴露而引起疾病的危险性的估计错误。,偏倚及其控制,1.选择偏倚2.信息偏倚3.混杂偏

25、倚,偏倚及其防止一、选择偏倚(Selection Bias)由于入选的研究对象与未入选的研究对象在某些特征上存在差异而引起的误差。,一、选择偏倚(Selection Bias)1、入院率偏倚(Admission Rate Bias)2、现患病例-新发病例偏倚(Prevalence-incidence Bias)3、检出症候偏倚(Detection Signal Bias)4、时间效应偏倚(Time Effect Bias),二、信息偏倚(Information Bias)1、回忆偏倚(Recall Bias)2、调查偏倚(Investigation Bias),三、混杂偏倚(Confoundi

26、ng Bias)当研究某个因素与某疾病的关联时,由于某个既与疾病有制约关系,又与所研究的暴露因素有联系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系。这种现象叫混杂,其所带来的偏倚称为混杂偏倚,此外来因素称混杂因素。,病例对照研究的优缺点,优点省时、省力、费用低适宜发病率很低的疾病病因研究可研究一种疾病与多种暴露的关系缺点容易发生偏倚不能得到疾病的发病率在病因研究方面说服力有限,1.病例对照研究(case-control study,case reference study)是分析流行病学最基本、最重要的研究类型之一 回顾性从果查因的研究方法,是在疾病发生之后去追溯假定的病因因素

27、2.病例对照研究的四大要素 人群、对照、病例和暴露 明确产生病例的人群,从中正确地挑选对照,并正确地收集暴露资料是病例对照研究的精髓,小结,3.对照尽量代表所有未患研究疾病的病人,同样或尽量代表所有总体人群 病例尽量代表患有该种疾病的全部病人,一般不可能做到这一点 4.选择病例原则 符合病例的定义,就应当收入病例组,不受其暴露状态的影响,避免产生选择偏倚,5.新发病例比现患病例好新发病例与现患病例暴露分布没有差别,也可用现患病例研究先天畸形和某些非致死性慢性疾病,如肥胖、糖尿病等用现患病例,6.基本分析方法是比较两组暴露比例,计算暴露优势比,估计患病的优势比,在发病率低的情况下估计相对危险度7.对照所患疾病不应与研究的暴露因素有关,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号