《Meta-分析的统计学基础.ppt》由会员分享,可在线阅读,更多相关《Meta-分析的统计学基础.ppt(141页珍藏版)》请在三一办公上搜索。
1、Meta分析的统计学基础,王洪源北京大学公共卫生学院,一、概 述,什么是循证医学Evidence-based medicine(EBM)循证医学是在对个体病人制定临床决策时应基于当前最佳的科学研究成果。循证医学是最佳的证据、临床经验和病人价值的有机结合。,用X线进行乳腺癌筛查Mammography for breast cancer is an established screening method,Is screening with mammography justifiable?Gotzsche&Olsen Nordic Cochrane Centre conducted a syste
2、matic review in 2000 and updated it in 2001.They identified 8 large RCTs on this topic,with over 182,000 women randomized,The authors found that no trial data were of high qualityTwo were of medium quality,and the rest were poor quality or flawed.When the results of the two medium quality trials wer
3、e combined,the risk ratio was 1.00(95%CI 0.96,1.05)They concluded that“screening for breast cancer with mammography is unjustified”,The US Preventive Services Task Force reviewed the same set of trials,Recently,a 2001 Cochrane Collaboration review of the same trials concluded that six of the eight t
4、rials were flawed or of poor quality and that the pooled results from the remaining two better trials did not support a benefit from mammography.,The meta-analysis performed for the USPSTF on the most current published data found that the pooled effect size of the combined trials was sizable and sta
5、tistically significant:the summary relative risk(RR)of breast cancer death among women randomized to screening in seven trials that included women older than 50 was 0.77(95 percent CI,0.67-0.89).,The USPSTF recommends screening mammography,with or without clinical breast examination,every 1-2 years
6、for women aged 40 and older.,被动吸烟的危害,A topic of great debate and controversy for many yearsFirst few epidemiologic studies were published in 1918,Hackshaw et al.conducted a very comprehensive systematic review in 1997,They identified 37 published studies that reported risk of lung cancer among lifel
7、ong non-smoking women according to the husbands smoking status,Their meta-analysis revealed that the overall risk of lung cancer among lifelong non-smoking women was 1.24 times higher when their husbands smoked,as compared to those women whose husbands did not smoke.,什么是循证医学,利用发表的文献证据解决临床问题对证据进行严格分级
8、,提供指导对医学文献评价分级的实践指南,并充分考虑病人的需求和意愿解决具体临床问题。但这绝非否认从古至今传统决策中亦在部分使用上述方法。,循证方法的两个关键方面,证据应从最强(如随机试验及随机试验的系统评价)到最弱(如:运用生理学指标且非系统的临床观察)分级。医疗决策仅靠证据远远不够,还须考虑病人的价值取向和意愿。,循证医学证据的分级,一级:所有RCT的系统评价/Meta-分析。二级:单个样本量足够大的RCT。三级:设有对照组但未用随机方法分组的研究。四级:无对照的系列病例观察。五级:专家意见。,系统性综述,Systematic reviews(系统评价)是循证医学重要的手段。是根据某一具体的
9、临床问题,采用系统、明确的方法收集、选择和评估相关的临床原始研究,筛选出合格者并从中提取和分析数据,为疾病的诊治提供科学的依据。,循证医学与传统医疗实践的四个重要区别(1992 JAMA),系统收集的证据优于非系统的临床观察以病人终点结局为判效指标的试验优于仅根据生理学原理制定指标的试验解释医学文献对医生是一项重要技能,有必要正规学习一些证据的相关通则,以达到熟练解释的程度医生对病人的个体化评价优于专家意见。,Meta-analysis,是在系统性综述时为了合并多个独立的研究结果,所使用的统计方法。可以将针对同一问题的,多个独立的研究结果进行定量分析。目前,国外文献常常将系统评价与Meta-分
10、析交叉使用。All systematic reviews are not meta-analyses!,Systematic reviews/meta-analyses indexed in PubMed 10 years,How to read a systematic review?,研究显示Not all SRs are truly systematic(Petticrew 1999;Jadad 1998)The quality of SRs are highly variable(Mulrow 1987;McAlister 1999)Cochrane reviews,on averag
11、e,may be more rigorous and better reported than journal reviews(Mulrow 1987;McAlister 1999)However,recent studies show that even Cochrane reviews have methodological problems(Olsen 2001;Shea 2002),Evaluation of quality of primary studies sets systematic reviews apart from traditional reviewsEmpiric
12、research shows that not all SRs assess study quality:240 SRs from journals:48%assessed quality(Moher 1999)480 SRs in DARE:52%assessed quality(Petticrew 1999)50 SRs on asthma:28%reported validity assessment criteria(Jadad 2000),Berkeley,2002 on quality of SRs on HIV,published during 2001Quality asses
13、sment done in 56%of reviewsTesting for heterogeneity done in 56%of reviewsNot all SRs with significant heterogeneity explored reasons for itMany reviews did not state the rationale for choice of models used for combining dataOnly 12%of reviews evaluated publication bias,近年Meta分析文献中存在的主要问题(2002年到2004
14、年5月),提供Meta分析流程图文献搜索范围发表偏倚的说明异质性检验执行情况敏感度分析,Meta分析流程图,仅有2篇文献有进行流程图的描述,这种情况的发生可能与国内期刊并不要求等因素有关。,异质性检验执行情况,本次调查搜集所得文献中有88.0的文献进行了异质性评价。但是其中30.2的文献仅仅是提及了异质性评价,说明异质性评价的重要性并未引起国内研究者的普遍重视。只有22.0的国内研究者尝试对异质性来源进行了解释,相对的大部分的作者都未进行这个项目。,发表偏倚的说明及评估,仅有11.8的文献提及发表偏倚及偏倚的评估方法,其中有0.9的文献采用失安全系数发进行评价。发表偏倚还有其他的评估方法,如漏
15、斗图估计、线性回归法估计等,但是执行情况和失安全系数几乎相同。,因此当你找到所需的系统性综述时,你有责任去评价它的质量。,系统性综述与Meta-analyses的质量评价标准,QUOROM评价标准(the quality of reporting of Meta-analyses)。适用于随机对照试验性研究Meta分析MOOSE评价标准 适用于观察性研究Meta分析,二、Meta analysis原理和基本思想,在用样本信息推断总体参数时,是存在抽样误差的,并且抽样误差的大小与样本量的大小有关。统计学用抽样分布的理论来描述样本统计量的变化规律。,从一个均数为1.5,标准差为0.7的正态总体中进
16、行随机抽样,样本量分别为20,50,100,200,300,500,1000,不同的样本量均进行20次抽样,共得到140个样本。分别计算每个样本的均数,标准差和标准误。以样本的均数为横坐标,以样本量为纵坐标作散点图,从均数为1.5,标准差为0.7的正态总体的140次随机抽样结果,由于抽样过程存在抽样误差,样本量较大时抽样误差较小。所以从图中可以看出所有的点以样本量较大时的均数为轴,左右是基本对称的。用方差分析的方法对不同的样本所对应的总体均数是否相等进行检验,方差分析的结果为F=0.862,P=0.878。说明140个样本对应的总体均数是相同的。用这140个样本的信息来估计总体的均数和标准差,
17、=1.501,=0.699。这样做的结果是提高了估计的精度。,理想状态下SND与Precision的关系,SND 用样本均数除以相应的标准误Precision 标准误的倒数SND与Precision呈直线关系,且该回归直线的延长线是通过原点的。,理想状态,我们把不同作者对相同问题进行的研究可以看作从同一总体中进行抽样得到的一个随机样本,如果他们都是按照相同的设计得到的研究结果,并且我们可以找到每一项研究的结果,这样就可以根据上面的原理得到一个更为可靠的结果。,实际情况,不同作者:所使用的设计方案会有一定的差别,选择的实验对象有所不同,研究结果不一定都能发表到专业杂志上。因此实际能够得到的资料可
18、能是不完整的,甚至是有偏性的,如阳性结果的文章,以及和目前大家普遍能够接受的观点一致的文章可能更容易发表在专业杂志上。重复发表。认为修改数据。,有出版偏性的散点图,Meta analysis的目的及适用性,增加统计功效 由于单个临床试验往往样本较小,难以明确肯定某种效应,而这些效应对临床医生来说又可能是重要的。解决各研究结果的不一致性。寻求新的假说。,Meta analysis的局限性,1没用纳入全部的相关研究2不能提取全部相关数据3发表偏性(Publication bias)only studies with positive findings published/accepted4用于合并
19、统计的临床终点定义不明确,三、Cochrane系统评价的基本方法,Cochrane系统评价的基本方法,确立题目、制订系统综述的计划书 检索文献 选择文献评价文献质量 收集数据 分析资料和报告结果 解释系统评价的结果(讨论和结论)更新系统评价,确立题目,有意义目前或近期有没有发表的系统性综述目前有没有一定数量的可供使用的原始文献,检索文献,确定检索主题词确定检索数据库确定检索年限非发表文献的搜集方法 会议 网站 同行了解 准备与作者联系的相关文件,选择文献、评价文献质量,确定纳入标准和排除标准根据纳入标准和排除标准筛选收集的原始文献确定原始文献质量的评价标准两个人分别完成筛选和质量评价两个人评价
20、不一致时的处理方法,进行Meta分析前需要准备的技术文件,计划书 检索策略 入选、排除标准 原始文献评价标准数据提取表格与作者联系的信件,选择文献的基本步骤,绘制筛选文献流程图,收集文献数量因不同原因排除文献的数量最终纳入文献数量排除文献的特征,入选文献质量的评价,评价临床研究证据 证据来源复杂 证据质量良萎不齐 从一下三个方面评价文献质量 内在真实性 重要性 外在真实性或适用性,内在真实性,内在真实性(internal validity)就该文章本身而言是评价研究证据的核心 其研究方法是否合理,统计分析是否正确,结论是否可靠,研究结果是否支持作者的结论等。,临床重要性,研究结果本身是否具有临
21、床价值。评价研究结果的临床价值主要采用一些客观指标,而不同的研究类型其指标不同。,外在真实性或适用性,文章的结果和结论在不同人群、不同地点和针对具体病例的推广应用价值。这是临床医务工作者十分关心的问题。,评价治疗性研究证据的基本原则,研究结果的真实性研究对象是否随机分配?是否隐藏了随机分配方案研究对象随访时间是否足够长?所有纳入的研究对象是否均进行了随访是否根据随机分组的情况对所有患者进行结果分析(是否采用意向分析法分析ITT结果),评价治疗性研究证据的基本原则,研究结果的真实性是否对患者和医师采用盲法 除试验方案不同外,各组患者接受的其他治疗方法是否相同 组间基线是否可比,研究结果的重要性,
22、干预措施的效应如何效应值的精确性如何,研究结果的适用性,你的患者是否与研究证据中的研究对象差异较大,导致结果不能应用于你的患者该治疗方案在你的医院能否实施 你的患者从治疗中获得的利弊如何你的患者对治疗结果和提供的治疗方案的价值观,提取数据,文献作者、年代、来源、研究设计特征,研究对象特征干预特征评价指标质量,分析资料和报告结果,计算各研究的效应值、方差和权重 对各研究结果的效应值进行齐性检验 计算合并的效应值 固定效应模型的合并效应值 随机效应模型合并的效应值绘制各研究的效应值和置信区间 森林图(Forest Plot),试验组与对照组舒张压改善值的比较,计算各研究的效应值、方差和权重,研究结
23、果的效应值、方差和权重,对各研究结果的效应值进行齐性检验,H0:各研究的效应值相等。H1:各研究的效应值不相等。由于齐性检验的检验效能较低所以通常将检验水准定为=0.10。计算统计量Q Q=29.694,df=15,p=0.013。Q服从自由度为M1的2 分布。,计算合并的效应值,固定效应模型的合并效应值:(各研究的效应值相等)其方差为:,计算合并的效应值,随机效应模型的合并效应值:(各研究的效应值不等)DerSimonian and Laird方法 其方差为:,DerSimonian and Laird方法中权重 的计算方法,其中为固定效应模型时效应值的方差,D为随机效应部分的方差。其中为固
24、定效应模型时各研究的权重,Q为齐性检验时的统计量。,研究结果的效应值、方差和权重,Meta-analysis-Pooled 95%CI Asymptotic No.ofMethod Est Lower Upper z_value p_value studies-Fixed 1.959 1.289 2.630 5.726 0.000 16Random 2.362 1.246 3.477 4.148 0.000-Test for heterogeneity:Q=29.694 on 15 degrees of freedom(p=0.013),分析资料和报告结果,偏性的估计 漏斗图(Funnel P
25、lot)是以每个研究的效应值为横坐标,以每个研究的样本量或效应值方差的倒数为纵坐标做成的散点图。采用直线回归的方法来评价Funnel Plot的不对称 秩相关检验,导致funnel plots对称性差的原因选择偏性(Selection bias)出版偏性(Publication bias)定位偏性(Location biases)英语偏性(English language bias)引用偏性(Citation bias)重复发表偏性(Multiple publication bias)异质性(True heterogeneity)研究的规模对效应值的影响(Size of effect diff
26、ers according to study size 干预的强度(Intensity of intervention)潜在的影响因素的差异(Differences in underlying risk)数据不规范(Data irregularities)小规模的研究在研究设计方面存在问题(Poor methodological design of small studies)使用了不适当的分析方法(Inadequate analysis)伪造数据(Fraud、Artefactual)测量指标的选择(Choice of effect measure)偶然性(Chance),分析资料和报告结果,
27、偏性的估计失安全系数 可以评价结果的稳定性,将原始研究的检验统计量转换成正态性得分后计算出来的 它表示需要多少篇与所收集到文献的平均样本量相当的阴性文献才可以使合并的结果逆转。它反映了Meta Analysis结果的稳定性,失安全系数越大表明结果的稳定性越好。,分析资料和报告结果,偏性的估计trim&fill analysis 利用统计学方法去除一些研究点使漏斗图(Funnel Plot)达到对称。根据去除点的特征,加上相应的可能被丢失研究点,得到近似理想状态的情况。对增补后的资料进行合并估计。此时可以得到近似无偏性的合并结果。此方法需要反复迭代进行,比较麻烦。,Filled Meta-ana
28、lysis-Pooled 95%CI Asymptotic No.ofMethod Est Lower Upper z_value p_value studies-Fixed 1.758 1.094 2.421 5.195 0.000 18Random 1.923 0.630 3.215 2.916 0.004-Test for heterogeneity:Q=45.364 on 17 degrees of freedom(p=0.001),分析资料和报告结果,同质性的检验是Meta分析过程中必要进行的工作。异质性与合并效应评价同样重要。同质性评价需回答两个问题:是否存在异质性?如何解释和处理
29、异质性?,如果不同研究之间存在异质性可采取以下措施:,1如果能得到每个研究的原始数据,可以探讨异质性来源,并可对每个研究可以采用统一的多元回归模型进行分析,从而避免了由于使用的模型不一致导致的异质性。,如果不同研究之间存在异质性可采取以下措施:,2按不同研究的特征分组进行分析,即分亚组分析。3敏感性分析,在排除可能是异常结果的研究后,重新进行Meta分析,与未排除异常结果研究的Meta分析结果进行比较,探讨被去除的研究对合并效应的影响程度。或根据研究的不同特征分组进行Meta分析,通过比较了解异质性的来源。,如果不同研究之间存在异质性可采取以下措施:,4选用随机效应模型进行Meta分析。5选用
30、Meta回归以及混合模型进行分析,利用回归模型控制混杂因素,以消除异质性。6若异质性过于明显,则应放弃进行Meta分析,只对结果进行一般性的统计描述。,解释系统评价的结果,必须基于研究的结果:(1)系统评价的论证强度(2)推广应用性(3)对干预措施的利弊和费用进行卫生经济分析(4)对医疗和研究的意义,BMJ,更新系统评价,在系统评价发表以后,定期收集新的原始研究,按前述步骤重新进行分析、评价,以及时更新和补充新的信息,使系统评价更完善。,Tests for Publication Biaseggs Test adj.Kendalls Score(P-Q)=28 Std.Dev.of Score
31、=22.21 Number of Studies=16 z=1.26 Pr|z|=0.207 z=1.22(continuity corrected)Pr|z|=0.224(continuity corrected)Eggers test-Std_Eff|Coef.Std.Err.t P|t|95%Conf.Interval-slope 0.5845064.8916032 0.66 0.523-1.327792 2.496805 bias 1.163292.651413 1.79 0.096-.2338498 2.560434-,四、About RevMan,RevMan is the Coc
32、hrane Collaborations program for preparing and maintaining Cochrane reviews.,RevMan allows you,To enter protocols,as well as complete reviews,including text,characteristics of studies,comparison table,and study data.It can perform meta-analysis of the data entered,and present the results graphically
33、 using RevMan Analyses.,Meta Analysis的软件,商业软件:COMPREHENSIVE META ANALYSISMetaWinEasyEA 2001,Meta Analysis的软件,自由软件:RevMan(Review Manager)Meta-Stat Epi Meta,Meta Analysis的软件,通用统计软件中有Meta-analysis的程序:STATA SAS WinBUGS NCSS,Meta analysis on STATA,SJ-4-2 pr0012.Submenu and dialogs for meta-analysis comma
34、ndsSTB-38 sbe16.Meta-analysisSJ-3-4 sbe19_5.Tests for publication bias in meta-analysisSTB-56 sbe20.1.Assessing heterogeneity in meta-annl.:the Galbraith plotSTB-42 sbe22.Cumulative meta analysisSTB-42 sbe23.Meta-analysis regressionSTB-45 sbe24.1.metan-an alternative meta-analysis commandSTB-56 sbe2
35、6.1.Assessing the influence of a single study in meta-analysisSTB-56 sbe28.1.Meta-analysis of p-valuesSTB-61 sbe39.2.Nonpar.trim&fill anal.of publication bias in meta-analsSJ-4-2 st0061.Funnel plots in meta-analysis(Stata Journal,Stata Technical Bulletin),循证医学,主编:李幼平高等教育出版社2003年11月,医学统计学第十八章 Meta 分析及应用(我),主编:倪宗瓒高等教育出版社2003年8月,谢谢各位,