(循证医学ppt课件）第5章循证医学实践中常用的统计学方法.ppt

资源描述

《(循证医学ppt课件）第5章循证医学实践中常用的统计学方法.ppt》由会员分享，可在线阅读，更多相关《(循证医学ppt课件）第5章循证医学实践中常用的统计学方法.ppt（76页珍藏版）》请在三一办公上搜索。

1、循证医学中常用的统计学方法,主讲老师：陈青山医学院流行病学教研室,临床研究的数据资料，主要集中于PICO类指标的测量，如研究对象特征指标（population/patients，P）干预测量指标(intervention，简写I)对照（companson，C）结果（局）指标(outcome，O)等构成统计学分析与效果评价的物质基础,临床研究的“创证”到循证医学的临床“用证”涉及统计方法的正确应用、以及对研究结果真实可靠的评价。实践循证医学除了应具有临床专业知识、经验和技能之外，还应具备分析和评价临床研究证据所需的医学统计学知识和技能。,1 临床证据的数据资料类型,一、分类变量资料(cate

2、gorical variable)先将观察单位按某种属性或类别分成相互独立的若干组，再清点各组观察单位个数所得到的资料。二、数值变量资料用测量或其它定量方法对每个观察单位的某项指标进行测定所得到的一组数值，一般带有度量衡单位。三、等级资料（ranked data）又称半定量资料将观察单位按某种属性或某个特征的等级顺序分组，然后清点各组观察单位的个数得来的资料。,统计资料的几种类型,1证据资料的方法学质量评价,一、单个研究证据的质量评价（一）判断资料的完整性资料的完整性是指纳入分析的研究对象数量以及重要指标数应前后保持一致，不能遗漏或选择。,丢失率=（入组例数终末例数）入组例数100%丢失率20

3、%时，表明资料质量较差设计阶段设置的重要结局指标与最终纳入分析的指标，两者是否一致，不能任意删减,（二）组间的基线资料是否可比除研究因素外，组间基线资料应尽量做到组间均衡。试验和对照两组的重要临床基线资料应该相对一致。如例数、性别和年龄构成、病情严重程度、病程的组间差异无统计学意义。,（三）重复性检验医生的诊断水平Kappa值0.7及以上，质佳。实验室的操作条件、试剂是否标准？应用试剂的批内及批间差异度？在容许范围内吗？批内差异度=1一第二次测量值第一次测量值批间差异度=1一第二批测量值第一批测量值这两类差异度均应控制在5%以内。,（四）缺失值分析及其处理缺失值是指因种种原因不能得到观测指标的

4、具体测量值。随机性缺失，即缺失值的出现与组别、干预措施等无关，随机产生、无固定规律。缺失比例不要超过l0%。,非随机性缺失，有规律可循，集中出现或个体出现。假如，药物的毒副反应过大，造成病人的大量失访，直接表现在试验组与对照组的缺失比例不同，影响结果。与组别、干预措施等有关，在设计阶段应考虑好相应处置措施。对于小样本影响尤为明显。,1分类变量资料的数据缺失及处理一般通过敏感性分析，观察结果的稳健性，继以考察缺失值对结果的影响程度。例如，试验组和对照组各丢失了10例，把试验组丢失的10例当作“无效病例”，对照组丢失的10例当作“有效病例”，再作差别比较，两组率差有临床及统计学意义，则结果可靠；若

5、结论相反，结果对缺失值敏感，应审慎解释。还可作意向性分析。,2数值变量资料的数据缺失及处理数值变量资料表达以均数标准差表示。95%可信区间的间隔小、精度高，则意味着数值资料可靠性高，结果较为可信；反之则精度差，考虑原始数据“丢失”过多或样本数量较少所致。随机性缺失值小于10%，缺失值可用平均值替代。,（五）样本量的分析应进行样本量估算，不是越大越好。重点考察最小效应量以及、型错误的水平如在一个临床治疗性试验中新药组假设有效率为80%，而对照组的疗效为60%，则试验组比对照组临床效果好20%，型错误率（）0.05，型错误率（）0.1，应用相应公式计算样本量。,样本量小于40例的资料，特别是当p0

6、.05(无统计学意义)，效应量有一定的临床价值时，应计算错误率，如果其0.2，表明样本量不足，扩大样本再试是必要的。相反，若样本量很大时，即使是组间差异很小，有可能出现P水准、差别有统计学意义。,（六）资料的分层分析两组基线不一或效果差异不明显的大样本研究，可考虑作分层分析，发现有意义的重要差异。分层分析有助于提高统计分析质量。,二、多个研究证据的质量评价循证医学实践过程中，得到多个类似的原始研究结果可能不一致，应积极寻找相关的系统评价/meta分析。系统评价是指针对某一具体的临床问题全面系统地收集现有相关原始研究，用统一的科学评价标准，去粗取精，去伪存真，从中筛选出符合标准、高质量的研究，然

7、后用定性或定量的方法进行综合，从而得出可靠的结论。meta分析则是指系统评价中的一个定量综合分析过程，是对多个医学研究结果的数量化汇总分析。,系统评价的质量评价，可分为报告质量评价，反映了系统评价报告内容的完整性和全面性以及与系统评价标准格式的吻合程度，能为读者提供充分的信息资料；方法学质量评价，指系统评价及其过程中能否遵循科学标准、有效控制混杂与偏倚、使结果达到真实可靠的程度。,报告质量高并不意味着其方法学质量也高，其结果就真实可信；倘若报告质量差、报告内容不完整，增大方法学质量评价的难度，甚至无法评价。系统评价的质量评价兼顾两者，综合分析。,质量评价带有很强的主观性，为保证评价的质量，可以

8、借助一些信度效度反复验证的量表，如OQAQ量表(the Oxman-Guyatt Overview Quality Assessment Questionnaire)QUOROM量表(the Quality of Reporting of Meta-analysis),OQAQ：主要用于评估方法学质量条目设置围绕系统评价的基本步骤选题立题文献检索与筛选原始文献质量的严格评价汇总分析等避免或减少混杂与偏倚的程度。,QUOROM：测试系统评价的报告质量；不适合作方法学质量分析。,OQAQ表：系统评价之质量评估量表,3 统计学方法的正确抉择,一、单个研究及其统计方法的抉择统计分析包括两方面内容统计描

9、述统计推断包括假设检验与可信区间估计,判断统计方法选用是否合理，应明确相关统计方法的基本条件：正态分布，选用均数标准差；对数正态分布，用几何均数标准差；不服从正态分布或对数正态分布者，选用中位数及四分位间距。,（一）证据统计描述的基本要求1数值变量类证据的统计描述，见表。表数值变量资料的集中趋势指标,表数值变量资料的离散趋势指标,2关于分类变量资料的统计描述，见表表分类变量资料的常用描述指标,对于分类变量类证据，其统计描述常用率和比。例如发病率、患病率、病死率、致残率、有效率等。相对危险度(RR)、比值比(OR)，某一事件率（死亡、有效、副效应）、绝对危险降低率(ARR)、相对危险降低率

10、(RRR)以及NNT等。NNT是与对照组比较，新的措施需要处理多少例数才能防止一例不良事件的发生（number needed to treatNNT）,（二）可信区间与精确度分析分析证据精确度主要是借助效应量及其可信区间(CI)或可信限(CL)。可信区间是按一定的概率（1）去估计总体参数所在的范围，包括准确度和精度两种属性。,准确度是指区间内包含总体参数的可能性。如总体均数的95%可信区间，准确度为95%，意味着在该区间范围内有95%的可能性包含总体均数，或者说从总体中做100次随机抽样，得到100个可信区间，那么理论上有95个可信区间包含被估计的总体均数；精度是指可信区间的宽度，宽度越小精度

11、越高。精度与样本量和准确度有关，在样本量固定的情况下，准确度越高，精度越差，99%可信区间较95%可信区间的精度差，反之亦然。,1数值变量类证据的精确度估计公式：如探讨传统康复疗法对脑卒中患者预后的改善效果，将39例患者纳入研究，半年后测量功能恢复评分为(35.6 28.11)分，其精确度：本例95%可信区间：下限为35.6-9.1=26.5(分)，上限为35.6+9.1=44.7(分),2二分类变量类证据的精确度(1)单组率的95%可信区间单组率的可信区间估计公式：例如用某降压药治疗60例高血压患者，其中24例有效，有效率为40%。此例，p=0.4，n=60，则有效率p的95%可信区间为：其

12、下限为0.276，上限为0.524。,(2)两组率比较的95%可信区间两组率的差值为绝对危险降低率(absolute risk reduction，ARR)ARR=P2-P1可信区间为：ARR1.96SEARR其中,如在某临床试验中，甲组治疗125例，病死率为12%，乙组治疗120例，病死率为25%，则ARR=P2-P1=0.25-0.12=0.13，ARR标准误为0.049，95%CI为0.131.960.049，下限为3.4%，上限为22.6%。,(3)相对危险度(RR)及95%CIRR=P1/P2，服从对数正态分布，对数转换为log(RR)相应的标准误本例RR=0.12/0.25=0.4

13、8，log(RR)的95%CI=-1.31-0.167经反对数转换，RR的95%CI为0.2720.846。,表相对危险度(RR)及其95%CI判断,(4)NNT及其95%可信区间NNT是指与对照组相比，需要治疗多少病例才能获得1例最佳结果。其95%可信区间不能直接计算，利用ARR及其可信区间上、下限的倒数估算而来。,本例NNT=1ARR=10.13=7.7其95%可信区间：上限为10.034=29.4，下限为1/0.226=4.4。,(5)相对危险降低率RRR及其95%CI不能直接计算，用1减去相对危险度的95%CI值推算出上例：RRR=l-RR=1-pl/p2=1-0.12/0.25=0

14、.52RRR的95%可信区间为0.1540.728。,在循证医学应用证据过程中，有时会缺乏95%CI资料，这些计算方法可供借鉴。值得指出的是，有些证据特别是RCT研究证据，当其具有临床价值，但又无统计学意义，特别是P0.05或更大时，需借助95%CI进行综合判断。,（三）有关统计学假设检验方法的正确抉择表数值变量资料比较的常用假设检验方法,表分类变量资料比较的常见假设检验方法,（四）多因素分析及相关要求多因素分析方法中，需要事先定义应变量和自变量，构建一般表达方式为：其中y为应变量，常为结局指标,多因素分析应注意样本量是否足够，通常要求样本量应为纳入分析的自变量个数的510倍；注意相关自变

15、量的赋值与标准化问题。分类变量及数值变量都可作为自变量纳入，分析前按要求转换为标准数据，建立相应的数据库。,1.多元线性回归分析多元线性回归分析用回归方程定量地刻画一个数值变量的应变量(Y)与多个自变量间线性依存关系的大小与方向。用表示。为方程的常数项，也称截距，Y的基线水平量。为偏回归系数。,多元线性回归的条件：应变量（结果变量）要求是数值变量资料，且满足随机性与独立性，自变量可以是数值变量资料、分类变量资料、等级资料；应变量与自变量间具有线性关系；残差e服从正态分布等。,2.logistic回归模型logistic回归模型是研究分类变量结果与一些影响因素之间的一种多元（变量）统计方法。l

16、ogistic回归模型特点：为结果变量为分类变量资料，自变量可logistic回归模型为分类变量，也可以是连续性变量。,logistic回归模型常用于：控制一个或多个混杂因素时，探讨某个事件的发生与研究因素的关系；探讨各种影响因素间的交互作用；筛选危险因素；预测事件发生。,3COX风险比例回归模型生存分析是将结果事件发生及发生时间进行综合分析的一种统计分析方法。多因素生存分析方法首推COX风险比例回归模型。应变量（结果变量）为生存时间，自变量为分类变量资料或者数值变量资料。,模型一般表达为：为风险函数（风险率或瞬间死亡率）为基准风险函数，是与时间有关的任意分布函数，分布与形状无明确的假定。表示

17、与生存可能有关的影响因素，为回归系数，由实际数据估计得到，要求在观察时间内是恒定的、不随时间变化。,（五）分层分析与亚组分析为观察某个新治疗措施的效果，直接将试验组与对照组进行整体分析，也许不具备统计学意义，读者有可能否定其价值。若按病情程度等重新进行分层分析或亚组分析，可能发现有重要临床与统计学意义的结果。,例如颅脑血肿患者施以A、B两种不同手术方式，并比较临床疗效。A组与B组各有490例，尽管A术式从临床意义上要优于B术式，然而假设检验发现P=0.08，按照a=0.05水准，整体比较并无统计学意义。,按颅内CT片所定量的出血灶大小（小量、中量和大量出血）分层，以死残率为终点指标，进行分层分

18、析后，会发现小量与中量出血灶组A式与B式手术的死残率差异无统计学意义，大量出血组A术式则显著优于B术式,进一步依据出血量分层的Logistic分析结果发现A组死残率仅为B组的0.7倍；出血量每增一个等级，则死残危险度平均为原等级的1.9倍，且具有临床与统计学双重意义(P0.05)。可见，分层分析有时对判断最佳证据质量有所帮助的。,二、多个研究及其统计方法的正确抉择多个类似的临床研究，假设干预措施、设计方案相同时，就可将这些临床研究集中起来，在严格评价的基础上，进行综合量化分析，获得更为精确可靠的量化结论，这种方法就称为系统评价或meta分析,任何系统评价/meta分析，一定要有明确的解决某个临

19、床问题之目的，要有严格的设计和计划，纳入的文献一定是高质量的研究成果，千万不要采用低质量的证据来做这一工作否则，会以讹传讹，造成误导。,此外，进行这项工作的实施者需要掌握系统评价的方法外，具备良好的临床专业知识、经验和临床思维方法，与单个研究的要求一样，基于多个研究的系统评价，其统计方法也要做到正确抉择。,（一）描述指标的选择1二分类变量资料结果描述可以选用比值比(OR)、相对危险度(RR)，也可选择绝对危险度(RD)、NNT等绝对指标。其中OR使用广泛，在样本分布及模型拟合上有一定统计优势，但OR有可能被曲解，且与其他统计量相比，稳定性差。RR与OR同为相对测量值，当结果事件罕发时，两者数值

20、接近，常被用于估计合并效应量；,RD、NNT为绝对测量值，反映基线危险度以及干预后危险度的改变量。可信区间可能随基线危险度变化而变化，不宜用于合并效应量的可信区间估计。NNT与时间因素有关，纳入研究的随访时间相同时，才适合做合并分析。理想的结果表达最好是相对指标（如OR、RR、RRR）和绝对指标(RD、NNT)同时报告。,2数值变量资料（连续性变量资料）采用均数标准差形式。应用此类证据时，要警惕可能出现的偏态数据及潜在的影响。数据资料是否呈偏态分布，最简单的判断方法就是计算均数与标准差的比值，若该比值小于1.64及以下时，说明标准差过大，该组数据可认定为正偏态。,合并效应量可选均数差值和标准均

21、数差值选均数差值（mean difference，MD）的最大好处是合并结果有自然单位，易于理解和解释。当结果变量所采用的尺度或度量衡单位不一致时，其合并效应量表达宜采用标准化均数差值（standardized mean differenceSMD），但应慎重解释此类结果。,3个体病人资料若能直接获得个体病人资料，可与统计师联系，重新分析这些原始数据，并根据具体数据类型，选用适当方法加以描述。,（二）系统评价中汇总分析方法的抉择尽管有很多汇总分析方法可供选择，但选用哪一种模型以及如何处理异质性等方面，仍存在一些争议。目前较为一致的看法是在决定是否进行汇总分析以及采用哪种模型，应综合权衡以下几个

22、方面的内容：,首先，应结合异质性检验结果和效应量的分布假设，选择随机效应模型或固定效应模型实施汇总分析。当存在较为明显的临床异质性时，最好不要进行合并分析，应设法弄清异质性的来源，如干预因素、研究对象、结果测试指标以及研究质量等方面是否存在不同，必要时考虑进行亚组分析和敏感性分析。,其次，利用固定效应模型检验合并效应量的假设是否成立，其结果是否稳健。合并效应量的假设检验若有统计学意义，表明至少其中一个原始研究的效应量是有意义的。应注意无论异质性是否存在，利用固定效应模型估计的结果只是所纳入研究效应量的平均值。,随机效应模型假定研究效应量不固定，服从正态分布。研究间效应量的变异大小用组间方差为权

23、重，对效应量校正估计。较小样本量的研究在合并分析中给予较大权重，较大样本量研究结果所占的权重适当减小；小样本研究的质量较差，发表性偏倚影响大因此，应慎重选择随机效应模型。,实际应用中，采用两类模型分别计算结果若无异质性，两个模型的合并结果应该一致；当异质性检验有统计学意义且假设研究间效应量不固定、服从正态分布时，应选择随机效应模型的估计结果倘若异质性过大，应进行亚组分析或meta回归分析。与固定效应模型结果相比，随机效应模型估计结果更保守一些（可信区间较宽）,表常用统计方法一览表,4 证据的临床意义与统计学意义,无论是单个研究结果还是系统评价证据，在应用前，应综合判断其统计学意义与实际价值假

24、如证据有重要临床价值，则看其统计推断结果（包括假设检验及效应量的可信区间估计）,注意假设检验的结论是概率性的，有可能犯I型或型错误。若限定为小于0.05，则表明该试验犯I型错误的概率在5%以下，真阳性率则95%若试验设计时限定型错误（即假阴性错误）90%,在临床实践中，往往可以遇到有些证据既有临床价值，又具统计学意义，结果自然可信；反之，无价值。有时尽管临床证据有重要意义，然而无统计学意义，这时要慎下结论；反之，如无临床价值，却有显著统计学意义，其证据的临床价值却不大。,表证据的统计学意义与临床意义,临床意义和统计学意义进行综合分析，才能得出合理的结论。假设检验有统计学意义，并不能说明其有临床价值。不能仅仅依据p值的大小就武断说某种证据的有用或者无用，否则就可能出现误判。,The end,

展开阅读全文