诊断试剂性能评价生化检验课件.ppt

资源描述

《诊断试剂性能评价生化检验课件.ppt》由会员分享，可在线阅读，更多相关《诊断试剂性能评价生化检验课件.ppt（82页珍藏版）》请在三一办公上搜索。

1、第三章临床生物化学诊断试验的性能基础与评价,江苏大学基础医学与医学技术学院姜旭淦,全国高等医药院校医学检验专业规划教材临床生物化学检验（第二版）,2,教学目标与要求,掌握：诊断试验、金标准的概念；诊断试验结果与患病情况的关系；参考范围、临界值与医学决定水平的概念；诊断试验的准确性、有效性和可靠性评价的常见指标；ROC曲线的概念、制作与应用。熟悉：参考范围的建立；参考范围概念的正确使用。了解：医学决定水平的制定；诊断试验样本含量的估计；ROC曲线下面积的计算。,3,临床诊断试验(clinical diagnostic test)：临床上用于确定或排除疾病的方法或项目。临床生物化学诊断试验：

2、临床生物化学实验室中用于疾病筛查、诊断和监测的方法或项目。诊断试验的诊断性能评价：方法或项目与疾病之间的关系，评价该方法或项目对某种疾病的诊断价值。,临床诊断试验,4,第一节参考范围,一、参考范围的建立,5,1参考个体按预定标准选择的正常个体。纳入标准：地区、民族、性别、年龄段等；排除标准：不能有血压不正常、器质性疾病、乙肝阳性、近期的急性感染、输血或手术、用药、妊娠或哺乳等。2参考总体所有参考个体的集合。3参考抽样组参考总体的抽样，又称参考样本。4参考值每一个参考个体的检测值。5参考值范围各个参考值剔除离群值并补充数据后的集合范围。,（一）基本概念,6,6参考值区间包含95的

3、参考总体的参考值范围。双侧正态（均数法）： 1.96s，即（ 1.96s）（ 1.96s）；双侧偏态（百分位数法）：2.5位数（P2.5）的参考限97.5位数（P2.5）的参考限。单侧正态： 1.65s以下或 1.65s以上；单侧偏态：P5的参考以下或P95的参考限以上。参考范围,7,标准参考个体（按预定标准选择的个体）组成参考人群（包括尽可能多的参考个体）选出参考组测定参考值分析分布特征（正态、偏态）统计参考值限度指定参考范围（参考值区间）,（二）参考值和参考范围制定步骤,8,（三）建立参考值注意事项,正确选择受检对象具有代表性。合理规定参考人群的条件，如年龄、性

4、别、民族，以及标本采集的时间和地区因素等。保证一定数量的受检人数，一般应有100例以上，若分布呈偏态时应在120例以上，特殊情况至少也应30例以上。测定方法标准化，保证结果的可靠性和可比性。根据专业知识确定单、双侧位界，严格按照统计要求进行测定结果的处理。,9,二、参考范围的引用（可移植性）,群体参考范围可来于文献报告（注意：仪器厂商与商品试剂盒提供的参考范围不可轻易引用）引进一种新方法，应该首先进行小样本量的参考值调查，如果结果与文献或厂家提供的数据相一致，就可以不再调查，否则应做进一步的调查，确定本实验室的参考范围。,10,三、在临床应用中应注意的问题,参考范围的使用有一定的范围，仅适合于

5、符合参考个体要求的参考人群。参考范围仅覆盖研究人群的95%，因此，参考值范围不能盲目地作为正常与疾病的分界点。综合评估。注意年龄、性别、饮食、药物、个人习惯和体力锻炼等因素的影响。检测方法与参考范围或参考值的关系。,11,临界值（cut off value）:划分诊断试验结果正常与异常的界值。又称阈值、分界值、鉴别值、指定值、诊断界值、截断点等。,一、临界值,第二节临界值与医学决定水平,12,DL：医学决定水平，D：临界值,正常人和病人分布曲线,临界值的选择,13,医学决定水平（medical decision level，MDL/DL）：临床上按照不同病情给予不同处理的指标阈值。用DL或

6、Xc表示，用来排除或确定某一临床情况或预告将会出现某一生理变化现象。,二、医学决定水平,14,A、正常人参考范围B、无关疾病患者的参考范围 C、有关疾病患者分型、分期的测定值D、文献资料及医生意见,（一）医学决定水平的制定依据,15,16,不同指标的DL数量、数值不同:A低、高B低、低、高C低、高、高不同实验室的水平值也略有不同。,（二）医学决定水平的水平值模式,17,“低、高”模式血清氯参考范围：98109mmol/L；有二个DL：90mmol/L、112mmol/L。90mmol/L时，应加做其他检查以确诊或排除：严重呕吐、腹泻等胃肠道丢失。长期限制氯化钠的摄入。代谢性碱中毒。艾迪生病

7、。 112mmol/L时，应加做其他检查以确诊或排除：高氯血症性代谢性酸中毒。氯化物摄入过多。高钠血症：失水大于失盐，氯化物相对浓度增高。,医学决定水平的临床应用举例,18,“低、低、高”模式血清清蛋白（Alb）参考范围： 3550g/L，有三个DL：20g/L、35g/L、52g/L。20g/L表示肝病患者的预后严重；35g/L为检查低清蛋白血症的界值；52g/L则稍高于参考范围上限，可排除许多假阳性。,医学决定水平的临床应用举例,19,“低、高、高”模式血清总钙参考范围： 2.252.65mmol/L，有三个DL：1.75mmol/L、2.75mmol/L、3.38mmol/L。1.75

8、mmol/L时，应加做其他检查以明确病人发生低血钙抽搐的可能性，并采取预防措施；2.75mmol/L 时，应加做其他检查以确诊或排除原发性副甲亢的诊断； 3.38mmol/L时，考虑为高血钙昏迷，应及时做出诊断，不得延误。,医学决定水平的临床应用举例,20,金标准（gold standard）：当前为临床医学界公认的诊断某种疾病最可靠的诊断方法，可通过活检、尸检、外科手术、随访等所作出的决定性诊断，又称确诊试验。诊断肿瘤的金标准一般是病理学检查，诊断冠心病的金标准是冠状动脉造影，诊断肾炎的金标准是肾活检，诊断胆结石的金标准是手术所见，诊断心肌病的金标准是心肌活检等。,第三节诊断试验的

9、指标与评价,金标准,有一些疾病目前尚无金标准，由专业学术委员会或世界卫生组织（WHO）制定的诊断标准。,参考标准,21,类风湿关节炎患者血清IL-6、TNF与性激素水平的变化,22,确立金标准后，再与诊断试验同步盲法测量研究对象。据金标准将研究对象划分为“有某病”、“无某病”，据诊断试验的临界值将其划分为“阳性”、“阴性”结果，然后整理出相应的四格表计算准确性、有效性等评价指标。,研究程序,23,诊断试验的四格表,真阳性（true positive，TP）：金标准确诊为有某病且诊断试验检出为阳性的例数。假阳性（false positive，FP）：金标准确诊为无某病且诊断试验检出为阳性的例

10、数。真阴性（true negative，TN）：金标准确诊为无某病且诊断试验检出为阴性的例数。假阴性（false negative，FN）：金标准确诊为有某病且诊断试验检出为阴性的例数。,24,例诊断性能指标计算,已知用金标准确定原发性肝癌病人60名，非原发性肝癌400名；血清AFP以30g/L为判断值，共检测出65人为原发性肝癌，其中有8人为假阳性。计算诊断敏感度、诊断特异度、漏诊率、误诊率、+PV、-PV、阳性拟然比、阴性似然比。,25,1. 准确性评价指标：又称为真实性评价指标，包括如灵敏度、特异度和准确度等。2. 有效性评价指标：包括预测值、流行率和似然比等。3. 可靠性评价指标：

11、重复进行试验得到相同结果的稳定程度，包括变异系数、符合率等。,一、诊断试验的指标,26,1 . 灵敏度与漏诊率 2 . 特异度与误诊率 3 . 准确度,（一）诊断试验的准确性评价指标,4正确指数又称尤登指数（youden index，YI）SeSp115Kappa指数又称为总一致性指数，公式为：,27,1. 灵敏度,灵敏度（sensitivity，Sen）又称敏感性、真阳性率（True positive rate，TPR）。在患病者中，应用该诊断试验检查得到阳性结果的百分比。真阳性灵敏度-100% 真阳性假阴性灵敏度= =反映诊断试验正确地识别患病者的能力, 该值愈大愈好。,28,理想

12、试验的诊断敏感度为100%。敏感度高的诊断试验，用于普查或定期健康体验，能筛选某一疾病。以防漏诊。拟诊为某种疾病时，可起到排除某一诊断或早期确诊。,29,2. 特异度,特异度（specificity, Spe）又称特异性、真阴性率（True negative rate，TNR）。在非某病者中，应用该试验获得阴性结果的百分比。真阴性特异度-100% 假阳性真阴性反映诊断试验正确地鉴别非患者的能力，该值愈大愈好。,诊断特异度= =,30,理想试验的诊断特异度为100%。特异度高的诊断试验对临床某些疾病的确诊有很大帮助，以防误诊。,31,3. 漏诊率和误诊率,漏诊率（），又称假阴性率（Fa

13、lse negative rate，FNR）反映将患者诊断错误的概率，该值愈小愈好。与灵敏度互补的指标，漏诊率（）1Sen误诊率（），又称假阳性率（False positive rate，FPR）反映将非患者诊断错误的概率，该值愈小愈好。与特异度互补的指标，误诊率（）1Spe,32,4.诊断一致性指标,反映诊断试验结果与患某病情况的一致性程度。主要指标诊断准确度Kappa指数,33,（1）诊断准确度（accuracy，AC）,又称总符合率、诊断效率（diagnostic efficiency）：在患病和非患病者中，用诊断试验能准确划分患者和非患病者的百分比。真阳性真阴性诊断准确度 -10

14、0% 真阳性假阳性真阴性假阴性反映诊断试验正确诊断患者与非患者的能力。,34,（2）Kappa指数,又称为rater一致性，比较稳定，不易受发病率的影响。 2(adbc)Kappa指数 (ab)(bd)(ac)(cb)其值于01之间变动，其值愈大，诊断试验与金标准的一致性愈好。一般在0.75以上时被认为具有高度的一致性。,35,（3）正确指数,又称尤登指数（youden index，YI）表示诊断试验发现真正的患某病和非患某病者的总能力。YI SeSp11其值于01之间变动，其值愈大，诊断试验的真实性愈好。,36,诊断试验结果与常见评价指标,37,1 . 预测值2 . 流行率3 . 似然比

15、,（二）诊断试验的有效性评价指标,38,临床诊断与诊断概率,诊断试验与疾病诊断诊断试验的任务是为临床医师对疾病的诊断提供证据。诊断试验的结果不等于诊断。验前概率和验后概率临床医师对就诊者可能患何种病的初步印象的量化指标，称为验前概率（pretest probability）。结合诊断试验的结果，得出就诊者患病可能性大小的估计称之为验后概率（post test probability），也称为预测值。,39,1. 预测值,预测值（predictive value，PV）：也称预告值，诊断试验预示金标准结果的程度如何。包括阳性预测值和阴性预测值，分别表示诊断试验结果确定或排除某种疾病存在与否的诊

16、断概率。预测值受流行率的影响。,40,（1）阳性预测值(positive predictive value，PPV或PV),阳性预测值（患病的试验后可能性）：在诊断试验结果为阳性的人数中，真正患病者所占的百分率，即试验结果阳性者属于真病例的概率。真阳性阳性预测值-100% 真阳性假阳性,41,（2）阴性预测值(negative predictive value，NPV或PV),阴性预测值：在诊断试验结果为阴性的人中，非患病者所占的百分率，即试验结果阴性者属于非病例的概率。也叫非患病的试验后可能性。真阴性阴性预测值-100% 真阴性假阴性,42,2.流行率（Prevalence，P）,表示在

17、受检对象的总人数中，真正患病者所占的百分率，也叫患病的试验前可能性或患病率。真阳性假阴性流行率 -100% 真阳性假阳性真阴性假阴性,43,流行率的特性,可从流行病学调查资料查知，也可以是临床医师在长期的医疗实践中，对门诊就诊者患某病的比例的经验认识。由于不同的地区、不同级别的医院、普通医院和专科医院，其就诊者的组成差别可能很大，同样的疾病在不同的医院的流行率也不同。临床医师必须根据具体情况确定流行率，才能得出较为准确的阳性预测值。,44,流行率对阳性预测值的影响,45,3. 似然比,验后概率较之验前概率的符合程度和变化方向的特性量化指标称为似然比（likelihood ratio ，LR）

18、。似然比又称拟然比，包括阳性似然比和阴性似然比。拟然比性质稳定，不因流行率的改变而改变。,46,（1）阳性似然比（positive likelihood ratio，LR或LR（）,阳性似然比：用诊断试验检测患病人群的阳性率与非患病人群的阳性率之间的比值，即真阳性率与假阳性率之比。可用以描述诊断试验阳性时，患病与不患病的机会比。灵敏度真阳性率阳性似然比 1特异度假阳性率,47,（2）阴性似然比（negative lidelihood ratio，LR或LR（）,阴性似然比：用诊断试验检测患病人群中的阴性率与非患病人群的阴性率之间的比值，即假阴性率与真阴性率之比。可用以描述诊断试验阴性时，

19、患病与不患病的机会比。 1灵敏度假阴性率阴性似然比特异度真阴性率,48,似然比直接判断一个诊断试验好坏,LR()1.0 ，当试验结果为阳性时，试验提示患病可能性增高能力的一种度量。LR()2.0-5.0 , 认为该试验不太好；LR() 10.0 ，认为是好的。LR()1.0 ，当试验结果为阴性时，试验提示患病可能性降低能力的一种度量。LR()0.50.2 ，认为该试验不太好，LR() 0.1 ，可认为是好的试验。,49,可靠性（reliability），又称重复性（repeatability）、精密度（precision）：诊断试验在完全相同的条件下进行重复试验得到相同结果的稳定程度。1

20、.变异系数或标准差2.符合率两名操作者同时对比检测，列四格表计算。符合率愈高，试验的可靠性愈好。符合率 ,（三）诊断试验的可靠性评价指标,50,1. 变异系数和标准差,评价计量资料精密度的指标。变异系数有利于相互比较。测定值均数的标准差变异系数- 100% 测定值均数,51,2. 总符合率,评价计数资料可靠性的指标。方法用同一诊断试验方法对同一批受检对象进行重复检测，将检测结果列四格表，然后用上述公式计算总复合率、Kappa指数等指标，进行可靠性评估。总符合率愈高，试验的可靠性愈好。,52,3.影响可靠性的因素,生物学变异包括研究对象的个体内变异和个体间的变异。观察者的变异由观察者对测定

21、结果判断的不一致所致的差异。同一观察者内的变异（如不同时间、条件时）和不同观察者之间的变异。试验方法差异包括仪器、药品和试剂、以及条件等因素引起的变异。,53,1.金标准应有可靠性2.研究对象应有代表性与可比性3.样本含量应足够4.诊断指标与方法应标准、具体、可靠5.金标准与诊断试验应同步盲法测量6.临界值的选择应合理7.诊断试验应具有临床实用性,二、评价诊断试验的要点,54,1. 金标准一般都是由专业学术委员会或WHO制定，包括若干条款。但在一些疾病没有金标准时其所制定的诊断标准可作为参考标准。2.实际诊断时金标准的测试结果是不是可靠。在使用金标准时必须按其条款进行，确保测试结果的可靠性，避

22、免产生偏倚。,（一）金标准应有可靠性,55,受试者分为病例组和对照组。均应按照按性别、年龄、身高、生理期、职业、地域等分层抽样，并且： 1.病例组：应包括各型病例，如典型和不典型病例，轻、中、重型病例，早、中、晚期病例，有、无并发症病例，经过治疗与未经过治疗的病例。病例组的来源：包括一般人群、特殊人群、普通门诊或专科门诊。2.对照组：包括健康人和有其他疾病的患者，特别是要有容易被混淆而需要鉴别的其他疾病病例。,（二）研究对象应有代表性与可比性,56,样本含量n的计算公式：总体率的估计值P：灵敏度或特异度。当P为灵敏度时，n为病例组例数；当P为特异度时，n为对照组例数。为允许误差（样本率总体率

23、），常取总体率可信区间间距的一半。为第一类错误（应该接受但被拒绝因而误诊或“弃真”）的概率是对应可信度为1的正态离差（正态分布的面积），查u值表，有单侧与双侧之分，一般取值0.05，单侧 1.64，双侧 1.96。,（三）样本含量应足够,57,例：测定血清肌酸激酶（CK）的阳性结果（200U/L）诊断急性心肌梗死（AMI），据初步试验资料，其灵敏度为 0.9，特异度为0.85，设定为0.05，为0.08，试估计所需样本含量。已知P1=0.9，P2=0.85，双侧1.96，0.08，按样本含量计算公式：因此，该诊断试验需要AMI病人54例，无AMI的对照组77例。,样本含量举例,58,1.三类

24、诊断指标要标准、具体：主观指标：如研究对象的主诉；半主观指标（或半客观指标）：如观察者看到的体征；客观指标：如用仪器测量的数据。2.诊断方法应标准、可靠：如方法与材料的详细描述，受试者是否需要限制饮食、禁用某药、试验前后的注意事项、有无副反应等，都要有具体的标准。同一操作者、其他医疗单位在相同条件下进行重复试验时结果都应相同，使诊断试验具有可靠性。,（四）诊断指标与方法应标准、具体、可靠,59,金标准与待评价诊断方法进行同步盲法测量比较。盲法：试验操作者不知道谁有某病，谁无某病；医生也不知道谁的结果阳性，谁的结果阴性。同步：同时间、同地区、同人群。,（五）金标准与诊断试验应同步盲法测量,60

25、,按受试者工作特征曲线的构建程序，一般先取多个临界值，计算评价指标如灵敏度或特异度等，再进行比较，选取假阴性和假阳性最少时的值确定为合理的临界值。,（六）临界值的选择应合理,61,实用性：该试验需用何种仪器、试剂，是否安全、方便、费用低廉，病人能否接受，对病人有无损害、有无毒副作用等。,（七）诊断试验应具有临床实用性,62,1.选择高患病率的人群来提高阳性预告值 Bayes公式：当诊断方法的敏感度与特异度不变时，阳性预告值随患病率（患病率、验前概率）的升高而变大。2.利用联合试验来提高诊断灵敏度或特异度联合试验：平行试验可提高诊断灵敏度，但降低了特异度；系列试验可提高诊断特异度，但降

26、低了灵敏度。,三、提高临床诊断效率的方法,63,平行试验与系列试验的区别,64,第四节受试者工作特征曲线,一、基本概念,以灵敏度为纵坐标、（1特异度）为横坐标，将相对应的各临界值连接起来的折线图，称为受试者工作特征曲线(receiver operating characteristic curve，ROC曲线)，简称受试者工作曲线。,65,二、ROC的构建,根据金标准诊断结果将诊断试验数据分段、设定各临界值、划分四格表，再计算各临界值下的真阳性率、假阳性率，最后绘制ROC曲线，计算曲线下面积（area under the curve，AUC）。,66,例1果糖胺（FTA）诊断糖尿病（DM）。收

27、集无糖尿病血清55例、有糖尿病血清74例，测定FTA含量。选取4个截断点（1.30、1.50、1.70、1.90mmol/L将FTA检测值分成5个部分：正常（1.30）、大致正常1.30，1.50）、可疑1.50，1.70）、大致异常1.70，1.90）和异常（1.90），评估患糖尿病的可能性。试做ROC曲线，计算AUC与标准误（SE）。,ROC曲线举例,67,果糖胺在4个临界值时的分类评价指标,68,以真阳性率（灵敏度）为纵坐标、假阳性率（1特异度）为横坐标，将相对应的各临界值（截断点）连接起来得到ROC曲线。,ROC曲线的绘制,69,AUC与标准误（SE）的计算,70,AUC的取值范围,A

28、UC的理论取值范围在1.0和0.5之间。在AUC0.5的情况下，AUC越接近于1，说明诊断效果越好。AUC在0.50.7时有较低准确性，AUC在0.70.9时有一定准确性，AUC在0.9以上时有较高准确性。AUC0.5时，说明诊断方法完全不起作用，无诊断价值。,71,AUC的判断,判断标准：AUC在0.9以上时有较高准确性。本例AUC 95的置信区间为： AUC 1.96SE0.96361.960.01470.9348，0.9924该区间大于0.9，表明果糖胺对糖尿病的诊断价值较高。,72,500名收入冠心病监护室的病人，在入院当天抽血作CK检查，CK结果分布见下表。医生在不知道CK结果的情

29、况下，根据心电图结果和临床报告，确诊300名病人患心肌梗死，其它200名无心肌梗死。,CK结果分布表,ROC曲线举例 2,73,试问：从定性上观察，CK活性与心肌梗死有何关系？从表中可以选定6个阈值：10U/L、180U/L、360U/L、540U/L、720U/L、900U/L，试列表计算前4个阈值的诊断敏感度、特异度及试验后诊断的可能性（PV、PV）；采用哪个阈值时诊断效果最好？,ROC曲线举例 2,74,CK越大，患心肌梗死的概率就越大。各个阈值下的计算结果见下表：,各阈值下的敏感度、特异度及预测值的计算结果,360U/L时，诊断敏感度、特异度都很高，诊断效果最好。,ROC曲线举例,7

30、5,三、受试者工作特征曲线的应用,1. ROC曲线的优点与缺点2. ROC曲线的应用,76,ROC曲线将灵敏度与特异度以图示方法结合在一起，可准确反映某分析方法二者的关系，是试验准确性的综合代表。方法简洁、直观，可用肉眼直接作出准确性判断。,ROC曲线的优点,77,ROC曲线图的缺点,ROC曲线图上显示的不是真正的判断值，实际的分界值通常没有在图上表示出来。研究分析对象的数目没有在图上表示出来。当样品数减少,图形呈锯状和崎岖不平,即使样品数目大,也可能是崎岖不平。画图和计算均比较繁琐。,78,选择合适的临界值：最靠近ROC曲线左上角的临界值时，其假阳性和假阴性的总数最少。比较两种或两种以上的诊

31、断试验对同种疾病诊断的可靠性：ROC曲线下面积（AUC）越大，说明该诊断试验性能越好。,ROC曲线的应用,79,例3根据血清铁蛋白对诊断贫血的有关数据，计算血清铁蛋白的诊断敏感度、诊断特异度、诊断准确度、阳性预测值、阴性预测值及流行率。,80,例4已知前列腺特异抗原（PSA）的诊断敏感度为70%，诊断特异度为90%，医生根据病史体检等估计该病人试验前诊断为前列腺癌的可能性为5%，试计算应用PSA检查，该病人试验后诊断患前列腺癌的可能性是多少？, 以病人数1000开始填写。已知试验前诊断患病可能性为5%，则10005%=50填入a+c处。按诊断敏感度和诊断特异度计算a、b、c、d。计算试验后诊断患病患病的可能性即阳性预测（+PV）。,81,复习题,1. 名词解释：临界值、医学决定水平、金标准、灵敏度、特异度、漏诊率、误诊率、阳性预测值、阴性预测值、阳性似然比、阴性似然比、 ROC曲线。2.如何确定参考范围？应用时应注意哪些问题？3.在设计和评价诊断试验时应注意哪些问题？4.何谓联合试验？简述其作用、分类和结果判断方法。5.简述ROC曲线的优点、缺点和主要作用。,谢谢大家！,谢谢大家！,中国医药科技出版社 2009.11,返回总目录,谢谢大家！,

展开阅读全文