《非诊断类医疗器械临床试验方案设计方案中相关统计学问题教学课件.ppt》由会员分享,可在线阅读,更多相关《非诊断类医疗器械临床试验方案设计方案中相关统计学问题教学课件.ppt(55页珍藏版)》请在三一办公上搜索。
1、2023/8/7,1,非诊断类医疗器械临床试验方案设计中相关统计学问题,北京大学临床研究所北京大学第一医院医学统计室姚晨,2023/8/7,2,医疗器械种类繁多,2023/8/7,3,医疗器械的分类与特点,不同用途的医疗器械产品-诊断检验(血糖、胆固醇检测仪)-监测(呼吸、心跳监测仪)-治疗器械(眼外科激光仪、心脏除颤仪、冠脉支架)-测量器械(核磁共振成像MRI、超频骨密度测量仪)-代替身体某一失效部分的植入器械(人造髋关节、膝关节、乳房假体、人工心脏瓣膜)国家对医疗器械实行分类注册管理。,2023/8/7,4,SFDA对医疗器械分类注册管理,境内第一类医疗器械由设区的市级(食品)药品监督管理
2、机构审查,批准后发给医疗器械注册证书。境内第二类医疗器械由省、自治区、直辖市(食品)药品监督管理部门审查,批准后发给医疗器械注册证书。境内第三类医疗器械由国家食品药品监督管理局审查,批准后发给医疗器械注册证书。境外医疗器械由国家食品药品监督管理局审查,批准后发给医疗器械注册证书。台湾、香港、澳门地区医疗器械的注册,除本办法另有规定外,参照境外医疗器械办理。,2023/8/7,5,医疗器械不同于药物,2023/8/7,6,药物与器械的不同点:研发,药物纯的分子化合物筛选发现,器械复杂的构造设计,2023/8/7,7,药物与器械的不同点:不良事件,药物药物相互作用错误用药/错误剂量,器械故障操作失
3、误,2023/8/7,8,医疗器械临床试验的目的,对申请注册的器械预期的“安全、有效”假设加以科学验证,而整个临床试验设计就是围绕着如何验证该假设而进行的。其一是确定在正常使用条件下,该设备的性能特征为制造商所预期的。其二是确定可能发生的不良反应,并在考虑到设备预期性能的基础上,评价这些不良反应是否构成风险。应该为确定设备上市后,产品说明书上所标示的适应症提供临床试验证据。,2023/8/7,9,有效的科学证据,生产厂商也许会提交任何证据,使审评部门确信他们器械的安全性和有效性而审评部门应要求进行具有良好对照的临床试验,来提供所需要的、合理的医疗器械安全性和有效性保证需要注意的是在审评部门没有
4、对已知器械作特殊的统计分析要求时研究中所有的统计分析都应该适合分析的目的,且要有全程证明文件,2023/8/7,10,临床试验完整过程,监查,CRF,统计与临床报告,批准与上市,录入数据 核查数据,2023/8/7,11,临床试验的特点和基本要求,临床试验作为一种以“人”为受试对象的实验研究,必须面对医学伦理学问题。临床试验方案应在得到伦理委员会(Ethics committee)的批准或准许后方可开始实施。知情同意(Informed consent),充分体现了对受试者尊严和自主权的尊重。临床试验的依从性好坏和“失访”病人的多少常常与临床试验设计关系密切,2023/8/7,12,临床试验设计
5、,临床试验:是在人体进行的、比较干预和对照疗效的前瞻性研究(Friedman et al.,1985)干预的含义很广泛,包括“预防、诊断、或治疗药物,医疗器械,以及治疗措施等等Hill(1967)给出的,“临床试验是一个精心设计的、符合伦理学原则的实验,其目的是回答某些精确设计的问题”临床试验是在人体的伦理学试验,因此需要知情同意书和伦理委员会(IRB/IEC)的批准,2023/8/7,13,一、随机对照临床试验方案设计的统计学要求,2023/8/7,14,1、临床试验人群的确定,确定医疗器械应用目标(总体)人群的相关研究(样本)人群。在研究开始之前,研究者首先应根据注册设备的特性和作用机理确
6、定该设备应用的适应症人群,并根据临床试验的特点和可能的影响因素,制定入选/排除标准,以确定本次临床试验的研究人群。这些标准除能够代表研究人群的特征外,还应该考虑可能临床效果评价的影响因素控制。,2023/8/7,15,某电生理射频消融导管临床试验,适应症人群:快速型室上性心动过速入选标准:临床症状及体表心电图怀疑房室结折返性心动过速(AVNRT)或房室折返性心动过速(AVRT)诊断患者;年龄在18岁以上,75岁以下(含75岁),性别不限;患者同意参与本临床试验并签署知情同意书。排除标准:心内附壁血栓或在前四周内进行过心室切开术或心房切开术的患者术中需要进行穿间隔,但是具有左心房血栓或粘液瘤或者
7、心房间隔膜补片的患者术中需要经主动脉逆行,但有主动脉瓣替换史的患者有明显出血倾向及血液系统疾病的患者。,2023/8/7,16,2、对照-有效性和安全性评价的基础,实验组 器械因素+非器械因素 器械效应+非器械效应,对照组(无)非器械因素(无)非器械效应,设立对照组的目的是排除“非器械因素”的影响,从而衬托出“器械因素”的作用,两组比较 器械因素 器械效应,空白治疗对照,同类器械对照,2023/8/7,17,临床试验设立对照意义,对照设置正确与否,关系到临床试验结论的正确性及结果的推广价值,因此,设立对照有着极其重要的意义:排除或控制疾病的自然变化。减少试验中非处理因素对试验结果的影响。达到相
8、互比较的目的。,2023/8/7,18,对照组的设置时必须具备三个条件,(1)专设:任何一个对照组都是为相应的试验组专门设立的。不得借用文献上的记载或以往研究的、其它研究的资料作为本研究之对照组。(2)同步:对照组与试验组设立之后,在整个研究进程中始终处于同一空间和同一时间。(3)对等:除处理因素外,对照组具备与试验组对等的一切因素。,2023/8/7,19,对照的类型-平行对照,最常见 对照为另一干预器械(无器械或安慰器械)将来自同一总体的受试者随机地分入各个组,各组受试者在试验中处于相同的条件,唯一的不同点是各个组所使用的器械不同,如有的是干预器械组,有的是对照器械组,最后根据试验结果作出
9、统计分析可以为干预器械设置一个或多个对照器械对照器械的选择应符合研究方案的要求,2023/8/7,20,平行组对照设计,试验组:疗前 疗后=差值 同质性比较 组间比较 对照组:疗前 疗后=差值,2023/8/7,21,很多统计学方法都是基于随机化理论的,随机化也为统计推断提供可靠的依据。随机化能使各处理组在基线时的影响预后因素(已知的和未知的)分布趋于相似。与盲法合用,随机化有助于避免在受试者的选择和分组时,因处理分配可预测性而导致可能的偏倚。,3、随机化临床试验的科学保证,2023/8/7,22,随机化分组要求,临床试验中可采用分层、区组(block)随机化方法。分层随机化有助于保持层内的均
10、衡性,特别在多中心临床试验中,中心就是一个分层因素。另外为了使各层趋于均衡,按照基线资料中的重要预后因素(如病症的严重程度)等进行分层,对促使层内的均衡安排是很有价值的。区组随机化有助于减少季节、疾病流行等因素对疗效的影响。区组太大可能造成组间基线不均衡,太小则可能造成分组的预测。,2023/8/7,23,随机分配表,当样本大小、分层因素及区组大小决定后,由生物统计学专业人员在计算机上使用统计软件产生随机分配表。临床试验的随机分配表就是用文件形式写出对受试者的处理安排,即处理(或在交叉试验中的处理顺序)的序列表。随机分配表必须有可以重新产生的能力。也即当产生随机数的初值、分层、区组决定后能使这
11、组随机数重新产生。,2023/8/7,24,治疗的方法,一般来说,试验用器械应根据生物统计学专业人员产生的随机分配表进行编码,以达到随机化的要求受试者应严格按照试验用器械编号的顺序入组,不得随意变动,否则会破坏随机化效果 病人顺序 随机号 1 001(治疗)2 002(治疗)3 003(对照).,2023/8/7,25,治疗的随机分配,一般来说,试验用器械应根据生物统计学专业人员产生的随机分配表进行编码,以达到随机化的要求受试者应严格按照试验用器械编号的顺序入组,不得随意变动,否则会破坏随机化效果 病人顺序 随机号 1 001(治疗)2 002(治疗)3 003(对照).,2023/8/7,2
12、6,4、盲法-减少临床试验偏倚的重要技术,目的 排除或减少来自研究者与受试者主观偏倚(Bias)的影响。方法 随机分配难以做到双盲,但研究者评价可以做到盲态下评价。原则 盲法思想应自始至终地贯彻于整个试验之中。,2023/8/7,27,非盲临床试验潜在的偏倚,假如受试者知道他们使用的是试验器械,受试者可能会报告有利的结果,因为他们期望得益于治疗,或者更有可能留在试验中。观察者可能不愿意鉴别和报告非治疗组的治疗反应,而对接受阳性器械治疗的患者的有利结果或不良事件更加敏感。了解治疗的分配情况可能影响试图获得试验或随访数据的积极性。了解治疗的分配情况可能会影响对病人是否应继续接受治疗、接受伴随用药或
13、其它辅助治疗的决定。了解治疗的分配情况可能对是否应将某一受试者的结果纳入分析产生影响。了解治疗的分配情况可能对选择统计分析方法产生影响。,2023/8/7,28,临床试验数据盲态下审核是指在完成数据核查、疑问解答结束,数据库关闭后直到揭盲前,对数据库数据再次进行的审核与评判。对双盲临床试验中的盲态进行审核。对数据中存在的需讨论的问题做出决定,重点在分析并决定统计分析人群。对数据的整体质量做出评估。讨论并定稿统计分析计划。决定是否锁定数据与揭盲。,盲态下的数据审核会议,2023/8/7,29,1、临床有效性评价:定义主要疗效指标和次要疗效指标。其中主要疗效指标将作为临床试验统计分析计划中的假设检
14、验基础。2、临床安全性评价:包括不良事件(AE)的记录和实验室检查,其中AE还需判断与药物的关系,对实验室检查应以各研究单位的正常参考范围对测定结果作出临床意义等判断。,5、治疗效应的评价-临床观察指标,2023/8/7,30,6、统计分析计划,样本量及检验功效的考虑研究人群的定义(FAS、PPS、SS)有效性分析1、主要疗效指标的定义1.1检验假设及第一类错误的规定1.2统计分析方法的简述1.3亚组分析的规定(若需要)2、次要疗效指标的统计分析方法安全性分析,2023/8/7,31,设计类型与检验假设:无效假设、备择假设终点指标类型及效应测量指标变异度(试验的质量)优效性、非劣性、等效性界值
15、临床上可接受的最大允许的范围I、II型错误水平(、)两组的例数分配比例其他因素:例如依从性、失访率等,决定样本含量估计的要素,2023/8/7,32,本研究按照检验某样本率是否能达到所期望的总体率估算样本量,采用单侧检验,=0.05、1-(把握度)=0.8,根据文献,异体肌腱移植的优良率约为75%。根据自体肌腱移植文献及临床讨论结果以60%为异体肌腱移植优良率达标下限,即异体移植优良率的95%可信区间低限不能低于60%。据此估算所需有效样本量为61例,优效试验,=0.05=0.20,=0.60=0.75,n=61,样本含量估计例1,2023/8/7,33,有关样本量估计的说明,用于估计样本含量
16、的指标应该是主要指标,而不是其它指标。在III期临床试验中,应依据主要疗效指标;在IV临床试验中应选主要安全性指标。样本含量是在“经验参数”的基础上估计的,这些参数可能是用预试验得到的,可能是文献资料,也可能是根据经验猜测的。因此,如果“经验参数”估计不准,根据统计学公式计算的样本含量也就不准了。样本含量估计给出的公式中,只考虑了统计学因素,而没有考虑非统计学因素。也就是说,如果存在非统计学因素的干扰,按估计的样本含量进行试验,可能达不到预期的效果。,2023/8/7,34,临床试验中统计分析的数据集(1),ITT原则(意向性分析原则、Intention-To-Treat Principle)
17、是指分析应保罗所有的随机化后的受试者,也即原计划好处理(治疗)的全部受试者都需进入分析,而不是根据实际上完成的受试者。按这种原则所作的分析是最好的分析,其结果是每一个随机分到试验组或对照组的受试者都应该完整地随访,记录研究结果如疗效、安全性评价,而不管他们的依从性如何。,2023/8/7,35,三种数据集的定义,全分析集(Full Analysis Set)FAS是指尽可能接近符合ITT原则的理想的受试者人群。它应包括几乎所有的随机化后的受试者。只有在导入期中被排除而入组或者入组后没有任何的随访数据才能从FAS人群中排除。符合方案集(Per Protocol Set)符合方案集是全分析集的一个
18、子集,在这个数据集中每位受试者是依从性良好,没有严重违背试验方案,主要指标的基线值完备。安全性数据集(Safety Analysis Set)应包括所有随机化后并至少接受一次治疗且至少有一次安全性评估的受试者,临床试验中统计分析的数据集(2),2023/8/7,36,不同数据集的作用,安全性分析应使用安全性分析人群全分析集:在很多临床试验中全分析集所得的结果是保守的,它常会对治疗效果作出保守的估计,但是这种估计更能反映器械正式上市后的实际疗效。符合方案集,必须强调符合方案,但是由于符合方案集来自剔除了一些受试者的全分析集,例如违背方案,依从性差的受试者需从符合方案中排除,这样做的结果易导致偏倚
19、,这种偏倚过高估计药物的疗效,造成比正式上市后的疗效偏大。,临床试验中统计分析的数据集(3),2023/8/7,37,二、非随机对照临床试验设计中的统计学考虑,2023/8/7,38,随机对照与非随机对照试验考虑,随机对照试验在医疗器械的研究中与临床实际情况存在着不一致性,导致难于执行,主要体现在以下几个方面:出于伦理学考虑,对于具有严重危害性的研究过程而言,采用安慰剂对照或假对照的研究往往难于执行。对照组的选择,有时需用药物对照或对照产品无法实施双盲,使得盲法执行遇到困难;有时没有同期对照只能进行历史对照,则无法进行随机化等。在受试者入选和治疗的整个的执行过程中都可能存在着潜在的不依从性,使
20、得选择性偏倚的问题不可避免。,2023/8/7,39,非随机对照试验的类型(1),同期对照的非随机研究在这种研究设计中,病人同时进入研究,但是没有进行随机化分组。这种设计的主要特点是试验和对照组人群的选择往往具有一定的倾向性。病人被分入不同组别通常会受到病人基线特征和具有的危险因素的影响。非同期对照,部分同期对照非随机研究在这种研究设计中,对照组中有部分或者全部病例是在入组前就进行过干预了,所以他们具有回顾性研究的若干特点,常见的如历史对照研究。,2023/8/7,40,非随机对照试验的类型(2),没有对照的非随机研究 在这种研究设计中,通过将试验组的单组研究结果和从研究外的调查和信息中获得的
21、参照研究结果进行比较来进行试验组疗效的判断,例如通过临床积累的经验或通过系统性研究所得到的研究结果作为参照(目标值OPC)。在此参照的基础上需综合考虑操作者水平,目前对该试验结果的期望等因素制定适当的参考值。,2023/8/7,41,非随机对照试验存在的缺陷,有同期对照的非随机研究该类研究的最大问题主要在于不能进行随机分配而导致的组间的不可比性。没有同期对照或半同期对照非随机研究该类研究除了具有同期非随机对照的问题,病人的选择方法和现况偏倚问题也应该给予充分的重视。没有对照组的非随机研究这种研究获得被比较参考值的过程具有如下问题,如何选择评价人群,提供目标值的研究和信息的不确定性和不可比性等,
22、2023/8/7,42,非随机对照试验设计注意的问题,制定适当的入选排除标准,对研究对象的选择条件加以控制。对于非同期对照,尤其要明确指出对照组的选择依据,避免因为已知参照组结果而造成的偏倚。对可能干扰研究结果的协变量和影响因素进行收集,对于重要的研究因素在研究开始前就应该有适当的定义和收集方式。尽可能的采用盲法并保证实施过程的质量。样本量的适当估计对于无对照组试验,目标值的选取一定要有足够的依据,一般在已有的试验参照结果或长期积累的临床经验基础上,经专家团队结合技术更新、操作人员水平、目前临床上的期望等方面的综合考虑所得出的行业内认可标准。,2023/8/7,43,非随机对照试验统计学分析应
23、注意的问题,组间不可比性问题 分析时要注意对基线协变量和可能影响研究结果的因素进行组间比较,并采用适当的方法进行不可比因素的调整,如分层分析、匹配、多元分析模型、倾向性得分(PS)分析等方法。但收集哪些数据在试验前应该很好的被设定,否则将会缺乏需分析的因素。研究因素的共线性问题 当进行多元分析时,所采用的协变量和影响因素越多,则越可能受到共线性问题的困扰,虽然有一些可以处理共线性问题的规则,但是仍会经常面临指标的取舍难于抉择的问题。此时倾向性得分法等可以尝试用于该类数据的分析。缺失数据问题,2023/8/7,44,三、正确理解临床试验中的检验假设与统计推断结论,2023/8/7,45,临床试验
24、应根据研究目的和设计对总体参数作出合理的检验假设,统计学假设检验的假设有两种:1)检验假设 亦称无效假设(null Hypothesis)记为H0;2)备择假设(alternative hypothesis)记为H1 二者都是根据研究目的提出的对总体参数或分布特征的假设。H0是从反证法的思想提出的,H1是和H0相联系的,对立的假设。,2023/8/7,46,假设检验与两类错误,推论结果,拒绝,不拒绝,假设,真实,错误,功效 1-,假设被告无罪(犯罪嫌疑人),原告辩护律师获胜,2023/8/7,47,假设检验与两类错误,=第 I 类错误(假阳性)当Ho 是真实时,拒绝 Ho 的概率(临床试验中通
25、常也称消费者风险)=第 II 类错误(假阴性)当Ho 是不真实时,不拒绝 Ho 的概率(临床试验中通常也称研究者/器械研发者风险),2023/8/7,48,假阳性率/第I类错误,从哪来?(可能来源)关切研究干预在研究设计、临床观察有偏倚 关切临床研究采用不恰当的数据管理与统计分析方法。谁来控制?控制水平?政府(SFDA),杂志/出版物编辑,消费者协会.通常可接受的水平 5%,2023/8/7,49,当检验假设(Ho),在充足证据下被拒绝时,1).用P值来衡量充足的证据p-值(即 有统计学意义水平)单纯由于机会导致此结果发生的可能性(不是 假设的可能性).每个 p-值 均是用特定的统计方法计算.
26、很小的 p-值(e.g.0.001)假阳性可能性很小 消费者的风险更小 不支持 Ho 支持(临床)Ha.,2023/8/7,50,P-值是在无效假设(Ho)成立前提下,所计算的概率,而不是 Ho的概率,不拒绝无差别的假设(Ho)(i.e.,较大的 p-值)并不意味能证实 Ho 是可能正确的.无统计学意义的结果可能是由于试验设计不周,试验管理混乱,效应评价不公,试验样本量较小,依从性差,统计分析方法应用不当等。不能依此(P0.05)作为“等效”的证据。,2023/8/7,51,影响检验功效的因素,客观上差异越大,检验功效越大(试验药与对照药在主要疗效指标的差异)个体间变异越小,检验功效越大(临床
27、试验的质量控制,主要疗效指标的变异)样本量越大,检验功效越大 第 I类错误的概率越大,检验功效越大,2023/8/7,52,优效性试验设计举例研究目的:评价试验器械治疗原发性高血压患者的有效性,优效性设计:短期(12 wks)随机双盲,安慰器械平行对照 临床假设:试验器械降低舒张压比安慰器械更明显(有临床意义,比安慰器械至少多降5mmHg),转化为统计假设:比较两组舒张压变化均数(相对基线变化).无效假设(Ho):两组舒张压变化均数(相对基线变化)相同 备择假设(Ha):两组舒张压变化均数 不同临床有意义界值:差别 5 mm Hg,2023/8/7,53,非劣效性试验设计举例研究目的:评价试验
28、器械治疗原发性高血压患者的有效性,非劣效效性设计:短期(12 wks)随机双盲、阳性器械平行对照 临床假设:试验器械降低舒张压的效果与阳性对照器械相比相当(有临床意义的界值,不比阳性器械差2mmHg),转化为统计假设:比较两组舒张压变化均数(相对基线变化).无效假设(Ho):试验器械组的舒张压变化均数(相对基线变化)比阳性对照器械差2mmHg以上。备择假设(Ha):两组舒张压变化均数 比阳性对照药差小于2mmHg。临床有意义界值:非劣效标准 2mm Hg,2023/8/7,54,统计推断时应注意的几个问题,1、重视实验研究的随机抽样(或分组)2、正确理解假设检验中P值的统计学意 义。3、注意“统计学意义”与“医学/临床/生 物学意义”的关系。4、结合两种统计推断结果讨论医学研究 结论。,2023/8/7,55,请提宝贵意见谢谢!,Thanks,Tel:13801378685(姚晨)Email:,