《医学科研设计的基本原则.docx》由会员分享,可在线阅读,更多相关《医学科研设计的基本原则.docx(41页珍藏版)》请在三一办公上搜索。
1、医学科研设计的基本原则第三章 医学科研设计的基本原则 医学科研设计是指对某一项医学研究的具体内容和方法的安排。作为科学研究,生物医学研究探索生物医学领域内未知事物和未知规律的科学活动,必须有科学的研究方法和合理的设计才能获得真实、可靠的研究结果。以人为主要研究对象的生物医学研究,由于研究对象的复杂性和特殊性,影响研究效应的因素很多、许多因素无法完全消除,因此对研究设计的要求就更高。如果研究设计存在缺陷,就可能影响研究结果的可靠性和研究价值。另一方面,还要考虑研究对象的数量,样本量过少或过多都会对研究结果造成影响。一个缜密而完善的研究设计,能合理地安排各种研究因素,严格控制各种误差,用较少的人力
2、、物力和时间,最大限度地获得足够而可靠的资料。合理的研究设计是顺利开展各种医学研究的前提条件,也是得到预期结果、达到事半功倍的保证。为了达到上述目的,在医学研究设计中必须遵循四项基本原则:随机化原则、对照原则、盲法原则和重复原则。 第一节 随机化原则 随机化的核心是机会均等。随机化是医学研究中一项非常重要的原则。在医学研究中,随机化包括两方面的内容:随机化抽样和随机化分组。通过随机化选择研究对象,可以得到一个有代表性的样本。当存在未知或不可控制的非处理因素时,随机化分组将研究对象随机分配到实验组和对照组之中,使这些非处理因素在实验组和对照组的分布一致。因此,随机化是实验性研究中保证组间均衡、可
3、比的重要手段。 一、随机化抽样 随机化抽样是指总体或目标人群中的每一个个体都有相同机会被抽中作为研究对象。在医学研究中,由于时间、人力、物力限制,通常不能把所有目标人群都作为研究对象,而只能选取其中一部分作为研究对象。对一组研究对象进行调查或实验,获得原始数据,经过数据整理和统计分析得到样本信息,并以样本的信息来推断总体人群的特征。要实现这一推断的前提条件是所采用的研究对象要有代表性,即能代表目标人群。否则,就不能实现这一推断。获得一个有代表性样本的常用方法是采用随机化抽样来选择研究对象,即目标人群中每一个个体被选中的概率相等。这样获得的样本称为随机样本。“随机”不等于“随意”或“随便”。医学
4、研究一般都1 需要推论,因此都需要采用随机化抽样的方法选择一组有代表性的研究对象。随机化抽样也是数据能统计分析和推断的前提。社会学、新闻传播学常用典型调查,其调查结果反映一部分的特征,不能推论到普通人群。 二、随机化抽样的常用方法 在医学研究中常见的随机化抽样方法有单纯随机化抽样、系统随机化抽样、分层随机化抽样、整群随机化抽样以及多阶段抽样随机化方法。 (一) 单纯随机化抽样 也称为简单随机化抽样,一种最简单、最基本的抽样方法。其基本原理是从总体N个对象中,采用随机方法抽取n个,构成一个样本。它的重要原则是总体中每个对象被抽到的概率相等。常见的随机方法有抽签或抓阄、掷骰子、掷硬币等;比较科学又
5、方便的方法是用随机数字。随机数字表是根据概率论的原理编制的一种统计表,是获得随机数字的常用工具,见表3-1。使用时是首先随机地确定所用表的起始行数、列数,然后逐行、逐列按次序连续选取若干随机数,其结果比抽签方法更理想。 表3-1 随机数字表 利用计算机数据库软件中的随机函数)和取整函数(INT)可以产生任意位数的随机数字。例如利用公式INT100)+1可以产生1100之间的随机数字。 利用随机数字进行单纯随机抽样的基本步骤如下: 1. 确定目标人群的特征; 2. 将目标人群中的每个个体编号、排序; 3. 给每个个体分配一个随机数字; 4. 预先确定选择研究对象的方法。如欲抽取50%的人群作为样
6、本,则可以按照随机数字是偶数或奇数还确定;如欲选择1/3的人群,则可以把随机数字除以3后根据余数的情况选择;也可以根据随机数字的大小; 5. 根据随机数字选择研究对象。 单纯抽样方法适合在总体单位数不大,各个单位之间变异较小的情况下经常采用的抽样2 方法。如总体数量大时,必须有所有单位的名单、编号,抽样过程比较麻烦。被抽到的个体比较分散,资料收集困难,可行性不大。如总体变异大,即使采用单纯随机抽样,获得样本的代表性也不一定好。 单纯随机抽样的标准误按资料性质可用公式3-1和3-2计算。 均数的标准误: ns2=(1-) NnSX率的标准误: Sp=(1-np(1-p)Nn-1上式中s为样本标准
7、差,p为样本率,N为总体含量,n为样本含量,其中n/N为抽样比,若小于5%可以忽略不计。 (二) 系统随机化抽样 也称为机械抽样或等距抽样。它是指按照总体一定顺序,机械地每隔若干单位抽取一个研究对象组成样本的方法。 图3-1 系统抽样示意图 采用系统抽样的基本步骤如下: 1. 确定目标人群的特征。 2. 将目标人群中的每个个体排序、编号,如从1N相继编号。 3. 确定抽样间隔:K=N/n。式中N为总体单位总数,n为样本含量;根据抽样间隔,把总体依次分成k组。 4. 在第一组人群中,用随机抽样方法抽取个体i作为研究对象。然后依次加上K作为下一组的样本号,即第j组内的被抽中的样本号为:i+K。以此
8、来确定所有的样本。 系统抽样优点:事先不需知道总体内的单位数;容易在人群现场进行抽样,特别是总体人数比较多时,也容易进行;所得到的样本是从均匀分布在总体各个部分,一般代表性较好。 3 系统抽样的缺点:假如总体各单位的分布呈周期性趋势,而抽样间隔刚好是其周期的倍数,则可能使样本产生很大的偏性。 系统抽样标准误的计算可用单纯随机抽样公式代替。 (三) 分层抽样 如果一个总体中各个单位间的变异比较大,那么采用单纯随机抽样的方法获得样本的代表性并不很好。对这样的总体进行抽样,可以采用分层抽样的方法。先把总体按某种特征分为若干层,然后分别从每一层内进行单纯随机抽样,组成一个样本,见图3-2。 图3-2
9、分层抽样示意图 通过分层,把内部变异很大的总体分成一些内部变异较小的层。每一层内个体变异越小越好,而层间变异则越大越好。分层可以提高总体指标估计值的精确度,比单纯随机抽样所得到的结果准确性更高,能保证总体中每一个层都有个体被抽到。分层调查除了能估计总体的参数值,还可以分别估计各个层内的情况。 如果各层内的样本数ni按各层单位数的比例分配,即: n i=nNiN 式3-3中n为总样本数,N为总体单位数,Ni为各层内单位数,这种设计称为按比例分配的分层抽样。其标准误的计算公式如下: 均数的标准误: Sx=(1-率的标准误: n1)(2)Si2niNnSp=n(1-)nipi(1-2Nni-1n12
10、pi)4 若各层内样本数ni按下列公式计算: 率的抽样: Nipiqini=nNipiqi均数抽样: ni=nNisiNsii上两式中i为总体第i层的标准差;pi为总体第i层的率,qi=1-pi。 在这种情况下所获得的样本均数或样本率的方差最小,称为最优分配的分层抽样,其抽样误的计算公式如下: 均数的标准误: 1Sx=NN2i(1-ni)(si)Nini 2率的标准误: 1NSp=Ni2(1-ni)pi(1-pi)Nini-1 (四) 整群抽样 采用单纯随机抽样等方法获得的研究对象可能包含在总体中的每一个部分。虽然这种调查覆盖面较大,但是,调查所花的人力、物力将很大,在现场也不容易组织实施。如
11、先将总体分成若干群组,以这些群组为基本单位,随机抽取部分群组作为观察单位组成样本,这种抽样方法称为整群抽样。如被抽到群组中每一个个体都作为研究对象,称为单纯整群抽样。若对被抽到群组再采用随机的方法选择部分个体组成研究对象,称为二阶段抽样。 整群抽样的特点:容易组织与实施,节省人力、物力;群间差异越小,抽取群5 数越多,代表性越好;与单纯随机抽样相比,抽样误差较大。因此,整群抽样调查的样本量比其他方法要增加1/2左右。 整群抽样设计要求各群组之间的变异不能太大,否则抽样误差比较大。 (五) 多级抽样 在大型流行病学调查中,常常将上面几种抽样方法综合使用。如先从总体中抽取范围较大的单元,称为一级抽
12、样单位,再从每个抽中的一级单元中抽取范围较小的二级单元,最后抽取其中部分范围更小的单元作为调查单位,见图3-3。 每个阶段的抽样可以采用单纯随机抽样、系统抽样或其他抽样方法。多级抽样可以充分利用各种抽样方法的优势,克服各自的不足,并能节省人力、物力。 图3-3 多级抽样示意图 三、随机化分组的常用方法 在实验性研究中,除了干预因素外,实验组和对照组在非研究因素的分布上一致,这样才能消除这些因素对实验结果的影响。通过随机化分组,可以获得有均衡性的实验组和对照组。常用的随机分组方法有完全随机化分组、区组随机化分组、分层随机化分组和整群随机化分组等。 (一) 完全随机化分组 完全随机化就是用抽签或随
13、机化数字表等方法直接对实验单位进行随机化分组,分组后各组实验单位的个数可以相同也可以不同。若为小样本资料,当组间个体数目差异较大时,需重新随机分组,直至两组样本含量相近为止。完全随机化简单易行,是实施其他随机分组方法的基础,但样本含量较大时,工作量较大,不易实施。 完全随机化的基本步骤如下: 1. 将每个研究对象排序; 2. 给每个对象分配一个随机数字,随机数可从随机数字表或随机函数获得; 6 3. 事先确定分组的方法。如根据随机数字的单、双数分成二组;把随机数字除以3后的余数分成三组。 4. 根据随机数字进行分组。 例3-1:将12只小白鼠用完全随机化的方法分成3组。 1. 将12只小鼠依次
14、编号112; 2. 从随机数字表中的任一行任一列开始,如第四行第一列开始,依次读取两位随机数分配给每只小鼠; 3. 将随机数字除以3后记录余数。并规定余数为0为B组,1为C组,2为A组; 4. 根据余数和选择方法,确定各小鼠的分组。 分组结果见表3-2。 (二) 配对设计 配对设计是将受试对象按某些特征或条件配成对子,然后分别把每对中的两个受试对象随机分配到实验组与对照组。这种设计的优点是能缩小受试对象间的个体差异,从而减少实验误差,提高实验效率。受试对象配对的特征或条件,主要是指年龄、性别、体重、环境条件等非实验因素。 在医学研究中,用同一受试对象作比较,称为同体比较或自身对照。例如同一组病
15、人用某药治疗前后某项指标的比较;同一批受试对象施加某种处理因素后不同部位或不同器官变化情况的比较,如左眼与右眼,左手与右手的比较;同一批受检样品施以不同检测方法或培养方法所得结果的比较。这些设计方法也属于配对实验。 (三) 区组随机化 区组随机化是配对设计的扩大。配对设计是将多方面条件近似的受试对象配成对子。区组随机化设计是将非研究因素分布相同或相近的受试对象组成区组或配伍组。每个区组内受试对象数目取决于处理因素水平数。各区组间的受试对象不仅数目相等,而且生物学特点也较均衡;区组随机化设计缩小了组间差别,提高了实验效率。 例3-2:将12只小鼠,按区组设计要求,分成3个处理组。分组步骤如下:
16、7 表3-2 完全随机化分组方法 1. 将12只小鼠按照性别相同、体重相近的原则分成4个区组,每个区组内有3只小鼠; 2. 给每一只小鼠分配一个随机数字; 3. 在每个区组内,根据随机数字的大小分至甲、乙、丙3组中; 分组结果见表3-3。 (四) 分层随机化 当研究对象变异较大,如按照完全随机化的方法进行分组,比较各组间某些混杂因素如年龄、性别等可能分布不均。如按影响研究对象变异最大的因素如年龄、性别、种族、文化程度、居住条件等进行分层,在每层内分别随机地把研究对象分配到不同组间,这种方法称为分层随机化分组。分层设计可以更好地保证各处理组间达到良好的均衡性,提高检验效率。分层随机化的基本步骤如
17、下: 1. 根据研究对象的某个非处理因素对样本进行分层; 2. 在每一层内进行随机化分组分成实验组和对照组; 3. 各层实验组的研究对象组成实验组,对照组的研究对象组成对照组,见图3-4。 图3-4 分层随机化分组示意图 (五) 整群随机化 按社区或一群组为单位分配,即以居民区、班级、村庄、医院、家庭等为单位进行随机分组、不直接涉及区组内的研究对象。例如,把10个班的大学生,以班级为单位随机分成2组,见图3-5。 图3-5 整群随机化分组示意图 表3-3 随机区组分组方法 该方法容易实施,可以节约人力、物力,适用于大规模调查和研究,但抽样误差较大。实施整群随机化分组要求各群组内变异较小、同质性
18、要高。 第二节 对照的原则 8 有比较才有鉴别。在医学研究中,除了有研究因素或接受处理因素的暴露组或实验组外,还同时设立对照组。对照组是除了不接受实验组的干预措施外,其他非研究因素的分布与实验组完全一致的研究对象。通过与对照组的比较,才能评价研究因素的作用,并消除其它的非研究因素的影响。 一、设立对照的意义 与其它自然科学相比,生物医学研究更具复杂性。除了研究因素与研究效应有关外,还有其它许多非研究因素影响研究结果。这些因素可以分为: 1 不能预知结局的因素 个体的人口学特征和其他生物学因素如年龄、性别、职业、饮食、营养、免疫、精神心理、种族、遗传因素等。由于这些因素的存在,导致在同样的暴露因
19、素或同一干预因素的作用下,研究结局有差别。研究对象产生的研究效应是包括研究因素和众多的非研究因素共同作用的结果。对于自限性疾病,即使不经特异的治疗,也会好转或痊愈。如果不消除这些因素的影响,很难分析研究因素的真实效应。 2 霍桑效应 (Hawthorne Effect) 是指研究对象由于成为研究中受注意的目标而改变其行为并产生一定的效应,这些效应与所接受的干预因素无关。如对医院或医生的信任,对治疗产生有利效应。反之,如果不信任,则对治疗会产生不利的效应。 3 安慰剂效应 安慰剂是指不具有特异性治疗或致病效应的制剂,与干预药物在外形、颜色、气味、味道等方面没有差别。使用安慰剂作为对照的措施,要注
20、意安慰剂效应。安慰剂效应是指由于安慰剂的使用,产生的一些非特异效应,包括类似于干预因素的效应。 要消除这些非研究因素的影响,把研究因素的真实效应表现出来,必须设立对照。 实验组:F+FF+F11+F12+F1nE1 对照组:01+F02+F0nE2 F因素的真实效应 D=- EE1E2上式成立的前提条件:F11=F01,F12=F02,F1n=F0n 即对照组的研究对象,除了研究因素之外,其它非研究因素的分布与实验组一致,即实9 验组和对照组在主要非研究因素上具有均衡性。有均衡性,才有可比性,这种对照称为有效的对照。只有正确设立对照,才能把处理因素的效应充分暴露出来,平衡非处理因素对试验结果的
21、影响,有效控制各种混杂因素。均衡性也是研究设计中的一项基本要求,在有些论著中把它独立于对照,作为一项医学研究设计的基本原则。通过对实验组和对照组的研究效应进行比较,反映研究因素真实的效应和效果。在医学科研中,尤其是对一些效应随季节变化、自限性疾病、或以主观感觉或心理效应作为主要观察指标的研究时,必须设立严格的对照。例如20世纪XX年代出现的卤碱疗法、鸡血疗法等,都没有严格设计对照,虽轰动一时,最终却造成了许多不良影响。 二、常见的对照形式 (一) 空白对照 即无干预措施,对照组不加任何处理措施。常用于干预试验疗效研究,以评定测量方法的准确性,观察实验是否处于正常状态,也可排除自然因素或自愈因素
22、对试验结果的影响。如观察某种新疫苗预防某种传染病的效果,实验组儿童接种该疫苗,对照组儿童不接种任何免疫制品,最后比较两组的血清学和流行病学指标。在对感冒、皮炎等有自愈倾向的疾病进行防治效果研究时,空白对照可以很好地说明疾病的痊愈是防治的效果还是自然痊愈。 空白对照的缺点是由于不给予患者任何治疗措施,在一些疾病的治疗试验中可能会违背医学伦理原则。此外,由于不能实施盲法观察,故无法排除心理因素对结果的影响。 (二) 安慰剂对照 对照组给予安慰剂。安慰剂是一种在外形与实验药物完全相同,但又不具有特异有效成分的制剂。常用乳糖、淀粉和生理盐水制成。使用安慰剂对照主要是为了避免心理因素对试验结果的影响;也
23、可消除疾病自然进程的影响,观察到试验药物的真正作用。考虑到伦理学原则,安慰剂对照一般用于所研究的疾病尚无有效的防治药物或使用后不会影响到对照组研究对象的健康。同时,应用这一对照,要注意安慰剂效应的影响。 (三) 实验对照 为了有效地控制影响试验结果的非研究因素,仅采用空白对照是不够的,此时可以使用实验对照,即对照组的操作条件与实验组一致。例如青霉素过敏试验,以青霉素溶媒为实验10 对照,可排除由溶媒引起的过敏反应。再如观察某中药预防学生流感的效果,试验组服用该中药,同时每天进行教室的消毒、换气;对照组不服用该中药,但和试验组一样每天进行教室的消毒、换气。 (四) 标准对照 在临床试验中,考虑到
24、要保护对照组人群的健康不受损害,有时不宜设立安慰剂对照或空白对照。这种情况下,可以采用目前公认有效的药物或治疗方法作为对照组的措施,即标准对照。采用标准对照,一方面可以起到比较的作用,即消除非研究因素对研究效应的影响。另一方面,也能保护对照组人群的健康,不违背医学伦理学原则。 (五) 自身对照 自身对照是指对照和实验在同一研究对象中进行。研究对象在前、后两个阶段,分别使用两种不同的干预措施,比较干预的效果,或者某种方法治疗前、后的比较。自身前后对照设计简单,但其运用前提是如果不给这些研究对象如病人以有效的治疗药物,其效应指标如病情将保持稳定不变。对于自限性疾病如流行性感冒、甲型病毒性肝炎等,不
25、宜设置自身对照。 自身对照还有一种形式是同一个人不同部位、器官的比较,如左、右眼睛,左手与右手。 (六) 历史对照 用过去研究的结果作为对照称为历史对照。历史对照不是同期对照,由于时间不同,试验条件不同,往往缺乏可比性,一般不建议使用。 此外,还有交叉对照、潜在对照等,在此不一一赘述。 第三节 盲法原则 在科研设计中,研究对象和研究者的主观因素往往会影响到研究信息的真实性,产生信息偏倚。这种偏倚可产生于设计到结果分析的任一环节。如在临床试验设计中,患者的心理因素和医务工作者的主观判断都可能干扰试验结果,产生偏倚。采用盲法试验可避免这种偏倚。所谓盲法,是指参加试验的研究者或受试者一方或/和双方都
26、不知道试验对象被分配在哪一组,接受的是试验措施还是对照措施。盲法可以有效避免受试者或试验者的偏倚和主观偏见。根据盲法设置程度不同,一般可以分为公开试验、单盲、双盲和三盲试验。 11 一、公开试验 公开试验与盲法相对应,试验在公开状况下进行。研究对象和研究者均知道每个研究对象的分组情况。有些实验无法采用盲法观察,如评价某疾病手术、饮食和其它公共卫生措施的效果。公开试验适用于有客观观察指标的试验,例如以客观的疾病或健康指标为评价效果的观察或改变生活习惯的干预措施等。 二、单盲法 研究中只对研究对象设盲。如在新药试验中,患者不知道自己的分组情况和具体的用药情况,而参加试验的医护人员知道。该设计方法简
27、单,易操作,可以消除受试者的心理因素影响,同时研究者可以较好地观察研究对象接受不同处理措施后的效果,及时处理治疗中可能发生的问题,保障研究对象安全。缺点是在获得和分析各种研究资料如结局的判断时,可能受到研究者的主观因素影响而产生偏倚。如,因为了解了研究对象的分组情况,医务人员在判断疗效时对治疗组和对照组病人采用不同的标准,或因为对照组没有得到治疗而有意无意地给对照组补偿性治疗等。 实施单盲时,对照组需使用安慰剂。当安慰剂不利于患者病情时,可使用标准药物。 三、双盲法 研究设计者安排和控制整个试验,研究对象和给予干预或结局评估的研究人员均不了解试验分组情况。双盲观察可以避免研究者和研究对象的主观
28、因素影响带来的偏倚,提高研究的真实性。如在临床试验中患者和执行医疗措施的医务人员均不知道患者接受何种治疗,可使医生在检查、询问患者时一视同仁,不带主观偏见。该法的缺点是操作难度大,出现意外很难及时处理,因此不适用于治疗过程中疗效变化大的试验和危重病人的治疗。 双盲设计要求有一整套完善的代号,如全部受试者、相关记录、使用的药物或安慰剂以及化验单都要使用代码。保密是双盲设计的关键,试验结束前盲底泄露或退出试验的研究对象超过20%,则双盲试验失败。另外应预先制定一些观察指标,以明确停药或更换药物的指征。在盲法实施过程中要注意避免出现违背医德的现象。当研究对象出现严重的副反应、治疗无效或病情加重时,应
29、中止盲法,给予相应的处理。 四、三盲法 研究对象、给予干预或结局评估的研究人员以及负责资料收集和分析的人员均不了解试验分组情况。该方法可避免资料分析人员带来的偏倚,设计更为合理,但方法复杂,实际操12 作困难。 总的来说,盲法观察适用于疗效评价依赖于患者或医生的药物试验,可根据研究情况具体选择方法。例如,主要根据患者的主诉来决定药效的试验可用单盲法;主要由医生主观判断决定药效的试验须用双盲法。当然,并不是所有的临床研究都需要或能够采用盲法设计。例如比较手术疗法与放射疗法治疗乳腺癌的效果,就不必、也无法采用盲法。在观察性研究中,盲法观察的原则要求我们在收集资料时,对每个研究对象采用同样的方法收集
30、资料、给予同等程度的重视;或者在资料收集时,调查员不知道所调查对象的分组情况,以客观收集资料。 第四节 重复原则 重复是指在相同条件下进行多次观察或多次研究以提高科研的科学性和可靠性。广义的重复包括样本数量的重复、观察次数的重复和研究结果的重复。狭义的重复即样本数量的重复。观察次数重复指的是对同一试验对象进行多次观察或测量,以提高观测结果的精确性。一般要求对某项指标至少观测三次。研究结果的重复即重复实验以验证相同条件下结果的重现性,保证结果的可靠性。无法重现的研究是没有科学意义的。样本数量的重复就是对多个试验对象进行观察,防止把偶然现象当成必然现象,把个别情况当成普遍情况,甚至错误地推广到总体
31、。在本节中讨论的重复主要指样本含量。 重复的意义在于控制抽样误差,保证结果的可靠性。通过试验对象内部的重复,可以总结总体内部的变异规律,估计抽样误差的大小。根据统计学的原理,样本的抽样误差,即标准误可以通过下列公式计算: 计量资料: sx=s/n计数资料: sp=p(1-p)/n从以上两式可以看出,抽样误差与样本含量开平方根成反比。样本量越大,抽样误差越小。样本含量越小,抽样误差就越大。因此,为了能够精确估计总体的参数,需要有足够13 的样本含量。 另一方面,对于两组或多组的比较,样本含量与第二类错误发生的概率有关。样本含量太少,导致检验的效能降低,而使两组之间差别的检出能力比较低,可能出现假
32、阴性的错误。因此,一般要求检验效能应在0.75以上。 一、样本含量估计 重复设计的前提是有适量的样本。确定样本含量的原则是:在保证研究结论具有一定可靠性的前提下,确定最小的样本例数。样本过小,检验效能较低,易致假阴性错误,导致研究无法做出明确的结论。但是,并不是说样本含量越大越好。样本太大,将加大试验规模,延长试验时间,造成人力、物力和财力的浪费;另一方面,也难以严格控制试验条件,增大系统误差,无法保证研究质量。因此,适当的估计样本含量非常重要。 影响样本含量的因素: 容许误差:即在进行参数检验时希望发现的两个总体参数之间的最小差异。当容许误差为时,在检验水准得出有差别结论的把握度为1。越大,
33、所需样本量越小。 检验水准:即第一类错误的概率。越小,所需样本量越多。一般取0.05。 检验效能1:即检验把握度。越小,则检验效能越高,所需样本量越多。一般要求1-大于0.75。 总体标准差或总体概率:反映定量资料的变异度。越小,所需样本量越小。总体概率越接近0.5,则所需样本量越少。无法得到总体参数时,可用样本统计量代替。也可以根据同类研究结果、文献资料或预实验获得。 单、双侧检验:根据专业知识,确定采用单侧还是双侧检验。 研究效应:研究因素的生物学效应,如OR值、RR值或干预措施实施前后效应的差值。研究因素的效应越大,所需的样本含量越小。 样本估计的方法主要有经验法、查表法和计算法。 (一
34、) 经验法 动物实验一般每组530只动物,小动物可适当多些,大动物可少些。临床试验可根据干预措施效果来决定:如果一种治疗可降低5的死亡率,则需要上万人的研14 究;如果治疗效果远大于5,则几百人的研究就可以了;如果某种病的病死率为100%,那么治愈一个病例就足以说明治疗效果。通常来说,一般疾病每组需50200个病例,危重病可少些。社区试验所需例数较多,一般每组需在100例以上。 (二) 公式计算法 根据研究设计的方法和一些已知的条件,可以根据公式来估计样本含量。下面是几种常见的医学研究设计的样本含量估计 1. 抽样调查的样本估计 均数调查的样本含量估计公式: Zsn=a d2nn=1+nN 率
35、调查的样本含量: 2ZaPQn=d2当0.05,Z1.962,d=0.1P,则可以简化为下式 n=400QP 上述公式、适用于符合二项分布的率的抽样调查。对于发病率或患病率很低的疾病如肿瘤,应采用泊松分布法估计样本含量。 2. 样本均数与已知总体均数比较的样本含量估计: (Za+Zb)sn= d2式3-19中n为所需样本含量;为总体标准差,当未知时,用样本标准差s代替;为容许差值;u和u分别为与检验水准和第二类错误概率相对应的Z值,有单、双15 侧之分,只取单侧。 例3-3:用某药治疗矽肺患者,估计可增加尿矽排出量,其标准差为25mg/L,若要求以0.05,10.9的概率,能辨别出尿矽排出量平
36、均增加10mg/L,则需要多少例矽肺病人做试验? 已知10,s25,单侧0.05,Z0.051.645;0.1,Z0.011.282。代入公式得 2n=(1.645+1.282)2510=53.554 故需治疗54例矽肺病人。 3. 两样本均数比较的样本含量估计: n(Z 2 a+Zb)s1=n2=2d 式中n1、n2分别为两样本所需含量;为两总体均数之差;为总体标准差;Z和Z意义同上。 例3-4:甲、乙两种药物都有降压作用,比较分别服用两种药物患者的平均血压降低。假设两药效果的标准差相等。试问在0.05,0.1时,若能分辨出两者降低的差别是其标准差的60%,则需要多少试验对象? 已知/0.6
37、;双侧0.05,Z0.051.96;0.1,Z0.011.282。代入公式得 2n1=n2=2(1.96+1.282)0.6=58.459 故每组需试验对象59人。 4. 样本率与总体率比较的样本含量估计: n=p(Z)2a+Zb0(1-p0) d16 3-20),则需要观察多少病例? 已知00.8,10.9,0.90.80.1,单侧0.05,U0.051.645;0.1,U0.11.282。代入公式3-21得: 故至少需要观察138例 5. 两独立样本率比较的样本含量估计 (1.645+1.282)n=0.8(1-0.8)=137.1138 0.12n1=n2=1641.6-1sin或 n=
38、(za+zb)p1-sin-1 p22(za+zb)2p(1-p)2(p1-p2)2式中n为两样本所需含量;p1、p2分别为两总体率的估计值;p为两样本合并率,当两样本例数相等时,p=/2。 z和z分别为与检验水准和第二类错误概率相对应的u值,有单、双侧之分,只取单侧。角度单位为度。 例3-6:观察A、B两种治疗方法对某病的疗效。A方法有效率为60%,B方法为85%。现欲做进一步的治疗试验,设0.05,0.10,则每组需要观察多少病例? 本例采用双侧检验。已知p10.60,p20.85,z0.05/21.96,z0.011.282。代入式3-22得: 故每组需要病例64例,两组共计128例。
39、17 (1.96+1.282)n1=n2=1641.6-1=63.864 -10.85-sin0.60sin26. 病例对照研究中的样本含量估计 成组设计的病例对照研究样本含量估计 n=2pq(za+zb)2/ (p1-p0) 2za和zb分别是a和b值对应的标准正态分布分位数,p0和p1分别是所研究因素在对照组和病例组的估计暴露率。在发病率比较低的时候,p0可以用人群的暴露率来近似代替。 q0=1-p0,q1=1-p1; p=(p0+p1)/2,q=1-p; 病例组p1也可以根据p0和估计的比值比推算 p=1OR1+0p0p(OR-1)p=0.5(p1+p0),q=1-p例3-7:用成组病例
40、对照研究设计方法研究小儿先天性心脏病与母亲孕期口服避孕药(OC)关系。假定育龄妇女中应用OC者占30,孕期服用OC与小儿先天性心脏病的OR=2.5,a=0.05,b=0.10,试估计研究所需的样本量。 查表za=1.96,zb=1.28, q0=1-0.3=0.7;p1=(2.50.3)/(1-0.3+2.50.3)=0.52;q1=1-0.52=0.48; p=(0.3+0.48)/2=0.39q=1-0.39=0.61n=20.390.61(1.96+1.28)2(0.52-0.30)2103 在此条件下研究,病例组和对照组分别需要103人。 1:1配对病例对照研究的样本含量 18 m=(
41、za/2+zbp(1-p)2)2(p-1/2)p=ORRR 1+OR1+RR 其中m为病例和对照暴露状况不一致的对子数。 M=m/pe pe=p0q1+p1q0 式中M为研究需要的总对子数,Pe为病例组和对照组暴露情况不一致的对子数出现的频率;P0和P1分别是人群中估计的暴露率和病例组估计的暴露率。 例3-8:欲用1:1匹配病例对照研究方法调查某地45岁以上人群高血压与脑卒中的关系。设=0.05,=0.10,据资料报道,该地45岁以上人群高血压患病率为20%,OR为2.5。试计算所需的样本含量M。 已知,OR=2.5,则 p=2.5=0.7143病例和对照暴露状况不一致的对子数为: m=1.9
42、6/2+1.2820.7143(1-0.7143)2/(0.7143-1/2)2=34 p1 已知人群高血压患病率P0=20% =p0OR/1+p0(OR-1)=0.1250,q1=1-0.125=0.875,q0=1-0.20=0.80需要的总对子数为: Mm=34=1241:R 配比的病例对照研究的样本含量 19 2 N = ( 1 + 1 / R ) p ( 1 ) + z p ( 1 - p ) /( p 2 za- pb11/R+p0(1-p0)1-p0) p = ( OR p ) ( 1 - p p ) + OR1000p=(p1+Rp0)/(1+R) 二、检验效能分析 在流行病学
43、研究中,除了控制各种混杂偏倚之外,还需要考虑可能出现的假阳性和假阴性错误。统计学的结果都是概率性的,对于任何一次假设检验,不论其结论是拒绝H0,还是接受H0,有可能犯错误第一类错误和第二类错误,见图3-6。统计学的结果与真实值之间有下列四种情况,见表3-4。 出现不一致的结果有两种: 真实情况无差别,而统计结果有差别,即假阳性错误; 真实情况有差别,而统计结果无差别,即假阴性错误; 图3-6 第一类错误和第二类错误示意图 表3-4 真实值与统计学结果的关系 当统计学检验结果P,即在水平下,不拒绝H0,未发现比较的两组间的差别无统计学意义。出现“阴性”结果有两种可能: 所比较的组间总体参数无差别。 所比较组间总体参数有差别,但由于样本含量不足、第二类错误太高,而导致检验效能低,这种差别还未被发现。 20 第二类错误是指接受了实际不成立的H0。通常把l-称为检验效能(也称把握度),它是指当两个总体确有差别时,按规定的检验水准能够得出差别有统计学意义