研究生实验设计.ppt

上传人:小飞机 文档编号:5806284 上传时间:2023-08-21 格式:PPT 页数:75 大小:599KB
返回 下载 相关 举报
研究生实验设计.ppt_第1页
第1页 / 共75页
研究生实验设计.ppt_第2页
第2页 / 共75页
研究生实验设计.ppt_第3页
第3页 / 共75页
研究生实验设计.ppt_第4页
第4页 / 共75页
研究生实验设计.ppt_第5页
第5页 / 共75页
点击查看更多>>
资源描述

《研究生实验设计.ppt》由会员分享,可在线阅读,更多相关《研究生实验设计.ppt(75页珍藏版)》请在三一办公上搜索。

1、1,第四章 研究设计基础,Design of Experiment流行病与卫生统计学系刘 沛,2,1.实验设计的意义2.实验研究基本要素3.实验设计的基本原则4.常用的实验设计方案5.调查设计,3,医学研究基本过程,制定研究目的,建立专业假设 查阅文献资料制定实验设计进行实验,分析实验结果发表研究成果,评价假设,4,一、实验设计意义,实验设计:在实验前对实验所作出的计划和安排专业设计:选题,建立实验方法等 先进性,实用性统计设计:数据的收集整理和分析方法 科学性,经济性,可重复性意义:用经济的人力、物力和时间得到可靠的结果减少实验误差,对误差大小作出估计,5,实验性研究与观察性研究,实验(Ex

2、periment)在特定条件下施于人为干预观察(Observation):在自然状态下不施加人为干预试验(Trial):以人为对象的实验,go2,6,二、三个基本要素,1.受试对象:动物、人。同质性、代表性。两个基本条件(敏感,稳定)2.处理因素:外部施加,内部固有 抓住主要因素 分清非处理因素(混杂因素,Confunding)必须标准化3.实验效应:指标选择客观性、精确性、特异性和灵敏性,go2,7,三、三项基本原则,对照原则随机原则重复原则,8,(一)、对照原则,实验组和对照组除了实验因素外,其它影响实验效应的非处理因素均应基本相同Best的对照研究:X线照射脑垂体治疗高血压照射组:25人

3、 17例下降 占68%对照组:25人 19例下降占76%(双盲法)对照的关键在于保持“均衡性”甲(100)ADI()乙(100)ADI(-),ADI 50()甲 ADI 50()ADI 50()乙 ADI 50(),9,对照的种类,处理:空白对照(安慰剂),相互对照对象:自身对照,实验对照时间:历史对照,同期对照数目:单个对照,双重对照,10,双 重 对 照,某降压冲剂的双重对照 组别 n 用药前 用药后 差值 配对 t 降压冲剂 25 160 19 133 15 27 21 6.43 安慰剂 20 168 24 154 22 14 28 2.24 两组 t 1.25 3.80 1.78,go

4、7,11,(二)、随机化原则,概念:采用随机的方式,使每个观察单位有同等 的概率被抽取作用:避免主观因素的参与 打破实验对象排列的系统性,控制系统误差 对意想不到的因素起平衡作用 统计推断的基础,12,随机化应贯穿于实验设计和实施的全过程,抽样的随机分组的随机实验顺序的随机方法:随机数字表 随机排列表 随机发生函数,13,常用的随机化方法,完全随机化:直接对受试对象进行随机分组编号,取随机数,确定组别2.分层随机化:先将研究对象按某一特征分层,然后按每层内进行完全随机化分层,编号,取随机数,确定组别,go7,14,(三)、重复原则,1.整个实验的重复:重现性,可靠性2.多个受试对象的重复:样本

5、含量3.同一受试对象的重复观察:提高观察精度,分析变化趋势作用:估计实验误差,降低实验误差,go2,15,一、完全随机化设计,概念:将实验对象用随机的方法分配到处 理组和 对照组中,进行实验观察。方法:随机数字表,随机排列表优点:简单灵活易理解缺点:实验误差大,精确度低,只能研究一 个因素,16,方法:1)编号 2)查表 3)按随机数分组,Sj table,17,二、配对设计,将实验对象按一定条件配成对子,随机分配入实验组、对照组 自身配对、非自身配对方法:配对,编号,查表,归组优点:抽样误差小,样本例数少,结果可靠缺点:资料难以获得,自愈性疾病不适用,18,三、随机区组设计(配伍组设计),概

6、念:配对的扩大 优缺点:同配对设计方法:区组,编号,查表,归组,19,四、交叉设计,将、两种处理因素先后施于同一批试验对象,随机地使半数对象先接受处理,后接受处理;另一半对象先接受处理,后接受处理。优点:实验误差能得到有效控制,实验效率高缺点:半衰期较长的药物不能使用,两种处理间不能有交互作用,20,例:以、两种药物治疗支气管哮喘病人16例,用交叉设计比较其疗效)编号)查随机排列表,随机指定第行,抄录 0-15的随机数)任意规定:单数到甲组试验顺序为;双数到乙组顺序为,四、交叉设计 举例,21,患者编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 随机数 9

7、10 3 15 0 11 2 1 5 8 13 6 12 4 7 14组别 甲 乙 甲 甲 乙 甲 乙 甲 甲 乙 甲 乙 乙 乙 甲 乙 用药顺序 AB BA AB AB BA AB BA AB AB BA AB BA BA BA AB BA结果:甲组:1 3 4 6 8 9 11 15 先后 乙组:2 5 7 1 0 12 13 14 16 先后,附表,22,五、析因设计,析因设计是一种多因素交叉分组设计,它不仅可以作每个因素各水平的比较,还可以进行交互作用的分析。交互作用:协同、拮抗交叉分组:每个因素的所有水平都互相交叉最常用的为:2析因设计,a(吸烟因素)b(接尘因素)a1(吸烟)a2

8、(不吸烟)b1(接尘)a1b1 a2b1 b2(不接尘)a1b2 a2b2,23,吸烟与接尘对 FEF25-75%的影响,对照组 接尘组 吸烟 不吸烟 吸烟 不吸烟 X 3.12 3.42 2.41 3.52 S 0.39 0.37 0.34 0.32 n 16 14 18 12,方 差 分 析 SS n MS F P 总 变 异 19.2 59 接 尘 2.5 1 2.5 19.4 0.01 吸 烟 7.7 1 7.7 60.2 0.01 交互作用 1.9 1 1.9 14.5 0.01,24,四个均数间关系 吸烟 不吸烟 接 尘 2.41 0.05).接尘可加重吸烟对FEF25-75%的影

9、响(P 0.01),25,析因设计优缺点,优点:可进行多因素研究,可分析交互作用缺点:水平数多时,分组数太大 22=4 24=16 44=256组,go2,26,样本含量估计,在保证研究结论具有一定可靠性的条件下,确定最少的样本例数。样本含量过小:抽样误差大,结果不稳定,检验功效低,应有的差别不能显示。样本含量过多:费时、费力,非抽样误差增大。,27,误差来源,抽样误差:由抽样引起的样本统计量和总体参数间的差别客观存在,不可避免,但可以控制并可估计大小非抽样误差:由各种人为因素和偶然因素所造成过失误差:result from the mistakes during the recording,

10、calculation,gathering and understanding process.偏倚/系统误差:due to the imprecise design plan and inaccurate measurement.Selection bias;measurement bias;confounding bias,28,误差控制方法,Quality control for three stages:1.Design:严密设计研究的总体方案;明确定义研究对象,正确划分观察范围;正确选择观察指标;选择恰当的观察方式;预研究;2.Data collection:研究人员的选择与培训;盲

11、法观察结果;定期检查研究记录;检查研究对象的依从性情况。单盲和双盲:结果更可靠。3.Data analysis:分层分析以及多因素分析,29,案例讨论 Discussion of Cases,案例13-1 某市教育局2010年对小学生体质进行了一次抽样调查,以了解学生身体发育状况,为加强学校体育与健康教育提供基线资料。城市有30个学校,在校生约50000人,农村有18个学校,学生约10000人。在48个学校中,随机抽取10个班,以抽中班级的所有学生为调查对象,每班约50名学生,共调查500名学生。请讨论:(1)该调查是否随机抽样?样本的代表性如何?(2)你认为应当如何抽样?,30,案例13-2

12、 某学者研究某制剂对某基因突变影响的随机化临床试验,作者按照就诊对象的先后顺序分别将研究对象分为试验组(50例)和对照组(10例)研究结果显示试验组的基因突变率为9.8%6.70%;对照组的基因突变率为74.88%12.12%,通过卡方检验,发现两组的基因突变率差异有统计学意义,结论为试验组的制剂能够抑制该基因突变。(1)该研究实质应为何种研究方法?作者在设计方面有无问题?(2)统计分析方法是否正确,结论是否恰当?(3)你认为该课题应该如何设计和分析?,31,案例13-3 某研究者研究某药物治疗铅中毒疗效时,采用治疗前后血铅和尿铅值为观察指标,共治疗铅中毒患者50名,测得结果为:治疗前血铅、尿

13、铅分别为(0.190.028)mg/L、(0.120.009)mg/L,治疗后血铅、尿铅分别为(0.080.014)mg/L、(0.070.008)mg/L,血铅、尿铅治疗前后比较P值均小于0.05,差异具有统计学意义,结论为该药对铅中毒具有良好的治疗作用。(1)该研究设计存在哪些问题?(2)统计表达是否正确?(3)你认为该研应该如何设计?资料应如何表达?,32,案例13-4 某医师观察某新药治疗急性支气管炎的疗效,用氨苄西林作为对照。按照患者入院时的体温进行分组,即体温39以下者分入实验组,体温39及以上者分入对照组,结论是新药疗效优于氨苄西林。(1)该医师结论是否正确?(2)研究设计存在什

14、么问题?(3)应该如何正确设计?,GO,33,调查设计及电子化调查表制作,流行病与卫生统计学系刘 沛,调查设计及电子化调查表,1.调查研究概念2.调查设计方法3.调查表结构4.电子化调查表制作,35,调查研究,概念:对研究对象进行客观真实的观察,并对观察结果进行描述和对比分析。特点:被动观察,往往不能施加处理因素常常不能完全随机分组应用:了解现状,探讨关系,36,调查研究分类,调查对象全面调查,抽样调查,典型调查调查时间横断面:现况调查纵向调查:病例对照研究,队列研究样本抽取方式概率抽样:简单,系统,分层,整群非概率抽样:偶遇,判断、定额、雪球,GO2,37,常用的随机抽样方法,1)单纯随机抽

15、样(simple random sampling)2)系统抽样(systematic sampling)3)分层抽样(stratified sampling)4)整群抽样(cluster sampling)5)多阶段抽样(multi-stage sampling),38,单纯随机抽样,抽样方法:将总体内的全部观察单位编号,再用随机化工具无放回地选出进入样本的号码,直至达到预定的样本例数为止。(等概率)优缺点:当总体内观察单位数不大时比较容易实施在总体含量过大而不易得到总体的完全列表时,可行性差。当个体变异大而样本量小时,样本的代表性差。适用范围:适用于总体内个体差异较小的小型调查和实验室研究。

16、,39,系统抽样,抽样方法:将总体内的观察单位依次编号,确定抽样比,即确定从每多少个单元中抽一个单元进入样本。至于究竟抽其中第几个,则必须用随机化的方法决定。优缺点:简单,快速,方便,容易得到一个按比例分配的样本。当总体内观察单位按顺序有周期性或单调递增(或递减)趋势时,系统抽样可导致偏倚。适用范围:事先对总体内的个体分布有所了解,能识别可能存在的周期性。,40,分层抽样,抽样方法:在抽样过程中,将总体按某种特征划分为若干个组别、层次,从每层内独立抽取随机样本。每层具体抽样方法可用单纯随机抽样或系统抽样法。分层的原则是分层后层内变异尽可能小,而层间变异尽可能大。,41,分层抽样,比例分配 最优

17、分配,42,整群抽样,方法 以自然存在的集体单位或人为划分的群体(例如家庭、街道、乡、村等)作为抽样单元。从中用随机化的方法抽取k个群,对抽中的k个群体内所有个体全部加以调查。优缺点 简单,快捷,易于得到样本,节省抽样费用。抽样误差较大,获得样本的代表性较差。适用范围 适用于群内变异大而群间变异小的总体。,43,多阶段抽样,方法 从总体中先抽取范围较大的单元,称为一级单元(例如县、区),再从每个抽中的一级单元中抽取范围较小的单元,称为二级单元(例如乡、街道),还可以从抽中二级单元中再抽取范围更小的三级单元(如村、居委会),甚至更小的单元,最后一级抽样单元可以是个体或者是群。各级抽样可结合使用不

18、同的抽样方法,最简单的情形是二阶段抽样(two-stage sampling)。优缺点 可以结合不同抽样方法方便地得到样本,以保证样本的代表性和控制抽样误差。统计分析较为复杂。适用范围 大规模调查常采用多阶段抽样。,44,调查表结构,调查表的基本结构包括调查表的名称、编号、一般项目如姓名、性别、出生日期、出生地、民族等。调查研究项目如疾病史、职业暴露史、家族遗传史等。结束部分如调查员签字、调查日期等。,45,调查表结构,调查表的格式可分为一览表和一人一表式,一览表每张可填写多个观察单位,适用于项目较少的调查。一人一表式每张只填一个观察单位,适用于调查项目较多时。调查表的填写应力求简单清楚,多用

19、选择、填空以及简单的符号或数字,少用文字回答。必要时应编制填写说明。,46,调查表结构,调查项目项目要精选,需要的项目一个也不可少,不需要的项目不应出现。问题的类型:封闭式,即针对某一问题同时列出两个或多个固定的答案供调查时选择填写。开放式,适用于较复杂的情况。它不限制答案的范围,让调查对象尽情应答。,47,小学生营养改进行动调查表,学校、班级编号、入组序号性别(1-男 2-女)、家庭人口父亲职业(1-工人 2-干部 3-农民 4-无业 5-商人 6-其他)母亲职业(1-工人 2-干部 3-农民 4-无业 5-商人 6-其他)父亲文化(1-小学 2-初中 3-高中 4-大学及以上)母亲文化(1

20、-小学 2-初中 3-高中 4-大学及以上),48,你知道吗,1、钙是我国居民膳食缺乏最明显的营养素,青少年尤为严重 2、缺钙,会影响青少年骨骼、牙齿的发育 3、奶类是膳食中钙的最好来源,而且吸收率高 4、经常饮用牛奶,将有利于儿童的生长发育,使人终生受益5、豆类及其制品、虾皮等食物含钙也很多 6、户外活动,晒太阳,有利于钙的吸收7、酸牛奶的营养价值比鲜牛奶的营养价值高 8、喝牛奶肚子不舒服,是因为乳糖不耐受,可以喝酸牛奶 9、您知道中国居民膳食指南的内容吗,49,调查表设计中应注意的问题,调查问题的多少应根据具体的研究目的,设置适当的问题数量。设计的问题过少,可能不足以得到所需信息,而设计问

21、题过多,可能会导致研究对象反感,导致在最初几个问题之后,出现漏答和不准确答案。,50,调查表设计中应注意的问题,调查问题的顺序 许多调查表往往以比较轻松的问题开始询问,可能的话,以研究对象感兴趣的问题开头。敏感的问题一般跟在相关的但不太敏感的问题之后。这样一方面可以通过比较轻松的问题在调查员与调查对象之间建立一种互信关系,另一方面避免因问题敏感而使调查对象不能很好合作。,51,调查表设计中应注意的问题,调查问题的用语 调查表的类型确定后,调查员在拟定调查问题时,调查用语问题特别重要,应使用调查对象熟悉和容易理解的词语,在一些特殊人群中对某些现象常有特定的惯用语,需要通过深入访谈或预调查获得。,

22、52,调查表设计中应注意的问题,4调查持续时间 每份调查所需的时间与调查表设计的问题是密切相关的。一般情况下,面访30-90分钟;电话访问10-30分钟;信访10-20分钟,在实践中是可以被调查员和研究对象接受的。时间太长,研究对象难以坚持到访问结束,且随着访问时间的延长,调查员和调查对象的注意力难以集中,应答的质量会有明显下降。一份理想的调查表往往要经过预调查和在正式调查过程中反复予以修改完善而得到。,53,电子化调查表的制作,EpiData基本情况 调查表生成与数据管理 EpiData使用流程,54,EpiData基本情况,建立快捷的电子调查表和选择合适的数据管理软件是保证研究质量的重要措

23、施 参照EpiInfo 6.0免费软件,丹麦学者Lauritsen JM等人发起,Bruus M编写程序而完成,目前为3.2版。安装时不受计算机设置的影响。无需安装或替换任何的DLL文件或系统文件,55,EpiData基本情况,能快速建立调查表,方便地进行数据录入,可校验录入、双份比较 建立的数据库可转变成dBase、Excel文件以及SAS、SPSS和Stata统计分析软件的数据格式 为数据管理软件,基本不具有统计分析功能。,56,EpiData基本情况,局限性1:是单用户程序,无网络版 局限性2:记录数限制20万条左右 局限性3:字段数限制999行内写完,57,EpiData的三种文件类型

24、,QES文件(调查表文件):定义调查表(问卷)的结构;REC文件(数据文件):存放数据以及已经定义好的编码;CHK文件(核查文件):定义了数据输入时字段的有效性规则。,GO22,58,EpiData使用流程图,进入,59,建立调查表,建立数据定义是一基础性工作,也是关键性的工作 在EpiData表现为建成QES文件,60,QES文件字段定义,字符型:用下划线数字型:用#号,每位一#,#.#逻辑型:用Y或N,、日期型:字段名框在 之中,61,id(automatic id number)V1 Sex#V2 Heighy(meter)#.#V3 Weight(kilo)#.#bmi Body Ma

25、ss Index#.#V4 Date of birth V5 Age today#V6 Country of Residnece _,QES文件字段定义举例,62,生成字段名设置选项,63,生成字段名-几条规则,文本中优先选择用花括号括进的文本 通用常见单词不作为字段名组成部分 字段前为空,字段名就取前一个字段名再加上一个数字。如果不存在前一个字段名则使用隐含字段名FIELD1 首字符为数字,则在首字符前插N 大小写取决于“文件”菜单中“选项”,64,-问题 产生的字段名 使用规则-State your nationality NATION Rule 1All you like is icec

26、ream LICE Rule 1What is your name ISYOURNA Rule 23.question:N3QUESTI Rule 4-,经验:实际工作中,对以中文为语言的调查表,最好用花括号直接指定英文字段名。,65,变量标记,又称变量标签(variable label)是对字段内容的一种描述或说明,自动生成 设置“以调查表第一个词命名”:例如v1 Age of patient#,“v1”为字段名,“Age of patient”为变量标记 设置“自动添加字段名”:v1ageofp为字段名,变量标记v1 Age of patient,66,数据文件生成,在EpiData表现为

27、生成REC文件 本文件基于QES文件而生成 产生REC文件前可提问输入文件标记 警惕:覆盖文件操作一定要慎重,67,添加字段控制,本步骤可以使数据输入过程按给定的一些规则和算法完成,这是EpiData功能的最强大体现 添加输入控制的指令以文件形式单独保存,该文件后缀为CHK 程序运行时,自动寻找与扩展名REC相同文件的CHK文件,68,添加字段控制,限制特定数值的输入 给出输入的数值编码的文字描述 指定数据输入的顺序 数据输入时自动计算 可在输入数据时添加显示帮助信息和其他有关的提示等,69,添加字段控制5项基本功,标签:给出各数字对应的描述性文本 限定特定值(数值范围,合法值)指定输入的顺序

28、(跳转)某些字段不得缺项,必须输入 重复上一条记录的某字段值,70,71,添加字段控制1项高级功能,相当于在CHK文件中进行编程 需掌握各种check commands:-ifthenendif、mustenter、relate 需熟悉各种operators和functions:-arithmetic、string、date、time,72,73,双份录入和对比核查,两位录入员将同样的调查表输入到两份数据文件中“对两个数据文件进行有效性检查”原理-两个录入员在同样的字段犯同样输入错误的概率很小,一旦发现输入不一致,则必然有一位出错,74,数据导出,EpiData软件产生的数据文件以“REC”作为扩展名,一般不能被其它软件程序所调用 数据备份 转出为文本文件 数据转成dBase III格式 数据转成Excel格式 转出成Stata、SPSS、SAS所用的数据,75,谢谢大家!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号