调查设计[1].张晋昕.ppt

上传人:文库蛋蛋多 文档编号:2908008 上传时间:2023-03-02 格式:PPT 页数:96 大小:251.01KB
返回 下载 相关 举报
调查设计[1].张晋昕.ppt_第1页
第1页 / 共96页
调查设计[1].张晋昕.ppt_第2页
第2页 / 共96页
调查设计[1].张晋昕.ppt_第3页
第3页 / 共96页
调查设计[1].张晋昕.ppt_第4页
第4页 / 共96页
调查设计[1].张晋昕.ppt_第5页
第5页 / 共96页
点击查看更多>>
资源描述

《调查设计[1].张晋昕.ppt》由会员分享,可在线阅读,更多相关《调查设计[1].张晋昕.ppt(96页珍藏版)》请在三一办公上搜索。

1、1,调查设计,张 晋 昕,2,第一部分调查研究概况,3,一、调查研究的概念、特点与适用范围 方法,实验研究(experimental research)调查研究(survey research)实地观察研究(field study)文献研究(document study),4,调查研究是医学研究的很重要组成部分,是医学科学研究重要手段,它的主要特点:1)研究过程中没有人为施加干预措施,而是客观地观察记录的某些现象的现状的相关特征.这里的研究因素是客观存在的;2)有些混杂因素不能通过随机分组的方法来平衡,如拟了解和比较甲、乙两地环境条件对食管癌死亡率水平的影响。,5,二、调查研究的分类,一)从调

2、查对象分,全面调查(普查)抽样调查典型调查,6,二、调查研究的分类,二)从调查涉及的时间划分时间长短,回顾性调查(病例-对照)前瞻性调查(队列研究)历史前瞻性调查,横断面调查(现况调查)纵向调查,7,二、调查研究的分类,三)从抽取样本的方式分,概率抽样(单纯随机抽样、系统抽样、分层抽样、整群抽样)非概率抽样(偶遇抽样、判断抽样、定额抽样、雪球抽样),8,第二部分调 查 设 计,调查设计是调查研究得以成功的重要保证,它包括资料的收集、整理和分析的各个环节以及整个设计过程的统计设想和科学安排。,9,一、调查计划,1.确定调查目的和指标(目标总体、抽样总体)2.确定调查对象和观察单位3.调查方法和搜

3、集资料方式:普查、抽样调查和典型调查。搜集资料方式主要有直接观察法和询问法,各有适用范围。4.拟订调查项目和调查表5.确定样本含量确定调查方式(因素数10)6.制定调查的组织计划,10,二、资料的整理计划任务:按研究设计的要求,使原始数据系统化、条理化,便于进一步计算统计指标和进行统计分析。一)问卷接收二)问卷核查:完整性、逻辑性三)数据编码:每个可能的答案均需编码四)数据的计算机录入,11,五)拟订整理表,1)质量分组:将观察单位按某种属性或类别分组,适用于定性资料。,2)数量分组:将观察单位按变量值的大小分组,适用于定量资料。,设计分组,六)归纳汇总设计整理表,进行汇总;现多借助电脑汇总。

4、,12,第三部分常用的抽样方法,概率抽样方法主要包括:单纯随机抽样、系统抽样、整群抽样和分层抽样。,13,1.单纯随机抽样(simple random sampling)优点:均数、率及其标准误计算简便。缺点:当总体中例数多时,对观察单位进行编号不易操作,在实际工作中有时难以实现。例1 抽样参加夏令营活动,某班有学生100人,若抽取为10人参加夏令营,试作单纯随机抽样设计。,14,2.系统抽样(systematic sampling)例2 欲调查某社区贫血患病情况,该社区有居民1000人,试按系统抽样方法,抽取例数为100的样本.先将1000名居民按某一特征的顺序编号,N为1000,n=100

5、,抽样间隔1000/100=10,在110之间随机确定一个数字,譬如7,每间隔10个观察单位抽取一个,即7、17、27、997组成样本。,15,系统抽样的优点:1)易于理解,简便易行;2)容易得到一个按比例分配的样本;3)样本观察单位在总体中分布均匀,其抽样误差一般小于单纯随机抽机抽样。缺点:1)当总体的观察单位按顺序有周期趋势或单调增(减)趋势时,容易产生明显的系统误差(偏倚);2)在实际工作中,一般按单纯随机抽样方法估计其抽样误差,但系统抽样抽取各个观察单位并不是彼此独立的,因此抽样误差的估计只是近似的。,16,3.整群抽样(cluster sampling)先将总体按照某种与研究无关的特

6、征划分为K个“群”组,每个群组包括若干观察单位,然后抽取k个“群”,抽取的各个群的全部观察单位组成样本。,优点:便于组织、节省经费,容易控制误差质量。缺点:当样本含量一定时,其抽样误差一般大于单纯随机抽样,这是因为样本观察单位不是均匀散布在总体中。为降低抽样误差,可采用增加抽取的“群”数,减少“群”内观察单位数的方法进行抽样,即重新划分“群”,使每个“群”更小。,4.分层抽样(stratified sampling),先按对观察指标影响较大的某种特征,将总体分为若干类别,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。,18,(1)等比例分配(2)非等比例分配(最优分配):,19,分层

7、抽样的优点:A:抽样误差小于前三种,样本的代表性好B:便于对不同层采用不同的抽样方法C:便于对各层独立进行分析,20,在实际调查研究中常常将两种或几种抽样方法结合起来使用。各抽样方法的抽样误差一般是:整群抽样单纯随机抽样系统抽样分层抽样 样本含量的估计的目的是在保证一定精度和检验效能的前提下,确定最少的观察单位数。,21,在实际调查研究中常常将两种或几种抽样方法结合起来使用。各抽样方法的抽样误差一般是:整群抽样单纯随机抽样系统抽样分层抽样 样本含量的估计的目的是在保证一定精度和检验效能的前提下,确定最少的观察单位数。,22,非概率抽样,偶遇抽样/便利抽样(accidental/convenie

8、nce sampling)研究者根据其工作方便,随意抽取样本的抽样方法。此法难以保证个体在抽样总体的同质性,故抽样误差较大,可靠性差。一般用于非正式的探索性调查,较少用于正式调查。【例】某商业中心的街头访问,某一消费人群或营业人员的访谈等。,23,非概率抽样,判断抽样/立意抽样(judgmental/purposive sampling)根据研究者的经验或主观判断选择样本的抽样方法。此法的可靠性取决于研究者的主观判断能力。【例】某研究者根据其本身学识和经验认为某敬老院的人群对于老年人骨质疏松症具有代表性,故以该敬老院的所有老人为抽样样本进行研究。,24,非概率抽样,定额抽样/配额抽样(quot

9、a sampling)首先对总体根据某些控制特征(如年龄、性别等)分层,然后按每层控制特征的比例分配抽样数量,最后采用便利或判断抽样方法实施抽样。定额抽样又分为独立控制和非独立控制定额抽样两种方法。前者按单个控制特征进行每层抽样,后者则按两个以上控制特征进行每层抽样。此法与分层抽样的区别在于抽样是非随机的。【例】Gallup poll,25,非概率抽样,滚雪球抽样(snowball sampling)当研究对象较稀缺时,先找到最初的小样本,在小样本调查的基础上发掘相关信息,进一步扩大样本量,直至达到所需样本量为止。最大优点是节约成本,缺点是误差较大,且难以控制。【例】传销者心理调查,26,第四

10、部分调查表和问卷的设计,27,1.调查项目:(1)背景资料:调查对象的姓名、住址、单位、电话等;(2)人口学项目:年龄、性别、民族、婚姻状况、文化程度、职业等;(3)研究项目:是调查的核心内容。它是根据研究目的和调查指标所确定的必须进行调查的项目。,28,2.问题的形式:按问题的给出方式分为提问和陈述两种。按答案的给出方式分为开放式问题和封闭式问题。,29,3.问题设计的一般原则:(1)尽量避免术语:“就低不就高”的原则。您近来有无纳差?(2)避免用不确切的词:对于语义较为含混的词语如经常、偶尔、普遍、大概等应给出本次调查的确切标准。例如“您是否经常失眠?”A.(每半年1次或更少);B.(每3

11、个月1次或更少);C.(每月1次到3次);D.(每周1次或更多)。,30,问题设计的一般原则(续1),(3)避免双重问题:“您抽烟喝酒吗?”(4)避免诱导或强制:“您认为晚婚晚育有利于普遍提高全民素质,对么?”(5)问题应适合全部调查对象并符合逻辑:“您的孩子多少岁?”应改为:,31,问题设计的一般原则(续2),10.您是否结婚了?A.是 B.否(若回答A.是,请继续回答第11问,若回答B.否,请继续回答第13问);11.您有没有孩子?A.有 B.无(若回答A.有,请继续回答第12问,若回答2.无,请继续回答第13问);12.您的孩子多少岁?,32,敏感问题的处理1,您如何看待插足家庭生活的第

12、三者?,对象转移法:“对于介入别人婚姻中的第三者,有些人认为这种行为不好,也有人认为无所谓,您同意哪种观点?”,33,敏感问题的处理2,国家的人口政策提倡只生一个娃,你觉得好不好?,假定法:“假如我国人口政策不限制生育,您愿意有几个孩子?”,34,敏感问题的处理3,您是否正在遭受家庭暴力的威胁?,增设非敏感问题3-1您是否正在遭受家庭暴力的威胁?3-2您是否喜欢看粤剧?A.是 B.否,35,36,调查项目的安排顺序,符合逻辑;一般问题在前,特殊问题在后;易答题在前,难答题在后;敏感问题一般放在最后。如果敏感问题较多,为了降低其敏感性,亦可分散在问卷之中。,37,第五部分调查质量控制,38,1.

13、设计阶段(1)正确划分调查范围(2)正确选择调查指标(3)明确定义调查项目(4)正确设置调查问题(5)选择恰当的调查方式(6)预调查,39,2.资料收集、整理与分析阶段(1)问卷的登记与编码(2)检查资料的完整性(3)检查填报的正确性(4)控制数据录入质量,如“双机输入”(5)数据的逻辑检查,40,总体的定义,明确目标总体和抽样对象,确定抽样方法,确定观测指标和调查项目,选择调查方式,制定调查组织计划,制定整理、分析计划,统计结论+专业结论,根据研究目的,预调查修改调查表,41,第六部分样本含量的估计方法,42,样本含量的估计,在保证研究结论具有一定可靠性的前提下,确定最少的研究单位数。,43

14、,一、决定样本含量的一般条件(1)检验水准(单双侧)(2)检验效能1-(单侧)(3)、的估计(变异度)(4)组间差别的估计(容许误差),44,二、样本含量的常用估计方法1.样本均数与总体均数的比较两样本均数比较多个样本均数的比较随机区组设计所需样本含量样本率与总体率的比较,45,二、样本含量的常用估计方法 6.两组样本率比较 7.多个样本率的比较 8.直线相关 9.病例-对照研究10.队列研究,46,1.样本均数与总体均数的比较,实例1.某医师试验某种升白细胞药的疗效,先以9例低白细胞病人做预实验,结果计算出用药前后白细胞差值的标准差为2.5千个/mm3(或109/L),现要做正式临床试验,且

15、要求白细胞平均上升1千个/mm3(或109/L)才算该药临床有效,问要多少病人进行正式临床试验?,47,公 式,48,实施步骤,第一步这里,=1=2.5 t 0.05,=1.645 t 0.1,=1.282,49,取n=54,50,第二步=1=2.5=54-1=53 t 0.05,53=1.674 t 0.1,53=1.298,51,取n=56,52,第三步=1=2.5=56-1=55 t 0.05,55=1.673 t 0.1,55=1.297,53,取n=56,54,结 论,第二步与第三步,n已趋于稳定,故可以认为需56个病人进行正式临床试验,才有90%(即1-)的把握发现差别。,55,2

16、.两样本均数比较,实例2.在进行有两种处理的动物冠状动脉窦的血流量实验时,A处理使平均血流量增加1.8ml/min,B处理使平均血流量增加2.4ml/min。设两种处理的标准差相等,均为1.0ml/min,=0.05,=0.10,若要得出两处理之差别有统计学意义的结论,需多少实验动物?,56,公 式,57,实施步骤,第一步这里,=2.4-1.8=0.6=1 t 0.05/2,=1.96 t 0.1,=1.282,58,取n1=n2=59,59,第二步=0.6=1=2(59-1)=116 t 0.05/2,116=1.982 t 0.1,116=1.289,60,取n1=n2=60,61,结 论

17、,第一步与第二步结果相近,故可以认为每组需动物60只,两组共需120只。,62,3.多个样本均数比较,实例3.拟用四种方法治疗贫血患者,估计治疗后血红蛋白含量(g/L)增加的均数分别为18、13、16、10,标准差分别为10、9、9、8,设=0.05,=0.10,若要得出四种处理之差别有统计学意义的结论,问每组需观察多少例?,63,公 式,64,实施步骤,第一步这里,据1=k-1=4-1=3,2=查表得=2.17,65,取n=32,66,第二步这里,据1=k-1=4-1=3,2=4(32-1)=124,查表得=2.21,67,取n=33,68,结 论,第一步与第二步结果相近,故可以认为每组需观

18、察33例,四组共需132例。,69,4.随机区组设计所需样本含量,实例4.欲比较四种不同药物降低血清谷草转氨酶的疗效。从预实验已知误差的均方为30U/dl,组间差值可达8U/dl,拟取=0.05,=0.05,问每组需多少病例?,70,公 式,71,实施步骤,这里,据k=4,查表得Q=3.8,72,每组取n=28,73,5.样本率与总体率的比较(大样本),实例5.已知用常规疗法治疗某种疾病的有效率是80%,现实验一种新的治疗方法,预计有效率是90%。给定=0.05,=0.10,问至少需要观察多少病例?,74,公 式,75,实施步骤,这里,,76,取n=169,77,6.两组样本率比较,实例6.初

19、步观察甲、乙两药对某种疾病的疗效,初步实验得甲药有效率为60%,乙药为85%。现拟进一步作治疗试验,设=0.05,=0.10,问每组至少需要观察多少病例?,78,公 式,79,实施步骤,这里,,80,每组取n=64,两组共需128例。,81,7.多组样本率比较,实例7.拟观察三种方法治疗消化性溃疡的效果,初步估计甲法有效率为40%,乙法有效率为50%,丙法有效率为65%。设=0.05,=0.10,问每组至少需要观察多少病例?,82,公 式,83,实施步骤,这里,据=3-1=2,=0.05,=0.10,查表得 0.05,2=12.65,84,每组取n=99,三组共需297例。,85,8.两变量的

20、直线相关,实例8.根据以往经验得知,血硒与发硒含量间的直线相关系数为0.8。若想在=0.05,1-=0.90的水平上得到相关系数有统计学意义的结论,应调查多少人?,86,公 式,87,实施步骤,这里,,88,应调查12人。,89,9.病例-对照研究,实例9.为了考察母亲孕期使用雌激素与所生子女患先天性心脏病的联系,拟进行病例-对照研究。根据预调查结果,估计对照组有暴露史的比例p1=0.3,OR=2,设=0.05,1-=0.90,求样本含量。,90,公 式,91,实施步骤,将p1=0.3代入,得到p2=0.4615进而得到:,92,即病例组和对照组各需调查约190人。,93,10.队列研究,实例10.为了考察母亲孕期使用雌激素与所生子女患先天性心脏病的联系,拟进行队列研究。根据预调查结果,估计非暴露组发病率p1=0.002,RR=2,设=0.05,1-=0.90,求样本含量。,94,公 式,95,实施步骤,将p1=0.002代入,RR=p2/p1=2得到p2=0.004进而得到:,96,即暴露组和非暴露组 各需调查约15720人。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号