调查分析师《调查概论》.ppt

上传人:牧羊曲112 文档编号:6488281 上传时间:2023-11-05 格式:PPT 页数:844 大小:2.89MB
返回 下载 相关 举报
调查分析师《调查概论》.ppt_第1页
第1页 / 共844页
调查分析师《调查概论》.ppt_第2页
第2页 / 共844页
调查分析师《调查概论》.ppt_第3页
第3页 / 共844页
调查分析师《调查概论》.ppt_第4页
第4页 / 共844页
调查分析师《调查概论》.ppt_第5页
第5页 / 共844页
点击查看更多>>
资源描述

《调查分析师《调查概论》.ppt》由会员分享,可在线阅读,更多相关《调查分析师《调查概论》.ppt(844页珍藏版)》请在三一办公上搜索。

1、1,欢迎使用调查概论多媒体软件!,国家统计局培训学院研制,2,欢迎学习调查概论!,学习,测试,学习 还是测试?请按键!,3,学习内容,第一章 调查导论第二章 调查设计第三章 数据的收集方法第四章 调查问卷设计 第五章 抽样方法第六章 抽样估计第七章 样本量的确定第八章 数据收集的实施第九章 数据处理第十章 数据发布与数据分析,退出学习,4,第一章 调查导论,第一节 引言第二节 调查调查的步骤与过程第三节 调查的分类,1-2,1-3,1-1,5,1-1 引 言,什么是调查?调查就是使用明确的概念、方法和程序,以有组织、有条理的方式,从一个总体的部分或所有单元中收集感兴趣的指标信息,并将这些信息综

2、合编辑成有用的简要形式的所有活动。调查的重要性。调查是认识客观世界的一种手段,通过调查获取信息,对于了解现状,进行管理决策和探索未来发展均具有重要意义。调查的任务。科学地反映客观情况,为解决问题、制定政策或策略提供依据,调查是为决策服务。,6,1-2 调查的步骤,调查的计划和设计 调查前的准备 调查的实施 调查结果的分析与报告。,调查设计,调查前准备,调查的实施,调查的分析与报告,7,1-3 调查的分类,调查可以从不同角度进行分类:一、按调查内容和性质来划分,可分为有关部门组织的专项调查、市场调查和科学研究调查等。,按内容和性质划分,市场调查,科研调查,专项调查,8,按调查对象范围划分,全面调

3、查,非全面调查(抽样调查),二、从调查对象的范围来划分,可以分为全面调查和非全面调查。,9,三、从调查是否重复来划分,可分为一次性调查和经常性调查。,按是否重复划分,一次性调查,经常性调查,10,调查重要性案例分析,为了说明调查的重要性,现举国外两个市场调查的例子:一、上世纪八十年代,美国著名的科达公司为了改善其平稳的销售状况,进行了一项市场调查,通过调查发现,业余的摄影爱好者,由于不熟悉摄影技术,大约每年要损坏20亿张底片,这一调查研究导致了科研人员研究开发新的产品,从而一种 Kodac disc 相机问世,这种相机大大减少了焦距不准和暴光不足的问题,该产品1982年投产以后成为科达公司历史

4、上最成功的新产品之一。,11,二、上世纪五、六十年代美国盖洛普公司曾经作过一项美国汽车需求情况的调查,发现很多家庭希望小型省油的汽车,但当时并没有引起美国汽车制造商的重视,仍把研发重点放在生产豪华的车型,结果到了七、八十年代,在世界汽车市场中,日本的中小型汽车获得了很大的份额,连美国本国也大量进口日本汽车,这才引起美国的重视。而汽车的研发到投产需要一个较长的时间,使美国的汽车业失去了一个很好的机遇。这个例子从反面说明了调查信息的重要性。,12,本章结束,继续往下,返回本章,另选章节,13,第二章 调查设计,第一节 调查目标的确定 第二节 调查方法的选择 第三节 抽样设计的有关问题 第四节 调查

5、中各种误差及其控制,2-2,2-3,2-4,2-1,14,2-1 调查目标的确定,一、明确信息需求:首先要弄清为什么要作这 一项调查?调查的基本问题是什么?要把调查的目的搞清楚。二、数据的使用者和数据的用途:为了进一步明确调查目的,还要了解谁是数据的使用者,获得的信息主要用在什么地方?三、确定调查的指标和调查对象:解决向谁作调查和调查什么内容的问题。,15,2-2调查方法的选择。一、采用全面调查还是抽样调查。,全面调查从总体的所有的单元中收 集信息。抽样调查从总体的一部分单元中收 集信息来对总体进行估计。,16,二、采用何种获取资料的方式。数据收集的媒介:1、使用纸张为媒介。回答记录在纸印刷的

6、问卷上。2、使用计算机为媒介。问卷出现在计算机屏幕上,调查时将答案直接输入到计算机中。,17,3、电话访问:访员通过电话协助被调查者完成问卷。4、网络调查:调查者利用网络进行调查。,数据收集的基本方法,1、自填式:被调查者在没有访员协助下完成问卷。2、人员面访:由调查人员协助完成问卷。,18,2-3 抽样设计的有关问题一、确定目标总体与调查总体。要使调查总体与目标总体尽可能一致。目标总体:就是希望从中获取信息的总体。调查总体:即实际调查所覆盖的总体,在抽样调查中称作被抽样的总体,通过抽样框来体现。,19,二、抽样框(一)什么是抽样框?抽样框是包括全部总体单元的一个框架,用来进行抽样,它是辨别和

7、联系总体单元的工具。应包括以下部分或全部内容:1、识别资料,如姓名、企业名称等。2、联系资料,用来与总体单元进行联系,如地址或电话号码等。3、辅助资料,它有助于改进抽样设计。,20,(二)、抽样框的类型 主要有两种类型的抽样框:名录框和区域框。名录框(目录框):是包括总体单元实际的或概念的名录清单。概念名录框是基于调查进行时才存在的总体。如某天上午8点到9点进入某超市的顾客。区域框是其单元由地理区域构成的名录框,也可以用地图的形式出现。,21,(三)、抽样框的优良准则:理想的抽样框是其中每一个单元与目标总体的单元一一对应,不要有遗漏或重复,并具有辅助信息可以利用。具体有以下一些标准:1、关联性

8、。2、准确性。3、时效性。4、费用。5、使用标准的概念、定义和方法。,22,(四)几种有缺陷的抽样框及补救方法 1、不完全涵盖。即抽样框遗漏了一些总体单元。2、过涵盖。抽样框中包含了不属于目标总体的单元,或是空白单元。3、重复。抽样框中某些单元不止出现一次。4、分类错误。补救方法:1、若问题不严重可忽略不计;2、重新定义总体,使与抽样框一致;3、改正抽样框。,23,2-4 调查中各种误差,误差,抽样误差,非抽样误差,抽样框误差,计量误差,无回答误差,处理误差,24,一、抽样误差 是由于根据总体的一部分单元而不是全部单元的调查来估计总体特征所引起的误差。影响抽样误差大小的因素有:样本量的大小;总

9、体指标的变异程度;抽样设计;估计方法以及总体大小。,25,二、非抽样误差 是指除了抽样误差以外,调查活动过程中所产生的各种误差。它包括:(一)抽样框误差;(二)计量误差;(三)无回答误差;(四)处理误差。,26,本章结束,继续往下,返回本章,另选章节,27,第三章 数据收集的方法,第一节 自填问卷调查第二节 派员访问调查第三节 电话调查第四节 其他的调查方法第五节 各种数据收集方法的比较,3-1,3-3,3-4,3-5,3-2,28,3-1 自填问卷调查,优点:1、一般通过邮寄和匿名的方法,保密 性 较强,适合于敏感性问题的调查。2、与派员面访相比,费用比较低。3、被调查者可以参考个人记录,可

10、以 减少回答误差 4、通过邮寄,调查区域广泛。,29,自填问卷调查的缺点:1、回答率通常低于访员协助式方法。2、当问卷比较复杂时,通常就不如调查 员在场的效果好。3、自填方法对被调查者的负担比较大。4、问卷返回可能比较慢,需要的时间比较长。5、不适用于文化水平比较低的调查总体。,30,3-2 派员访问调查,一、特点:这是调查员与被调查者面对面进行的一种调查方式,调查结果在很大程度上取决于调查员的素质、能力和经验。二、优点:1、回答率比较高。2、可以使用比较复杂的问卷。3、通过调查员的观察和询问,及时解决被 调查者的疑难问题 可使调查数据比较准确。三、缺点:1、面访调查的费用比较高。2、调查的时

11、间比 较长。3、某些特殊群体的访问成功率比较低。4、实施调查过程中的质量控制比较困难。5、对调查 人员的要求比较高,有时一时难以在所在地区招聘到足够的、合格的调查人员。,31,3-3 电话调查,优点:1、时效快;2、费用低;3、可能访 问到 不容易直接调查对象;4、与邮寄 调查相比,可以及时处理疑难问题;5、易于控制实 施的质量;6、用计算机作辅 助工具十分 方便。缺点:1、难以包括全部单元 2、受时间限制;3、容易受到语音障碍;4、回答率比访问调查要低,32,3-4 其他调查方法,本书介绍了三种方法:,直接观察法,小组座谈法,网络调查,其他调查方法,33,直接观察法,由调查员在现场对被调查者

12、的情况直接观察、记录以取得有关信息的一种调查方法。,34,(一)直接观察法的优点,优点:1、直观性和可靠性;2、不受语言或人际交往的影响;3、简便易行,比较灵活。,35,(二)直接观察法的缺点,缺点:1、有时需要特殊的调查人员 或工具费 用比较高。2、观察对象有局限性;3、观察结果容易受观察者的影响;4、有些现象观察的结果缺乏统计意义。,36,小组座谈法,小组座谈法是采用 小型座谈会的形式,从调查对象中挑选 一组有代表性的人,在主持人的组织下,就某个专题进行讨论,以获得有关问题的深入了解。,37,(一)小组座谈法的优缺点,优点:1、收集资料快、效率高;2、取得信息比较广泛深入;3、方式灵活;4

13、、可进行科学监测。缺点:1、对主持人的要求比较高;2、回答的结果没有统一格式;3、有时间和内容的局限性。,38,网络调查,网络调查调查可以分为电子邮件 调查和网页调查,都是通过计算 机的网络来进行。优点:1、成本低、范围广、速度快。2、交互性好,能够实现问卷的多样化设计。3、为各种调查提供了丰富的抽样框。4、有更好 的质量控制。缺点:1、目前网络还不够普及,调查有局限性。2、回答率低。3、回答的真实性不能保证。4、被调查者的身份验证有很大困难。,39,3-5 各种数据收集方法的比较,要根据费用、时间、回答率和总体特征等各种因素来选择数据收集的方法。简单归纳如下:,40,本章结束,继续往下,返回

14、本章,另选章节,41,第四章 调查问卷设计,第一节 引言第二节 问卷结构与问题类型第三节 问卷设计的技巧第四节 问卷的度量方法,4-1,4-2,4-3,4-4,42,4-1 问卷的作用与设计原则,问卷的作用:1、问卷是规范调查访问内容和行动的一种工具。2、通过问卷易于对资料进行分析和统计处理。问卷设计的原则:1、效度(准确性)。2、信度(可靠性)。3、需要与可能。4、效率原则。,43,问卷的开发程序,向用户和调查对象咨询,参考以前相同主题的问卷,草拟问题,审议、测试和修改问卷,试点调查和问卷的定稿,44,4-2 问卷的结构与问题的类型,一、问卷的结构:1、开头部分:包括标题和说明词。2、正文部

15、分:调查所需要的问题。3、调查情况的记录。二、问卷中问题的类型:1、开放式问题。2、封闭式问题。,45,开放式问题,是不向被调查者提供选项,由被调查者用自己的语言来回答问题。可用于问卷的开发测试,这对制订问卷措辞和选项都很重要,同时也为封闭式的问题提供补充。优点:使被调查者有机会自我表达或详细描述。缺点:1、从被调查者来说要求更高,回答不容易。2、对调查机构来说,在面访中记录回答过程也比较困难。在归纳编码中也容易出错,从而产生误差。,46,封闭式问题,问卷中问题列出若干个可能的答案供被调查者进行选择。每个答案称为一个选项,要求被调查者在这些选项中,选择一个(或几个)作为回答。优点:1、被调查者

16、能更快更容易地回答问题。2、选项是按设计者的意图制定,能集中反映问题的核心所在。3、容易进行编码、录入,也便于统计处理。缺点:1、确定选项有时比较难,设计不周会给被调查者带来困难。2、可能使研究的问题过于简单化。选项不适合被调查者时会降低回答的可靠性。,47,三、封闭式问题的主要类型,二项选择问题:用于把被调查者分成两个对立的组。例:在本年度中您是否购买过自己使用的电脑?请您在合适的选项打勾(1)是(2)否,48,多项选择中的单选和多选问题:即选项多于两个,如果只能选择其中一个,称为单选问题,如果可选择多个答案,就称为多选问题。例:我购买这品牌电脑的原因是:(1)价格便宜(2)质量好(3)售后

17、服务好(4)功能多(5)该品牌有名,49,排序问题:被调查者要根据问题中的提示将所有回答选项进行排序。例:下面列出了寻找工作的一些途径。请按有效性的大小进行排序,在您认为最有效的方法标上“1”,其次有效为“2”,以次类推。邮寄“个人简历”在报纸或杂志上登广告 在政府就业中心登记 与朋友商量 与雇主直接联系 其他(请注明),50,等级评定问题:要求被调查者对选项进行评级,或对某个问题发表意见。例:如要求顾客对服务的满意程度进行打分,从“1”到“10”,“1”代表“非常不满意”,“10”代表“非常满意”。等级的划分也可以少一些,上例可以改为:您对我们提供的服务满意程度如何(请打勾)非常满意 满 意

18、 不满意 非常不满意,51,配对比较问题:,配对比较是将评价的项目进行两两对比的形式,在每一对之间进行比较,在市场调查中应用比较普遍。例:请比较下列每一对不同品牌的洗发液,哪一种您更喜欢使用?(每对中只选一个打勾)(1)海飞丝 潘婷(2)潘婷 飘柔(3)飘柔 威娜宝(4)威娜宝 花王(5)花王 海飞丝,52,4-3 问卷设计的技巧,一、调查问题的措辞准则(一)措辞要简单明确 例:您是否经常看电视?(“经常”的概念不明确)建议改为:您每天平均看多少分钟的电视?(这样就比较清楚一些),53,(二)对普通的被调查者要少用用专业术语 例:在一项关于计算机应用的调查中“您对哪个ISP的服务比较满意?”(

19、对于计算机还不太熟悉的人可能不知道 ISP是网络服务供应商的简称)如果改为“您对哪个网络服务供应商的服务比较满意?”就比较清楚。,54,(三)确保问题适用 例:您目前的职业是什么?(该问题并不适用所有被调查者)这个问题应该放在一个筛选问题后,如:您目前是否有职业?对回答“是”的人,再提出上述问题。,55,(四)问题要尽量具体“您的收入是多少?”(这是一个通常调查的内容,乍一看似乎很简单,但有以下问题:首先,“您的”含义不清,它是指被调查者个人还是家庭;其次,要调查那一段时期的收入?第三,“收入”的含义也不清。),一种改进的提问方式是:“去年,在交税之前,您全家各种来源的总收入是多少?”,56,

20、(五)要避免意义双关的问题 一个问题中包括了两个问题,被称作意义双关的问题,例如某商店一项调查:“您对购物环境和价格是否满意?”(这里购物环境和价格是两个问题),应把一个问题改为两个问题:“您对购物的环境是否满意?”“您对价格是否满意?”,57,(六)避免引导性问题 引导性问题是指会使被调查者选择某一特定的答案时具有倾向性,例如:“消费者普遍认为牌的电冰箱好,您的印象如何?”(引导性问题会导致调查结论产生偏差),改进方法:在调查问卷中应使用中性词句。,58,(七)对于一些需要客观计量的问题,问卷的 的设计必须使每一个被调查者的理解是一致的。,(八)对于需要回忆的问题,回忆的时间不应太长。,此外

21、,还有一些需要注意的问题:,59,二、敏感性问题的问卷设计,敏感性问题是指所要调查的问题涉及到被调查者的隐私或不愿公开如实回答的问题。(一)敏感性问题的措辞方法:1、释疑法;2、假定法;3、转移法。4、具体数字模糊法。,60,(二)随机化回答方法,由美国统计学家沃纳提出,具体的做法是:要调查的敏感性问题,列出正反两个问题。如调查考试作弊问题,就作成两种卡片:1、我在考试中作了弊 2、我在考试中没有作弊 然后由被调查者随机抽取一张来回答“是”或“否,由于调查员并不知道被调查者在回答那一个问题,因而起到了保密的作用。,61,4-4 问卷中的度量方法,(一)四种度量水平:(由低到高)列名水平(定类尺

22、度):最粗略的度量,将客观事物按其质的特性进行分类。如男、女性别。顺序水平(定序尺度):可将事物按等级或顺序进行排列。如大、中、小等。间隔水平(定距尺度):通常用数字表示,并能计算不同类型之间的差别大小。比率水平(定比尺度):最高的度量水平,除具有上述特性外,还可以计算度量值的比率。,62,(二)关于态度的度量方法(量表)简单的态度度量:如“同意和不同意”分类度量:简单度量的扩展,如分为非常好、好、一般、不好和非常不好五级。李克特量表:是由一组反映态度的问题组成,每个态度按强弱程度分为若干等级,进行打分最后予以加总。语意差别量表:是由一系列两极相反的形容词组成的评价体系组成。,63,关于态度的

23、度量方法(量表)(续)斯塔普尔量表:是语意差别量表的改进,它使用一个形容词,并用数字来反映强度标准,等级分为十个。图示量表:用几何图形来度量,这种方法具有比较直观的特点。项目间比较量表:这种方法是对两个或两个以上项目给出一个总分,要求被调查者在项目之间根据重要性进行划分。,64,本章结束,继续往下,返回本章,另选章节,65,第五章 抽样方法,第一节 引言第二节 非概率抽样第三节 概率抽样,5-1,5-2,5-3,66,5-1 引言,一、什么是抽样:抽样是通过抽取总体中的部分单元,收集这些单元的信息,用来 对总体进行推断的一种手段。英文中有一句话形象地说明抽样的必要性:“You dont hav

24、e to eat the whole ox to know that it is tough”Samuel Johnson(意思是说:你不需要吃掉整只公牛才知道公牛的肉是咬不动的),67,抽样调查,非概率抽样:采用非随机的方法从总体中抽选单元,概率抽样:基于随机的原则从总体中抽取单元,68,二、抽样调查中的一些基本概念(一)总体和样本:总体是指研究对象的全体,它是由研究对象中的单元组成的。总体中包含单元的数目称作总体容量(或大小);样本是指抽样时按照抽样的规则所抽中的那部分单元所组成的集合。,总体,样本,抽取样本,推断总体,69,(二)参数、估计量和估计值反映总体特征的指标通常称为参数,如总体

25、平均数、总体总量和总体比例等。估计量是样本观察值的函数,用它来对总体参数进行估计。根据估计量从具体样本得到的结果称作估计值。(三)入样概率与抽样比入样概率是指某个总体单元被选入样本的概率;抽样比是指样本量 n 与总体的容量N的比例,通常用f表示。即,70,(四)抽样分布:是指估计量的分布。也就是说,如果按照一定的样本容量和一定的抽样方式反复抽取样本,每个样本可以计算一个估计值,这些估计值形成的分布,就是抽样分布。(五)抽样方差和抽样标准误:也就是估计量的方差和标准差。它表示某个抽样方案,抽样结果的离差大小,方差和标准差愈小,表明估计值接近参数。,71,(六)精确性和精度:精确性是指在抽样中反复

26、抽样,其结果的差别大小。差别越小,其精确性越高。因此同样也可以用抽样方差来表示精确性。精度则是一个相对的指标,它是抽样方差或标准差与相应的待估参数之比。,相对方差,相对标准误,72,(七)抽样效率与设计效果:在样本容量相同的情况下,抽样方差越小表明抽样效率越高。设计效果是设计方案的方差与简单随机抽样的方差之比。设计效果通常用英文字母Deff表示:,Deff=,73,5-2 非概率抽样,一、非概率抽样及其优缺点(一)非概率抽样是用非随机的方法抽选样本。(二)优点:1、快速简便;2、费用相对比较低;3、不需要任何抽样框;4、对探索性研究和调查设计的开发很有用。(三)缺点:1、不能对总体进行推断;2

27、、由于不知总体单元的入样概率,故不能计算估计值的抽样误差。,74,二、非概率抽样的各种方法(一)随意抽样。样本单元的抽选以随意的方式进行。如街道拦截访问。(二)志愿者抽样。被调查者都是自愿参与调查。如网上问卷,自愿回答。(三)判断抽样。由专家有目的地挑选“有代表性”的样本进行调查。如典型调查。,75,(四)配额抽样。从总体的各个子总体中选取特定数量的样本单元组成样本。如市场调查中,规定男女消费者的样本各多少。(五)滚雪球抽样。适合于总体中某种较为稀少的特殊子总体而又缺少完整的抽样框。抽样时通过已知的少数个体获得信息逐渐扩大。,76,5-3 概率抽样,一、概率抽样及其优缺点(一)概率抽样是从总体

28、中随机抽选样本单元,被抽中的单元既不取决于调查人员的愿望,也不取决于被被调查者的态度。其次每一个单元都有一定的概率被抽中。(二)优点:可以对总体进行推断,并能计算估计值的抽样误差。(三)缺点:相对于非概率抽样,设计比较复杂,而且费用也比较高。,77,二、概率抽样的几种主要抽样方法(一)简单随机抽样 1、定义:设总体中有N个单元,不加条件从中随机抽取n个单元为样本,每个单元都有同样的概率被抽中的抽样方法。2、优点:(1)比较容易理解和掌握;(2)抽样框不需要其他辅助信息;(3)理论上比较成熟,有现成的方差估计公式。3、缺点:(1)没有利用辅助信息;(2)样本分散,面访费用较高;(3)有可能抽到较

29、差的样本;(4)抽选大样本比较费时。,78,(二)系统抽样 1、定义:又称等距抽样,对研究的总体按一定的顺序排列,每隔一定的间隔抽取一个单元的抽样方法。抽选方法:设总体单元数为N,要抽n个单元为样本,先计算抽样间隔k=N/n,在1到k之间抽取一个随机起点r,则被抽中单元的顺序位置是:r,r+k,r+2k,。,79,圆形系统抽样方法:当N不能被n整除时,用圆形系统抽样法可以避免出现样本量可能不一致的情况。把总体单元假想排列在一个圆上,取 k=N/n 最接近的整数,作为间隔,然后在1到N之间,抽取随机起点 r,则被抽中的单元顺序号为:r,r+k,r+2k,r+(n-1)k。如果第j个单元使得r+(

30、j-1)kN,则取单元r+(j-1)kN。如:N=55,n=9,就取k=6,在1到55之间取一个随机起点。例如r=42,则被抽中的单元是42,48,54,5,11,17,23,29和35。,80,2、系统抽样的优点(1)没有抽样框时可代替简单随机抽样方法简单;(2)不需要辅助的抽样框信息;(3)样本的分布比较好;估计值容易计算。3、系统抽样的缺点(1)若抽样间隔与总体的某种周期性变化一致,会得一个差的样本;(2)不使用辅助信息使抽样效率不高;(3)使用概念框时,不能预先知道样本量;(4)没有一个无偏的方差估计量;(5)当N不能被n整除时会得到样本量不同的样本。,81,4、对称等距抽样。系统抽样

31、的抽样误差与总体单元的排列顺序有关,当其排列的顺序与调查变量有关时,这时的估计值与起点的位置有关。采用对称等距抽样,是为了消除由于起点引起的偏差。塞蒂(Sethi)方法:r+2jk,2(j+1)kr+1,j=0,1,2,辛(Singh)方法:r+jk,(N-jk)r+1,j=0,1,2,,82,系统抽样示意图:普通直线等距抽样,起点r,塞蒂对称等距抽样,辛对称等距抽样,r+k,起点,对称点,起点,对称点,r+2k,r+3k,83,(三)与单元大小成比例的概率抽样1、定义:根据单元的大小不同,入样概率不同的一种不等概率抽样。如农场的大小不同,其抽选概率可以根据面积大小成比例,也可以按人数多少成比

32、例。用英文的字头简称为PPS抽样。2、优缺点:优点是当研究的变量与单元大小有关时,由于使用了辅助信息,可以提高抽样效率。但缺点是对抽样框需要有高质量的抽样框,成本较高;对于单元大小不相关的变量就不适用;估计量的抽样方差估计比较复杂。,84,3、抽样方法:随机有放回的PPS抽样和系统PPS抽样。两种方法都要先对总体中每个单元的大小进行累计,假定累计数为M,然后确定每个单元相应的代码范围。当采用随机有放回方法时,在1到M中抽取一个随机数r,r所在代码区间的所属单元即为入样单元,重复上述步骤,直到抽得n个单元为止;当采用系统PPS抽样时,需要计算一个抽样间隔k=M/n,然后,先在1到k中抽取一个随机

33、数r,则与代码rk,r+2k,所在范围相对应的单元为样本单元。,单元A,单元B,单元A比单元B大9倍,因此单元A的入样概率也要比单元B大9倍,85,(四)整群抽样 1、定义:由若干个有联系的基本单元组成的集合称为群,抽样时以群为抽样单元的抽样方法就称为整群抽样。整群抽样示意图:,黄色为总体红色为群白点为基本单元,86,2、整群抽样的优点:(1)能大大减低收集数据的费用;(2)当总体单元自然形成的群时,容易取得抽样框,抽样也更容易;(3)当群内单元差异大,而不同群之间的差异小时,可以提高效率。3、缺点:(1)若群内个单元有趋同性,效率将会降低;(2)通常无法预先知道总样本量,因为不知道群内有多少

34、单元;(3)方差估计比简单随机抽样更为复杂。,87,(五)分层抽样(1)定义:在抽样之前将总体分为同质的、互不重叠的若干子总体,也称为层。然后在每一个层独立地随机抽取样本。分层抽样示意图:,88,2、优点:(1)由于性质相同的单元分在同一层,层内差异缩小,可以提高抽样效率;(2)可以得到各层子总体的估计;(3)操作与管理方便;(4)能避免得到一个“差”的样本。3、缺点:(1)对抽样框的要求比较高,必须有分层的辅助信息;(2)收集或编制抽样框的费用比较高;(3)若调查变量与分层的变量不相关,效率可能降低;(4)估计值的计算比简单随机抽样复杂。,89,(六)多阶抽样 1、定义:它是由两个或更多个连

35、续的阶段抽取样本的方法。多阶抽样示意图:,总体,第一阶样本,最终样本,90,2、优点:(1)当群具有同质性时,多阶抽样的效率高于整群抽样;(2)样本的分布比简单随机抽样集中,采用面访可以节约时间和费用;(3)不需要整个总体单元的名录框,只要群的名录框和抽中群的单元名录框。3、缺点:(1)效率不如简单随机抽样;(2)通常不能提前知道最终的样本量;(3)调查的组织较整群抽样复杂;(4)估计值与抽样方差的计算较为复杂。,91,(七)多相抽样 1、定义:在同一个抽样框内,先抽一个大样本,收集基本的信息,然后在这个大样本中再抽一个子样本,收集调查的详细信息。多相抽样示意图:,。,。,。,第一相样本,第二

36、相样本,92,2、优点:(1)利用了第一相样本的信息,能显著提高估计值的精度;(2)适用于某些调查指标的数据收集费用特别高或给被调查者带来较重负担的情况。3、缺点:(1)整个调查的时间要长;(2)调查费用要比较高;(3)调查的组织比较复杂;(4)估计值和抽样误差的计算会相当复杂。,93,三、抽样设计中需要考虑的问题,(一)首先要考虑使用概率抽样还是非概率抽样。(二)采用概率抽样时,抽样方法的选择。要根据具备抽样框的情况、是否具有丰富的辅助信息、总体单元的特征和分布情况、是否要进行“域”估计以及调查费用等各种因素加以考虑。(三)重复性抽样调查需要考虑的问题,是否固定样本及样本的轮换等,94,本章

37、结束,继续往下,返回本章,另选章节,95,第六章 抽样估计,第一节 抽样估计的基本原理第二节 加权第三节 总体均值、比例及总量的简单估计第四节 辅助信息的使用第五节 调查估计量的抽样误差估计,6-1,6-2,6-3,6-4,6-5,96,6-1 抽样估计的基本原理,一、抽样估计是统计学中参数估计的应用,它是根据对样本的观察结果来估计推断总体的某些特征。二、抽样分布 指估计量的分布,如对总体均值的估计,以样本均值为估计量,每次抽取容量为n的样本,可以计算一个均值,如果把所有可能的样本都抽出来,其值的频数分布就是样本均值的次数分布。,97,三、大数定律和中心极限定理 大数定律是用样本估计总体的理论

38、基础。其直观含义是随机事件的规律性是在大量观察中才能显露出来,随着观察次数的增加,随机影响将相互抵消而使规律具有稳定的性质。如随着样本的增大样本均值会与总体均值接近。中心极限定理是进行区间估计的理论基础。它证明了不论总体服从什么分布,只要方差有限,在观察值足够多时,估计量的分布就趋向正态分布。,98,四、置信区间和置信概率之间的关系 估计分为点估计和区间估计。置信区间和置信概率之间的关系是区间估计的基础。它反映了对估计值被包含在一定范围内的概率。,置信上限,置信下限,99,6-2 加权,一、等概率加权 估计的第一步是给每个样本单元或回答单元赋予一个权数,设计权数是样本单元入样概率的倒数。如果是

39、等概率抽样,其设计权数相同,称作是自加权设计。在估计均值时只须用样本均值估计总体均值,在估计总值时仅仅需要将样本总值乘上一个倍数即可。,100,例1:(等概率抽样)一个由N=1000人的总体,划分为两层,第一层为男性,第二层为女性,从中抽取一个样本量为n=250的样本,抽样比将样本等比例分配给各层。两层的抽样比都等于 14.因此,,101,二、不等概率抽样设计加权 当采用不等概率抽样时,正确使用权数显得尤为重要。下面举一个例子:,各层权数是单元入样概率的倒数:,102,三、对无回答的权数调整 这里主要是指单元无回答的情况,最常用的办法是是假定回答的单元也代表无回答单元,此时无回答的设计权数需在

40、回答单元之间重新分配,通常的做法是乘以一个无回答调整因子。无回答调整因子=,因此,调整的权数为:,103,无回答权术调整的例子,各层的设计权数:Wd,1=5 Wd,2=2无回答调整因子:城市为n1nr,2=1.33 农村为n2nr,2=1.25最终权数:Wnr,1=51.33,Wnr,2=21.25=2.5,104,总体均值,6-3 总体均值、比例及总量的简单估计,数据类型,定量数据,定性数据,参数类型,总体总值,总体比例,一、数据类型和参数类型,105,二、等概率设计的估计 例:在总体为100个人中,等概率抽取20人的样本,在调查结果的数据文件中,每个单元的权术均为5,这20人中有8个是男性

41、,20人的年龄之和为720,要求计算总体中男性的比例和总体的平均年龄。解:如果忽略权数 采用权数计算其结果相同,106,三、不等概率抽样设计(例),107,表中的代码:层1平原,层2山区 农场类型:C作物,L家畜。于是可估计:家畜农场总数:家畜农场比例:家畜农场的总收入:,108,6-4 辅助信息的使用,一、事后分层 分层抽样可以提高抽样效率,但需要有分层的抽样框。但如果抽样框没有分层的信息,而能从其他方面获得分层信息,那么可以在数据收集以后进行事后分层。二、比率估计 当目标变量与一个已知的辅助变量之间存在相关关系时,采用比率估计也可以提高抽样效率。设目标变量Y,辅助变量X,样本比率r=xy,

42、则 或,109,6-5 调查估计量的抽样误差估计,一、抽样方差及其估计(一)影响抽样方差大小的因素:1、样本量与总体的大小 2、总体指标的变异程度 3、抽样设计 4、使用的估计量 5、无回答的情况,110,(二)抽样方差的估计 抽样方差是总体变异的函数 总体方差是:总体方差的估计是:抽样方差的公式是:,111,二、抽样误差的其他度量 1、估计量的标准差,也称标准误。它是抽样方差的平方根,通常用于估计量的区间估计。2、估计量的变异系数。它是估计值的标准差与估计值本身之比。当待估的某个指标的真值为0时,就不能用这个度量。,112,三、误差限与置信区间 这是抽样调查区间估计的方法,构造的理论依据是中

43、心极限定理。估计量和真值之间的误差:超过1.65倍标准差的概率为0.1(对应于90%的置信区间)超过1.96倍标准差的概率为0.05(对应于95%的置信区间),113,四、复杂抽样设计的方差估计 复杂抽样设计的方差估计相当困难,有一种方法是进行重复抽样。在一个样本量为n的复杂抽样中,改为抽取k个独立样本,每个样本的样本量为nk,对每一个样本计算所研究的指标值,然后加以平均。估计值和方差分别为:,114,本章结束,继续往下,返回本章,另选章节,115,第七章 样本量的确定,第一节 引言第二节 精度与样本量第三节 样本量的公式及确定样本量的其他限制第四节 分层抽样样本量的分配,7-1,7-3,7-

44、2,7-4,116,7-1 引言,一、为什么要确定样本量?由于样本量直接影响到调查的费用、完成调查所需要的时间、所需调查人员的数量以及其他一些现场操作的限制条件。二、影响样本量的因素:估计值要求的精度;提供的经费能支持多大的样本;调查的时间要求;需要和能招聘到多少调查人员等。,117,7-2 精度与样本量,一、精度的表示方法 1、用抽样方差或抽样误差来表示,方差越小精度越高;2、用置信度和误差限来表示,以t表示一个任意的估计量,为估计标准误,一定置信度的误差限为(tZ)其中 Z值与置信度相对应。,118,3、一定置信度下用相对数表示精度,其中:1为置信度或可靠性 1 称做估计精度,119,二、

45、确定精度需要考虑的因素 1、允许多大的误差限?2、是否需要对调查总体中的子总体进行估计?3、与调查估计值有关的抽样方差有多大?4、要在精度和费用之间进行平衡。,120,三、影响精度的因素 1、总体的变异程度 2、总体大小 3、样本设计和估计量 4、调查的回答率,121,7-3 样本量的公式及确定样本量的其他限制,一、简单随机抽样,估计均值。给定误差限为 e 和与置信水平相联系的Z,其所需样本量的公式为:,122,二、简单随机抽样,给定估计比例P的 精度为e。由于比例的方差 于是计算样本量的公式变为:,123,三、回答率小于100%时,计算样本量的步骤:1、计算初始样本量2、根据总体大小进行调整

46、3、采用设计效果进行调整4、根据无回答再次进行调整 r为预计回答率,124,四、确定样本量的一个例子,某杂志调查读者综合满意度的估计值,总体N=2500,要求误差限为0.1,置信 度为95%,使用简单随机抽样,预计回 答率为r=0.65,事先没有读者满意度的 估计值,则应抽取多少户做样本?,125,第一步:计算初始样本量 由于事先关于P的估计,为留有余地取P=0.5,初始样本量为:,第二步:根据总体大小调整,126,第三步:根据抽样设计效果来调整样本量 在这个例子中采用简单随机抽样,因此 设计效果B=1,第四步:根据无回答进行调整在这个例子中预计回答率为65%,因此,127,五、确定样本量时的

47、其他限制 1、费用。最终确定样本量必须考虑可获得的经费,得到经费的保证。2、时间。样本量还需要和允许的 时间保持一致。因此,最终样本量要在精度、费用和时间之间进行协调和平衡。,128,7-4 分层抽样样本量的分配一、分配准则 1、总样本量固定 先确定样本量n,然后一某种方式分 配到个层,设第h层的分配系数为 则:2、给定变异系数C和 计算样本总量,129,其公式为:其中:是第 h层的单元总数 是第h层的总体方差估计将 代入公式,就可以得到各层样本量的公式。,130,二、分层抽样样本分配方法 1、比例分配。即是与N成比例分配。该层的规模越大,分配到的样本单元也越多。即 2、与Y成比例分配。即与该

48、层总值与总体总值之间的比例大小来分配。,131,3、与N的平方根成比例分配。即分配系数等于该层总体大小的平方根与所有层总体大小平方根的总和之比:,4、与Y的平方根成比例分配。,132,5、最优分配。既还要考虑各层的费用大小和层内方差大小。,6、奈曼分配。是抽样方差达到最小的一种分配方法。,133,7、方差相等时的最优分配。,134,本章结束,继续往下,返回本章,另选章节,135,第八章 数据收集的实施,第一节 引言第二节 必要的公关工作第三节 调查前的准备第四节 数据收集过程第五节 调查过程及调查质量的控制,8-1,8-2,8-3,8-4,8-5,136,8-1 引言,数据收集是调查中收集每一

49、个被抽中的单元个体数据的过程。调查过程包括下列活动:1、与被调查者建立密切融洽的关系;2、熟悉并使用调查问卷;3、处理尴尬和敏感的情况;4、控制调查文件;5、对数据的预审核;6、对预审核中的问题进行回访;7、质量控制。,137,8-2 必要的公关工作,一、调查的宣传活动。大型调查应包括:1、通过报纸、电台等媒体发布公告;为媒体提供报道和发言人;2、在公共场所张贴海报;3、给有关部门写信,以获得支持。二、与被调查者建立联系 1、致被调查者的信;2、编写调查宣传手册和机构介绍手册。,138,8-3 调查前的准备,一、编写手册:包括访员手册和督导手册(一)访员手册。内容包括:1、一般信息(如调查的目

50、的等)2、简介(如何与被调查者接触等)3、问卷说明 4、问卷的审核与整理 5、单个样本单元的管理 6、作业管理 7、问题与答案,139,(二)督导手册。内容包括:1、招聘和培训调查人员 2、向调查人员分配任务 3、根据预定的质量目标、经费开支和时间进行监控 4、后勤服务 5、被调查者的安全和隐私保护 6、特殊情况下代替调查人员进行数据收集,140,二、调查人员的招聘和培训(一)调查人员的招聘。应明确调查人员的素质要求。教育程度、社交技能、组织能力和当地语言的流利程度都是需要考虑的重要因素。对于面访人员还要注意以下素质要求:1、诚实与认真;2、责任心要强;3、要有调查的兴趣和信心;4、对调查的对

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号