《《调查方法》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《调查方法》PPT课件.ppt(51页珍藏版)》请在三一办公上搜索。
1、第六章 社会调查方法,报表制度,普 查,重点调查,典型调查,抽样调查,制度化的经常性调查,专门组织调查,全面调查,非全面调查,第一节 统计报表制度、普查、重点调查、典型调查,统计报表制度,由政府部门组织,采用统一的表格,自上而下布置,自下而上报告。,任务:,搜集国民经济和社会发展基本情况的资料,为制订国民经济和社会发展计划和检查计划执行情况服务。,优点:,精心周密设计、高度统一、规范。回收率高,内容相对稳定,便于资料积累、对比。层层上报、逐级汇总,可以满足各部门需要。,特点:,普查,特点:,工作量大,时间性强,需要大量人力和财力。,任务:,搜集重要的国情国力和资源状况的全面资料,为政府制定规划
2、、方针政策提供依据。,方式:,建立专门机构,配备专门人员调查。,利用基层单位原始记录和核算资料发表调查。,原则:,规定统一的标准时点。,规定统一的普查期限。,规定调查的项目和指标。,重点调查,特点:,在总体中选择个别或部分重点单位进行调查。,任务:,及时了解总体基本情况,为主管部门指导工作服务。,方式:,一次性调查;专门设计和备配人员现场调查。,重点单位指在总体中有举足轻重地位的单位,在总体中占有绝大比重。,经常性调查;同报表制度结合,用统计报表调查。,典型调查,特点:,在全面分析的基础上,有意识地选择代表性的典型单位进行现场调查。,任务:,为研究某种特殊的社会经济问题,搜集详细的第一手资料,
3、借以认识事物的本质特征、因果关系、变化趋势。为理论和政策性问题研究提供依据。,作用:,适宜于研究处于萌芽状态事物和倾向性问题;,适宜于分析事物的类型,它们之间的差别和关系。,方法:,“解剖麻雀;划类选典;抓两头”。,第二节 抽样调查,一.抽样调查的概念 抽样调查就是从研究对象的总体中选择一部分代表加以调查研究,然后用所得的结果推论和说明总体特征,这种由总体中选取一部分代表的过程就是抽样,所选取的这一部分代表就称为样本.选取样本的方法分为两大类:一类是依据研究任务的要求和对调查对象的分析,主观地,有意识地在研究对象的总体中进行选择.叫非概率抽样.另一类是依据概率理论,按照随机原则选择样本,完全不
4、带调查者的主观意识,称为概率抽样.,二 抽样调查的特点,抽样调查与普查相比具有如下特点:1.调查费用较低.2.速度快3.应用范围广4.可获得内容丰富的资料5.准确性高,三.抽样调查的理论依据,部分包含于整体之中,部分与整体有同样的特征,现象,关系及过程.抽样调查的成功与否首先要求所选取的样本能够代表总体,既所抽取出来的样本的总特征能够再现总体的结构.怎样能够保证呢?概率抽样.,第三节 抽样的术语与程序,一,抽样的基本术语1.总体(population)总体通常与构成它的元素(element)共同定义;总体是构成它的所有元素的集合而元素则是构成总体的最基本单位.总体中所包含元素的数目通常用大写字
5、母 N 表示.2.样本(Sample)样本就是从总体中按一定方式抽取出的一部分元素的集合。如从某省总数为12.8万的大学生总体中,按一定方式抽取出1000名大学生进行调查,这1000名大学生就构成该总体的一个样本.样本中的元素数目通常用小写字母 n 表示.,3.抽样(Sampling),抽样是指从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素的过程,或者说,抽样是从总体中按一定方式选择或抽取样本的过程.4参数值(Parameter)也称总体值,它是关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现.在统计中最常见的参数值时总体某一变量的平均数.,5.
6、统计值(Statistic)统计值也称为样本值,它是关于样本中某一变量的综合描述.或者说是样本中所有元素的某种特征的综合数量表现.统计值是从样本中计算出来的,它是相应的参数值的估计量.比如样本平均数就是总体平均数的估计量.按照习惯,参数值通常以希腊字母表示,而统计值通常以罗马字母表示.参数值和统计值之间的区别是:参数值是固定不变的,唯一的,通常是未知的,而统计值是变化的,既对于同一个总体来说,不同样本的统计值是有差别的,对于任一特定样本来说统计值是已知的,可计算的,从统计值推论参数值,正是社会调查的一项重要内容.,二,抽样的基本程序,在总体中抽取一个样本时,总要尽可能地使样本具有代表性.如果样
7、本的统计值近似总体的参数值,则这个样本可以称为一个代表性样本.(representative sample).问题是怎样做才可以减少抽样的误差,求得一个有代表性的样本呢?这就要依据下面的四个步骤:,1.界定总体,根据调查的目的要求,确定调查对象的范围,包括时间,地点,和人物,例如我们要研究政法大学生生活态度,可以界定总体的范围如下,2006年政法学院大学大一至大四的在校本科大学生.总体的定义越清楚越好,由样本所得的研究结果,原则上只能推论到这个所界定总体范围.,2,确定抽样框,将总体按照抽样单位划分为各个部分,这些部分还必须互不重叠,又能合成总体,然后将其毫无遗漏地编制成表,即抽样框,在复杂的
8、多阶段的抽样中,相应的各个阶段有多个抽样框 在应用之前必须审核其完整性和准确性,例如,有无遗漏,有无列于名单上但实际上不存在的个案,有没有重复或不属于研究范围的等等.,3,设计和选取样本,设计包含两个部分:确定样本的数量.决定样本的大小时,必须同时考虑抽样误差和研究代价.如,抽样框中有三万大学生,不可能全部调查,要抽取多少个案来进行研究呢,在正常的情况下,样本越大就越有代表性,但是样本越大,所需的研究代价就越大.选择抽样的具体方法 抽样方法有许多种,不同的方法产生的样本代表性是不同的.,4,对样本进行评估,在样本抽出后,需采用各种调查方法对样本进行实际调查以收集资料,最后对收集到的资料进行计算
9、并将结果推论和说明总体.在开始调查之前要对样本进行评估,评估的目的是初步检查样本的代表性,以免由于前面步骤中的失误使样本偏差太大,评估样本可以采取收集若干容易得到的资料作为总体和样本之间的比较方法.如果样本与总体的情况相似,这样的样本就有代表性,如果两者资料相差甚多,则表明前面的抽样步骤有问题要检查,修正.,第四节 概率抽样,概率抽样是使总体内的所有个体具有相同的被抽入样本的概率.这样的样本被称为随机样本.随机抽样是由等概率地随机抽取的个体所组成.由于是以概率为依据,所以能避免抽样过程中的人为误差.保证样本的代表性.在各种抽样方式中,随机样本的代表性最高.概率抽样可以分为简单随机抽样,等距抽样
10、,分层抽样,整群抽样,以及多阶段抽样.,一.简单随机抽样(Simple Random Sampling),1.内涵 简单随机抽样又称为纯随机抽样,它是最基本的概率抽样,其他概率抽样都可以看成是由他派生出来的.简单随机抽样对总体中的所有个体按完全符合随机原则的特定方法抽取样本,既抽样时不进行任何分组,排列,使总体中的任何个体都同样有被抽取的平等机会,对总体中的所有分子一视同仁,毫无例外.,2.随机原则的实现,抽签法,是将总体中每个单位的编号写在外形完全一致的签上,将其搅拌均匀,从中任意抽选,签上的号码所对应的单位就是样本单位。,随机数表法,将总体中每个单位编上号码,然后使用随机数表,查出所要抽取
11、的调查单位。,计算机模拟法,是将随机数字编制为程序存储在计算机中,需要时将总体中各单位编上号码,启用随机数字发生器输出随机数字,然后从总体中找到相应总体单位形成样本。,随机数表:,表的制作:把写有0,1,。9的小卡片放在碗里,每次拿一张记录后放回,需要N个数字就抽N次,这样就构成了一组随机数。,表的使用:1.按照总体的数目决定要抽取的位数,如9241个同学中选300个同学,则需要抽取的是4位数的表。2.决定从哪里开始抽取和以什么方向运动,以及以什么方式构成这几个数。,二,等距抽样(Systematic Sampling),也叫系统抽样或机械抽样.它是简单随机抽样的一个变体,具体做法是:1.将总
12、量的所有个体按一定顺序排列.2.计算抽样距离.距离是由总体数目与样本数目决定的.如果总体数为N,样本数为n,则抽样距离应是:N K=n 3.在K个个体中,用完全随机的方法抽取一个个体,设其所在的位置的序号为a 4.自 a 开始,每隔K个抽取一个体,依次抽取的位置序号为a.,a+k.a+2k,.,a+(n-1)k。,如果K=10,就从01-10号中抽签决定一个号码作为起点,假定为05,则05,15,25,.,95,等距抽样与简单随机抽样一样,要对总体中所有个体进行顺序编号,要收集总体名单,但是,有时也可以不这样做.只要总体的排列顺序是随机的,就可依已排好的次序从中等距抽取样本,如用尺子,这样工作
13、量较少,易于实施.等距抽样与简单随机抽样相比,样本分布更为均匀,抽样误差更小,是一种更广泛应用的抽样方法.注意:等距抽样是以总体的随机排列为前提的,如果总体的排列出现有规律的分布时,会使等距抽样产生极大的误差.降低样本的代表性.等距抽样最适用于同质性较高的总体,当总体内个体类别之间的数目悬殊过大时,样本的代表性可能较差.在这种情况下应采用另一种抽样方法.,三,分层随机抽样(Stratified Sampling),1.分层抽样的内涵:分层随机抽样是将总体依照某一种或某几种特性分为几个子总体,每个子总体称为一层,然后从每一层中抽取一个子样本,将这些子样本合在一起即为总体的样本.2.分层抽样种类:
14、按各层子样本容量的确定方式分层抽样一般分为按比例分层抽样和异比例分层抽样.,分类,随机抽样,总体,样本,子群,按比例分层抽样,按比例分层抽样要求各层子样本在总体样本中所占比例与本层在总体中所占的比例相同.异比例分层抽样 比例不相同。非等概率抽样的后期统计一般要做特殊处理.以抽样单位的何种特性作为分层抽样的标准?一般是选择与调查中要测变量高度相关的变量,即对所要研究的变量有很大影响的因素作为分层变量.分层抽样是用于总体内个体数目较多,结构比较复杂,内部差异较大的情况.,四,整群随机抽样(Cluster Sampling),又称为聚类抽样.是将总体按照某种标准化分为一些子群体,每个子群体作为一个抽
15、样单位,用随机的办法从中抽取若干子群,将抽出的子群中所有个体合在一起作为总体的样本.整群抽样与分层抽样有相似之处,第一步都是按某种标准将总体划分为一些子群.但是分层抽样是在所有子群中均抽取一个子样本,作为总体样本的一部分,而整群抽样是抽取若干子群,并将抽出的子群中全部个体作为样本,总体样本只分布在几个群中.所以整群抽样的分群标准要求群间异质性低,群内异质性高.适用于界定不清的总体.,1.优点:1.简化抽样过程,降低费用 2.可扩大抽样规模 3.更容易取得抽样框2.缺点:样本分布面不广,代表性较差,尤其是当子群间异质性较强时,影响代表性更明显。,五,多阶段抽样(Multistage Samlpi
16、ng),在整群抽样中,当子群数和子群内部个体数目较多,而彼此间的差异性不太大时,常常采用更加经济的方法,既不将样本子群中的所有个体作为样本,而是再从中用随机抽样的方法抽出最终样本.因最终样本的获取经过两次抽样,我们称之为二阶段抽样,同样地可进行三阶段,四阶段,即多阶段的抽样.它通常在第一阶段使用严格的随机抽样方法,而从第二阶段起使用概率比例抽样,即根据每一群所含个体的多少分配样本名额.,例如,某市有23个区,共714万人,从中抽取1000人的样本,将区作为初级抽样单位,每区人数不等,把每区人数的号码范围列出,东区是1-120000号,西区是120001-270000号.一直排到7140000号
17、.从这些号码中用随机数字表确定10个号码,则这10个号码所落入的区即为调查区.如抽中340000号,它落在南区,则南区为调查区,从这10个调查区中,每区再随机抽取100人就构成最终样本.多阶段抽样特别适用于调查范围大,单位多,情况复杂的调查对象,但多阶段抽样由于在每一阶段抽样是都会产生误差,因此经多阶段抽样得到的样本的误差也相应增大.这是它的不足之处.,第五节.非概率抽样,概率抽样与非概率抽样 概率抽样能够排除调查者的主观影响,抽选出较有代表性的样本,并能够知道和控制抽样误差的大小,但是在很多情况下,这种严格的随机抽样很难进行.有时调查的目的仅仅是对问题初步探索,获得研究的线索和提出假设,而不
18、是有样本推论总体,在这种情况下一般代之以非概率抽样.,非概率抽样的特点,非概率抽样,操作方便,省钱省力,统计上也比概率抽样简单,而且能对调查总体和调查对象有较好的了解,抽样也可获得较大的成功.但是非概率抽样由于排除不了调查者的主观影响,无法说明样本是否体现了总体的结构,所以,将非概率抽样的结论推论到总体时要极其慎重,否则就容易出现以偏概全的错误.非概率抽样主要有偶遇抽样,主观抽样,定额抽样,滚雪球抽样等.,一,偶遇抽样(就近抽样、方便抽样、自然抽样)(Accidental or Convenience Sampling),定义:是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对
19、象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象。举例:为了调查某市的交通情况,研究者到离他们最近的公共汽车站,把当时正在那里等车的人选作调查对象。其他类似的偶遇抽样还有:在街口拦住过往行人进行调查;在图书馆阅览室对当时正在阅读的读者进行调查;在商店门口、展览大厅、电影院等公众场所向进出往来的顾客、观众进行的调查;利用报刊杂志向读者进行调查;老师以他所教的班级的学生作为调查样本的调查等等。,与随机抽样的相似点:都排除了主观因素的影响,纯粹依靠客观机遇来抽取对象。与随机抽样的不同点:偶遇抽样没有保证使总体中的每一个成员都具有同等的被抽中的概率。那些最先被碰到的、最容易见到的、最方便找的
20、对象具有比其他对象大得多得机会被我们抽中。优缺点:优点方便省力;缺点样本的代表性差,有很大的偶然性,我们不能依赖偶遇抽样得到的样本来推论总体。,二 目标式和判断式抽样(Judgmental or Purposive Sampling)(主观抽样、立意抽样):定义:调查者根据研究的目标和自己主观的分析,来选择和确定调查对象的方法。研究者依据主观判断选取可以代表总体的个体作为样本。样本代表性取决于研究者对总体的了解程度和判断能力。它是“有目的的”选择样本。比如,在问卷设计阶段,为检验问题设计的是否得当,常有意的选择一些观点差异悬殊的人作为调查对象。又如,研究者专找那些偏离总体平均水平者作为调查对象
21、,其目的是研究什么使他们发生偏离。它的作用在于发现问题,提出假设,而不在于对总体作出概括。多用于无法确定总体边界、或总体规模小、调查所涉及的范围较窄,或调查时间、人力等条件有限而难以进行大规模抽样的情况。在编制物价指数时,有关产品项目的选择和样本地区的决定等,常采用判断抽样。,优点:可以充分发挥研究人员的主观能动作用,特别是当研究者对研究的总体情况比较熟悉,研究者的分析判断能力较强、研究方法与技术十分熟练、研究的经验比较丰富时,采用这种方法往往十分方便。缺点:样本的代表性难以判断,不能推论。,三,定额抽样(Quota Sampling),又称作配额抽样,它与分层随机抽样相似,也是按调查对象的某
22、种属性或特征将总体中所有个体分成若干类或层,然后在各层中抽样,样本中个层所占的比例与它们在总体中所占的比例一样.但是不同的是分层抽样中各层子样本是随机抽取的,而定额抽样中各层的子样本是非随机抽取的.定额抽样是以代表总体为目的的.因此必须对总体的性质有充分的了解.但是,一方面分层时只能考虑众多属性中的几种,另一方面,新的变化信息又不易得到,因此样本的代表性要受影响.,1.配额的框架必须十分精确。为了做到这点,必须掌握最新的资料,但这是十分困难的。2.从某些特定的格子中选择样本时,可能会存在偏误。,配额抽样方法的缺陷:,四 滚雪球抽样:(Snowball Sampling)定义:当我们无法了解总体
23、情况时,可以从总体中的少数成员入手,对他们进行调查,向他们询问还知道哪些符合条件的人;再去找那些人并询问他们知道的人。如同滚雪球一样,我们可以找到越来越多具有相同性质的群体成员。优点:滚雪球抽样是在特定总体的成员难以找的时最适合的一种抽样方法。缺点:如果总体不大,有时用不了几次就会接近饱和状况,即后来访问的人再介绍的都是已经访问过的人。,其他的非概率抽样方法:志愿者抽样:从与调查目标有关的志愿者中抽取样本,如医疗实验,媒体座谈讨论节目等只能从志愿者中抽选参与者。修正的概率抽样:是概率抽样与非概率抽样的结合。在多阶段概率抽样中,前几个阶段均采用概率抽样,在最后阶段采用非概率抽样的方法。空间抽样:
24、针对一个变动的总体。最重要的是在同一个时间对整个总体进行抽样,以防止它的组成经历太大的变化。,一个著名案例:Vs Gallup1936年Roosevelt选举,机构 样本 途径 预测数据The Literary Digest 1千万 电话簿俱乐部名单 43Gallup 5万 随机样本 56%选举结果 62,选择性误差和不回答误差导致的失败,敏感性问题的调查方法:,敏感性问题指与个人或者单位的隐私不方便向外界透露的问题。如,考试作弊;赌博;偷漏税;吸毒;公款吃喝,同性恋问题等。又分为属性敏感(如作弊,吸毒,同性恋)和数量敏感(贪污多少,偷漏税数量等)。,你考试作弊吗?你公司偷了多少税?你吸毒吗?
25、,随机化回答技术(Randomized Response Technique,简称RRT),指在调查中使用特定的随机化方法,使得被调查者以预定的概率P回答敏感性问题。该方法最大的目的是为被调查者保守秘密,获得信任。,如调查学生是否作弊问题,设计外形一样的卡片M个,其中M1个上面有“你是否作弊”,另外的有其他的问题,把这M个卡片放在一个盒子里,回答者回答完成后再放回盒子。P=m1/m,样本规模又称为样本容量,它指的是样本中所含个案的多少,确定样本规模也是每一项具体的社会研究所必须解决的问题之一.,第六节 样本规模,统计学与社会研究的样本,统计学中通常以30为界,把样本分为大样本和小样本,之所以这
26、样区分,是因为当样本规模大于30时,其平均值的分布将接近于正态分布,从而许多统计学的公式就可以运用,也可以用样本的资料对总体进行推论,但是,需要注意的是,30各个安的样本对于社会研究来说却常常是不够的,统计学中的大样本与社会研究中的大样本并不是一回事.根据一些社会研究专家的看法,社会研究中的样本规模至少不能少于100个个案,一.样本规模,样本规模也称样本容量它是指样本所含个体数量的多少.,二.抽样误差与样本规模,1.抽样误差的概念 抽样误差就是用样本值去估计总体值时所出现的误差.2.在抽样调查中,抽样误差主要可分为两类:.调查误差也称为登记误差或工作误差,指在调查过程中,由于记录,整理资料工作
27、中出现的差错,被调查者回答问题与真实情况不符所造成的误差,问题本身含糊等出现的差错.代表性误差.指因样本不能代表总体所造成的误差.,3.代表性误差也有两类:,随机误差,它是由于样本范围与总体范围的不同产生的误差,一般说来部分和全体之间总是有差别的 系统误差 它主要是由于抽样方法的不科学所致.因此如果采用严格的概率抽样就可以消除样本的系统误差,这时误差的主要来源就是随机误差.,4.样本规模与抽样误差密切相关,对于样本的代表性,不同研究有不同的要求,这种要求一般用精确度来衡量,某一研究要求的精确度就是这项研究能允许的样本估计量有多大的误差,社会研究常选用的误差界限是5%.样本越小与总体差异越大,误
28、差越大.样本的大小根据研究所要求的精确度而定,对样本的精确度要求越高所允许的误差则越小,样本就要越大,反之亦然.在一定的精确度要求下,总体越大则样本也应越大,但是当总体增大到一定规模后,样本规模基本上不再增加.,三.总体的异质性程度与抽样误差,如果总体是由一种在各方毫无差异的个体组成的,则无论这总体有多大,也只要选其一个个体就可以代表整个总体了.同样,如果总体内个体间差异不大,选用少量的个体就可以代表总体,如士兵,如中小学生.但是如果是内部个体间差异很大的总体就需要一个较大的样本,才能保证总体中各类个体均有自己的代表.由此可见,在研究所要求的精确度决定后,样本大小的确定不仅与总体规模有关,还与
29、总体的异质程度有关.,四.抽样方式和客观条件,在同样精确度要求下,样本容量还因抽样方式的不同而不同,每一种概率抽样方法都有自己的计算样本容量的公式,因此,在选定抽样方法后,需分别考察和计算这一方法所需的样本数.确定样本规模还要考虑现有的人力,物力,财力,时间等条件.有时由于这些条件的限制或抽样操作上的困难,必须缩小样本,这就要做出选择,是减少样本规模而达不到所要求的精确度?还是增加调查力量,以保证样本的精确度,或者干脆放弃这项调查.,五.经验确定的样本规模,一般说来社会调查的样本数都在50-5000之间,例如美国的民意测验,即使调查总体近一亿人,它的样本数也很少超过3000人.要精确地确定样本数目需要有概率论和数理统计的知识,需要进行复杂的计算,但是,单纯的计算不可能考虑到各种复杂的社会因素.因此精确的抽样调查不仅需要抽样专家,也需要专业研究人员的指导,在一般的社会调查研究中,实际上并不要求很高的精确度,调查人员一般是凭经验确定样本数目的大致范围.,