《抽样方法PPT课件.pptx》由会员分享,可在线阅读,更多相关《抽样方法PPT课件.pptx(49页珍藏版)》请在三一办公上搜索。
1、抽样方法,第三讲:抽样,1,问题1 江西省今年高考考生达35.5万,为了调查了解这些考生数学试题的得分情况,将他们所有的考试卷加以统计,那将是十分麻烦的,怎样才能既科学又客观地了解这些考生数学试题的得分情况呢?问题2 现有某灯泡厂生产的灯泡10000只,怎样才能了解这批灯泡的使用寿命呢?,数理统计的核心问题:如何根据样本的情况对总体的情况作出一种推断。,2,(一)概率抽样,简单随机抽样,系统抽样,分层抽样,整群抽样,多段抽样,3,简单随机抽样,4,一.简单随机抽样,1)抽签法,例:某系共有学生300人,系学生会打算采用简单随机抽样的方法,从中抽取出60人进行调查。为了保证抽样的科学性,他们先从
2、系办公室得到一份全系学生的名单,然后给名单中的每个学生都编上号(从001到300)。抽样框编好后,他们又用300张小纸条分别写上001,002, ,300。他们把这300张写好不同号码的小纸条放在一个盒子里,搅乱后,随便摸出60张小纸条。然后,他们按这60张小纸条上的号码找到总体名单上所对应的60位同学。这60位同学就构成了他们本次的样本。,一、简单随机抽样,3.常用方法:,优点:简单易学.,适用范围:总体元素不多时.,2)随机数表法,利用随机数表抽样的具体步骤:(1)先取得一份总体所有元素的名单(抽样框);(2)将总体中所有元素一一按顺序编号;(3)根据总体规模是几位数来确定从随机量表中选几
3、位数;(4)以总体规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;(5)根据总体规模的要求选择出足够的数码个数;(6)依据从随机数表中选出的数码,到抽样框中找出它所对应的元素。,一、简单随机抽样,3.常用方法:,适用范围:总体元素很多时.,编号,2)随机数表法,一、简单随机抽样,3.常用方法:,使用举例,一、简单随机抽样,3.常用方法:,2)随机数表法,从3000总体中抽取100人作为样本1 取得总体名单;2 从1到3000编号;3 从随机数表中选择4位数;具体选法是从随机数表中的任意一行和任意一列的某一个四位数开始,按照从左到右,或者从上到下的顺序,以3000为标准,对随机数表中依次出
4、现的每个4位数进行取舍:选出3000以内的,直至选够100个。,一、简单随机抽样,4.优缺点:,系统抽样,11,系统抽样又称等距抽样或机械抽样。它是把总体的单位进行编号排序后,再计算出某种间隔,然后按这一固定的间隔抽取个体的号码来组成样本的方法。,1.定义:,基本和简单随机抽样一样,计算公式也一样,需要完整的样本框,直接从总体中抽取个体,二、系统抽样,给总体中的每一个个体按顺序编号,即制定出抽样框。,1,计算出抽样间距。计算方法是用总体的规模除以样本的规模。假设总体规模为N,样本规模为n,那么抽样间距K就由下列公式导出: K=N/n(,2,在最前面的K个个体中,采用简单随机抽样的方法抽取一个个
5、体,记下这个个体的编号A,称为随机起点。,3,在抽样框中,自A开始,每隔K个个体抽取一个个体,即所抽取个个体编号分别为A,A+K,A+2K,A+(n-1)K。,4,将这n个个体合起来,就构成了该总体的一个样本。,5,二、系统抽样,3.举例:为了了解参加某种知识竞赛的1000名学生的成绩,应采用什么样的抽样方法恰当?,随机将这1000名学生编号为1,2,3,1000(比如可以利用准考证号)。,将总体按编号顺序平均分成50部分,可得抽样间距为:K=1000/50=20,每部分包含20个个体 。,在第一部分的个体编号1,2,20中,利用简单随机抽样抽取一个号码,比如是18 .,以18为起始号,每间隔
6、20抽取一个号码,这样就得到一个容量为50的样本:18,38,58, ,978,998.,二、系统抽样,4.优缺点:,2)缺点:系统抽样有一个十分重要的前提条件,就是总体中个体的排列,相对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。否则,系统抽样的结果将会产生极大的偏差。,1)优点:操作简便,实施时不容易出差错。,二、系统抽样,例:在一项有关二战士兵的经典研究中,研究人员从名册中每隔10个士兵抽出一个来进行研究。然而士兵的名册是以下列组织方式来编排的:首先是中士,接着是下士,其后才是二等兵;用一班一班的方式进行编排,每班10个人。因此名册中每隔10个就是中士。如此系统抽
7、样可能会得到一个完全是中士的样本,也可能会得到一个完全不含中士的样本。,分层抽样,16,例如:从一个企业抽取职工样本。先将职工划分成工人、干部、技术人员三种类型分别用简单随机抽样或系统抽样方法在各类型中抽取子样本将三个子样本合在一起,就构成了该企业的全体职工的样本。,三.分层抽样,2.优点,三.分层抽样,1)在不增加样本规模的情况下降低抽样误差,即提高抽样信度。注意前提是,所分的类有意义,即每个类内部数据的变异程度小,而类与类之间变异程度大。,2)非常便于了解总体内不同层次的情况。比如:在中国妇女社会地位调查中,将城市和乡镇分为两个类,以便于了解各自情况,并可以比较。,三.分层抽样,3.运用:
8、,考虑两个问题:1)分层的标准问题。通常采用的原则有:,按比例分层抽样指按各种类型或层次中的单位数目同总体单位数目间的比例来抽样,以确保得到一个与总体结构相同的样本。比如:某厂有工人600名,男工500人,女工100人。两类工人占总人数的比率分别为5/6和1/6。因此若要按比例抽取60人,应该分别从男工中抽取5/6*60=50人,从女工中抽取1/6*60=10人。这样样本就有非常好的代表性。,有些情况又不宜采用比例抽样。在总体类型或层次的单位数目太少时,往往采取不按比例抽样的方法,以便于对不同层次的子总体进行专门研究或进行比较。比如:从500男工中抽取30人,从100女工中抽取30人,则可以对
9、两类进行比较,不会影响推论统计时的条件。但用样本资料来推断总体时,需要先对各层数据资料加权处理,通过调整样本中各层的比例,使数据资料恢复到总体中各层实际的比例结构。,三.分层抽样,3.运用:,考虑两个问题:2)分层的比例问题。,三.分层抽样,从总体中逐个抽取,将总体均分成几部分,按事先确定的规则在各部分抽取,将总体分成几层,分层进行抽取,在起始部分抽样时采用简单随机抽样,各层抽样时采用简单随机抽样或系统抽样,总体中的个体数较少,总体中的个体数较多,总体由差异明显的几部分组成,等可能抽取;,不放回抽样;,三种抽样方法的比较,整群抽样,23,整群抽样是从总体中随机抽取一些小的群体,然后由所抽中的若
10、干个小群体内的所有元素构成调查的样本。即只要该群被选中,该群中的所用成员都进入随后的子样本。,对小群体的抽样可以采用简单随机抽样、系统抽样或分层抽样。,举例:某大学共有100个班,每班都是30名同学,总共3000名学生,现在要抽取300名。先从100个班中抽取10个班,则这10个班的全部学生就构成了样本。,抽样单位 不是单个的个体,而是成群的个体。,2.特点:,1.定义:,四、整群抽样,3.优缺点:,2)缺点:样本分布不广、样本对总体的代表性差,1)优点:简便易行、节省费用。,四、整群抽样,例:研究某市10万户家庭生活状况,抽取1000户。若要获得全市家庭的抽样框几乎是不可能的,因此无法进行简
11、单随机抽样和系统抽样。但整群抽样则轻而易举。假设全市有200个居委会,每个居委会有500户左右家庭。我们只要有这200个居委会的名单,按上述两种方法之一,抽取两个居委会,然后该两个居委会的所有家庭构成样本。,四、整群抽样,4.运用:,要与分层抽样的方法相区别。当总体由若干个自然界限或区分的子群(或类别、层次)所组成时,多段抽样,27,多段抽样又称多级抽样、分段抽样。它是按抽样元素的隶属关系或层次关系,把抽样过程分为几个阶段进行。 。,1.定义:,在社会研究中,当总体规模特别大时,或者总体范围分布非常广时,一般都要采用多段抽样。,具体做法:先从总体中抽几个大组,再在抽中的几个大组中抽取几个小组,
12、这样一层层抽下来,直到抽到基本的抽样元素为止。,五.多段抽样,五.多段抽样,研究总体是全国城市的独生子女。为了在有限的财力、人力及时间的情况下保证样本的代表性,研究者选择了以湖北省为代表。因为无论是在地理条件、社会经济文化发展水平,还是人口规模、家庭结构方面,湖北省都处于全国中等水平。在湖北省的范围内采取多段分层整群抽样的方式抽取样本。,首先抽取城市。按城市的规模,分别选取了武汉市、黄石市、沙市市、仙桃市、云梦县城关镇这五个市镇作为调查点。第二步抽取学校。在各个城市中,先请该市教育部门的同志按照重点、一般、较差的标准,各推荐1-3所小学。然后,研究者采取简单随机抽样的方式,从给出的各类小学中各
13、抽一所小学。第三步抽取年级。在每个城市所抽中的三所小学中,按随机抽样的方法,分别抽取高年级(4-6年级)和低年级(1-3年级)各一个。第四步抽取班级。在每个抽中的年级中,随机抽取一个整班。根据上述抽样程序,总共抽取5个市镇15所小学1-6年级30个班的学生1342人。,3.实例:,风笑天的独生子女研究(1988年),五.多段抽样,4.优缺点,适用于总体范围特别大,对象的层次特别多的社会研究。由于它不需要总体的全部名单,各阶段的抽样单位数一般较少,因而抽样比较容易进行。,由于每级抽样时都会产生误差,故这种抽样方法的误差较大。,五.多段抽样,优点,缺点,当研究者以家庭作为分析单位,以入户访谈的方法
14、收集资料,试图研究城乡家庭的结构、关系、生活方式或其他内容时,往往采用多段抽样的方法从某一市县中抽取区,再从区中抽取街道,从街道中抽取居委会,然后从居委会中抽取家庭户,最后从家庭户中抽取一位成年人作为访谈对象。从所抽中的每户家庭中抽取一个成年人,构成访谈对象的抽样过程。,户内抽样,1.定义:,户内抽样,“选择表”的形式:,户内抽样,“选择表”的形式:,户内抽样,“选择表”的形式:,户内抽样,“选择表”的形式:,01,02,1,3,调查员对每户家庭中的成年人进行排序和编号:男性在前、女性在后;年纪大的在前,年龄小的在后,即最年长的男性排第一,次年长的男性排第二,以此类推;最年长的女性排在最年幼的
15、男性后面,其他女性也按年龄从大到小排列。最终得到一个家庭内成人排序表。,按照调查表的编号找出标号相同的那种“选择表”,根据家庭人口数目从“选择表”中查出该个体的序号,最后对这一序号的那个家庭成员进行访谈。,具体做法:,0.5 秒延迟符,无义,可删除.,户内抽样,户内抽样,4.基本原理,3.目的,2.定义,1.前提,多段抽样中,其实暗含了了一个假定:即每一个阶段抽样时,其元素的规模是相同的。只有这样才能使每一个个体都有相同的入选机会。但实际上,多段抽样中面临着的各个阶段元素规模并不一样。如每个街道规模包含的居委会户数不同。使得每个元素被抽中的概率实际上不同。,PPS抽样是一种“概率与元素的规模大
16、小成比例的抽样”,简称PPS抽样。,克服多段抽样中存在的由于单位的规模不同而带来的不同单位中个体被抽中的概率不同。,根据每一群的规模分配样本,用阶段性的不等概率换取最终的、总体的等概率。,PPS抽样,PPS抽样,PPS抽样,(二)非概率抽样,偶遇抽样,判断抽样,定额抽样,雪球抽样,42,非概率抽样不是按照概率均等的原则,而是根据人们的主观经验或其它条件来提取样本。因而,样本的代表性较小,误差有时相当大。这种方法一般只是探索性研究中采用。,43,1.定义:,偶遇抽样又称方便抽样或自然抽样,是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或者仅仅选择那样离得最近的、最容易找到
17、的人作为调查对象。“街头拦人”法即为一例。,2.优缺点:,优点:方便省力。缺点:不能保证总体中每一个成员都有同等的被抽中的概率,样本的代表性差,有很大的偶然性。,一、偶遇抽样,二、判断抽样,三、定额抽样,三、定额抽样,一种极特殊的抽样方法。经常用于实地研究的非概率抽样方法。每个被访问的人都可能被要求介绍其他的人来参与访谈。所谓滚雪球,就是根据既有研究对象的建议找出其他研究对象的累积过程。,调查费用大大减少,然而这种成本的节约是以调查质量的降低为代价的。,(1)可能产生偏误,不能保证代表性。(2)如果被调查者不愿意提供人员来接受调查,那么这种方法就会受阻。,1 如果想要了解一个社区长期以来招募人
18、手的方式,可以先访问新近招募来的人员,询问他们是由谁介绍进这个组织的。然后再访问被提到的人,询问他们是由谁介绍加入的。2 研究一个组织松散的政治团体时,可以向一位组织成员询问,看他认为谁是这一组织中最有影响力的人。然后再对这些人进行访问,询问他们谁最有影响力。3 退休老人生活。在早晨锻炼的公园、街道,或在菜场。,四、雪球抽样,感谢您的观看,2017,Your content to play here, or through your copy, paste in this box, and select only the text. Your content to play here, or through your copy, paste in this box, and select only the text.,49,