自考社会研究方法第五章.ppt

上传人:sccc 文档编号:5994498 上传时间:2023-09-12 格式:PPT 页数:28 大小:523.02KB
返回 下载 相关 举报
自考社会研究方法第五章.ppt_第1页
第1页 / 共28页
自考社会研究方法第五章.ppt_第2页
第2页 / 共28页
自考社会研究方法第五章.ppt_第3页
第3页 / 共28页
自考社会研究方法第五章.ppt_第4页
第4页 / 共28页
自考社会研究方法第五章.ppt_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《自考社会研究方法第五章.ppt》由会员分享,可在线阅读,更多相关《自考社会研究方法第五章.ppt(28页珍藏版)》请在三一办公上搜索。

1、第五章抽样,第一节 抽样的概念和程序第二节 非概率抽样第三节 概率抽样第四节 样本规模,第一节 抽样的概念与程序,抽样方法是选择研究对象的方法或程序。一、为什么要抽样在社会研究中,研究者经常从一个规模很大的研究对象中,选出一部分作为研究对象,这个选取过程就是抽样。进行抽样的原因:考虑研究成本和研究可行性,抽样方法可分为两类;1、非概率抽样:主要是依据研究者的主观意愿、判断或是否方便等因素来选取对象;2、概率抽样:按照随机原则来选取对象,完全不带有研究者的主观因素。,二、抽样的有关术语1、总体、样本和元素每一个具体的调查对象被称为元素;全体研究对象被称为总体;样本则代表一组元素,即部分研究对象,

2、不能独立于总体而存在。总体可以进一步划分为研究总体和目标总体。研究总体是在理论上明确界定的元素的集合体;目标总体有时也称为调查总体,是实际抽取样本的元素集合体,它是排除了研究总体中一些特例后的总体。样本中元素个数与总体中元素个数的比率,即样本规模与总体规模的比率称为抽样比率。如在总体为500人中抽取100人进行研究,则抽样比例为100/500=20%。,2、抽样框和抽样单元研究者在实际抽样(特别是概论抽样)时,经常是先找到一份近似涵盖所有总体元素的名单,然后从中抽取部分元素,这份名单被称为抽样框。如要调查某大学本科毕业生的就业状况,则抽样框就是该大学全体毕业生的花名册。抽样框中的总体元素又被称

3、为抽样单元。有时抽样单元与分析单位是相同的,但在较大范围的抽样中,可能有多个层次的抽样单元。,3、参数值、统计值和抽样误差总体的情况或特征是未知的,由参数值来描述,如某个城市中吸烟人口的平均年龄;样本的情况或特征则是已知的,由统计值来描述,如通过样本调查资料统计所得的被调查者的平均年龄。参数值与统计值之间的差异就是抽样误差。差异越大,抽样误差就越大;差异越小,抽样误差就越小。,抽样误差是衡量样本代表性大小的标准,一般说来,它主要取决于总体的异质性程度和样本规模。如果样本规模相同,总体异质性程度越高,抽样误差越大,样本代表性越低;如果总体异质性程度相同,样本规模越大,抽样误差越小,样本代表性越高

4、。注意:抽样中因违反抽样规则产生的人为误差,如抄写、资料录入和计算中的人为失误,并不是抽样误差。,三、抽样的步骤1、设计抽样方案界定总体,对总体的范围和特征加以明确的说明,特别是要明确目标总体的范围和特征;介绍抽样框的具体内容,即给目标总体下一个操作化定义;确定样本所含个体数目,即样本规模的大小;根据不同的目标总体,选择合适的抽样方法。2、抽取样本抽取样本是指抽样人员按照抽样方案中选定的抽样方法,从抽样框中实际抽取总体元素,构成样本的过程。抽样方法不同,实际抽样工作可以安排在实地调查前,也可以与实地调查同步。前者适合总体规模较小,事先有比较完整抽样框的情况;而后者则是比较适合总体规模较大,抽样

5、采取多阶段方式进行的情况。,3、评估样本评估样本是指样本抽出后,对样本的代表性和各类误差情况的检验和评估,目的是为了防止由于样本偏差过大而导致对总体推断的失败。评估样本的方法是先找出一些能够反映总体特征的资料与同类指标的样本统计值进行比较。,抽样技术,非概率抽样,概率抽样,方便抽样,判断抽样,配额抽样,滚雪球抽样,简单随机抽样,系统抽样,分层抽样,整群抽样,多级抽样,其他抽样技术,按比例,不按比例,第二节 非概率抽样,一、方便抽样(又叫偶遇抽样)方便抽样又称偶遇抽样,是指研究者使用对自己最为便利的方法来选取样本。这种方法很容易产生系统误差,样本代表性很差。因此,在使用时要特别小心,总体的情况越

6、复杂,方便抽样的效果就越差。举例说明:电视台、电台和报纸记者的“街头拦人”调查,采用的就是方便抽样。为了调查某市的交通情况,研究者到离他们最近的公共汽车站,把当时正在那里等车的人选作调查对象。其他类似的偶遇抽样还有:在街口拦住过往行人进行调查;在图书馆阅览室对当时正在阅读的读者进行调查;在商店门口、展览大厅、电影院等公众场所向进出往来的顾客、观众进行的调查;报社要求读者剪下报纸刊登的问卷,填写完后寄回去;老师以他所教的班级的学生作为调查样本的调查等等。,二、配额抽样配额抽样,是根据某些参数值,确定不同总体类别中的样本配额比例,然后按比例在各类别中进行方便抽样。如研究者想用配额抽样的方法抽取一个

7、40人的样本,首先决定用性别和年龄作为决定样本配额的参数值,通过资料发现,总体中男女各占50%,30岁以下、3060岁之间和60岁以上的比例为25%、50%和25%。建立样本配额矩阵表格,配额抽样的逻辑是通过样本配额,使样本结构尽可能与总体结构保持一致,对总体进行克隆。有两点不足:1、为了不偏离总体,配额矩阵中的数字必须十分准确,要做到这一点,就必须掌握总体的最新资料,但这并不容易做到。举例如下:1936年美国的盖洛普使用配额抽样的方法成功地预测了总统当选人,而同样的方法却也造成了他在1948年的错误预测。就像概率抽样一样,配额抽样所强调的也是样本的代表性,虽说二者所达到目的的方法不一样。,2

8、、尽管配额方法是一种改进,但最后抽样仍由调查员根据方便原则执行,他们从某些特定的矩阵格子中选择样本时,有很大的随意性。在这种情况下,调查员可能为了图方便而去找那些比较好调查的人。正是由于最后采用了方便抽样,使配额抽样与分层抽样具有本质的区别,后者依据随机原则抽样,排除了主观因素。,三、判断抽样(又叫立意抽样)判断抽样,又称立意抽样,是指研究者根据其研究的目的或专家的判断来选取样本。在这种抽样中,样本能否满足研究目的的要求,是否能反映总体情况,很大程度上依赖于研究者的主观判断,对研究者个人的研究素质有较高的要求。判断抽样经常被用于以下三种研究场景:1、研究者用判断抽样来选择特别能提供信息的独特个

9、案;2、研究者用判断抽样来选取很难以接近的特殊人群;3、研究者用判断抽样来选取某种特殊个案类型,以便进行深入探究。,四、雪球抽样(又称网络抽样)雪球抽样又称网络抽样,是一种根据已有研究对象的介绍,不断辨识和找出其他研究对象的累积抽样方法。雪球抽样特别适合用来对成员难以找到的总体进行抽样;也可以用雪球抽样对具有一定网络联系的总体进行抽样。雪球抽样理想的结果是“雪球”滚到了大于所需样本规模的人群,这时可在某个时点中止“雪球”的滚动。如对吸毒人群进行研究,一般先找到几个吸毒者,然后通过他们的介绍找到新的吸毒者。,第三节 概率抽样,概率抽样是实现由样本推断总体的最佳方法,概率抽样是按照随机原则进行的抽

10、样,因此又常被称为随机抽样。它是以随机原则为前提,因此不仅能使研究者在选取要素时避免各种形式的系统误差,还能估计出抽样误差的大小。,一、简单随机抽样(纯随机抽样)简单随机抽样,也称纯随机抽样,是指研究者严格按照随机原则来抽取样本,排除任何事先设定的模式,每一个对象的抽取都是相互独立的。随机原则意味着选取对象过程中,一方面要排除任何事先设定的模式使每一个对象被选中的概率都相等;另一方面,对象之间相互独立,任何一个对象是否入选样本,与其他对象无关,每一个对象的抽取都是相互独立的,是一种随机事件。采用随机抽样的原因:首先,排除了研究者对样本的主观决定,可以避免研究者自觉或不自觉的偏见。其次,随机抽样

11、时以概率理论为基础的,因此,可以计算参数值和抽样误差。概率抽样和等概率抽样不一样:概率抽样指总体中每个元素被抽中的概率可以相等也可以不等;随机抽样是一种等概率抽样。,操作方法:1、直接抽选法:即先建立抽样框,然后再从抽样框中选取元素构成样本。根据被抽中的元素是否放回总体,简单随机抽样又可分为放回和不放回两种。2、抽签法:先将研究总体中的每一个单位统一编号,使每一个单位都有一个号,然后将每一个号作成一个卡号并且混合均匀,最后从中随机抽取卡片,直到抽到额定的数目为止。这种方法在一般日常生活中用得比较多。3、随机数字法:先取得一份总体所有元素的名单,将总体中所有元素一一按顺序编号,根据总体规模是几位

12、数来确定从随机数表中选几位数码;然后以总体的规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;根据样本规模的要求选择出足够的数码个数;依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素。,用随机数表产生随机数,需要完成以几个步骤:(1)确定选出的随机数的位数。(2)决定从 5 位数组中选择哪几位数字。(3)确定在表中选择数字的顺序。(4)确定开始选择的 5 位数组起点。(5)处理大于总体规模或重复的随机数。,简单随机抽样的缺陷:1、在抽样前,必须编制出一份完整的抽样框,并给每个元素编号。因此,当总体规模较大时,采取这种抽样方法工作量较大。2、简单随机抽样的样本在总体中比较分散,这使

13、得实地访问工作难以实施,较为花费时间、人力、财力。,二、系统抽样(又称机械抽样)系统抽样又称机械抽样或等距抽样,抽样效果同简单随机抽样相同,但操作起来却容易得多。系统抽样的具体步骤是:(1)确定开始抽取人选的位置。(2)计算抽样距离。抽样距离是由总体大小和样本大小决定的,假设总体所含个体数为N,样本所含个体数为n,则抽样距离应为K=N/n。如在一个900人的总体中,抽取150个人本,那么K=900/150=6(3)确定抽取元素的方法。如在900人的总体中抽取150人为样本,从548开始,间距为6,那么样本就为554,560等距抽样的缺陷:如果抽样框是以与抽样间隔一致的循环方式排列的,则等距抽样

14、会由于周期性问题,使样本出现偏差。因此,如果对于周期性排列的总体,要么采用简单随机抽样,要么重新随机排列总体元素。,三、分层抽样分层抽样是指研究者先把总体分为若干个同质的层,然后用简单随机或系统抽样方法,从每层中抽取样本元素。当样本规模不变的情况下,总体异质性越高,样本状态偏离总体状态的机会就越大。在这种情况下,如果采用简单随机抽样或系统抽样,就不一定得到真实的反映。采用分层的方法,将一个异质性总体分为若干个同质性的层,从而减少抽样误差,增大代表性。除此以外,当研究者感兴趣的某个类别在总体中比例很小,简单随机或系统抽样很有可能会漏掉该类别的元素时,研究者就会使用分层抽样。,分层抽样需解决的问题

15、:1、确定分层变量的原则。在把总体分为同质的层时,需要依据一定的总体特征,用来描述这些总体特征的变量被称为分层变量,而分层变量的值就是总体的层次。通常采用原则有:以所要分析和研究的主要变量或相关的变量作为分层的标准;以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量;以那些已有明显层次区分的变量作为分层变量。2、确定样本比例。大多数情况下,分层抽样采用等比例方式进行,要求从各层抽取元素的数量在样本中的比例,与该层在总体中的比例相等。所以,一般要事先了解各层在总体中的比例。,3、确定分层抽样方法。a、将所有总体元素按分层变量进行分层,并计算各层在总体中的比例。如果是等比

16、例分层抽样,则直接将总体比例视为样本比例;如果采用不等比例抽样,则需对样本比例做一定的调整,最后按确定的样本比例抽出适量的样本元素。b、适用于等比例分层抽样。先将所有总体元素按分层变量分层,然后将各层总体元素连续排列,最后对连续排列的总体元素进行等距抽样。,四、多段整群抽样多段整群抽样可以解决两个问题:1、在很多情况下,无法获得抽样所需要的总体元素名单(抽样框)。2、样本分布过于分散,实地调查的成本极其昂贵。“多段”指的是按总体内的层级关系,把抽样分成几个阶段来进行。整群抽样就是以群为抽样单位的抽样方法。实际进行多段整群抽样,需要解决以下几个问题:1、要决定是多抽群,还是多抽群中的元素。为了尽

17、可能地减少抽样误差,在多段整群抽样的设计中,必须先决定样本中抽取的群的数量和每个群中被抽取的元素的数量。结论:在经费允许时,尽可能多抽取一些群。2、处理群大小不等的情况。解决办法:第一段让每个群被抽中的概率与规模成正比,第二段从入选的群中以等概率抽取相同数量的元素,让元素被抽中的概率与群规模成反比,即概率比例或PPS抽样方法。,多阶段抽样,多阶段抽样的具体做法是:先从总体中随机抽取若干大群,然后再从这几个大群内抽取几个小群,这样一层层抽下来,直至抽到最基本的抽样元素为止。实例 为了调查某市青年工人的状况,采用多阶段抽样。首先,以企业为单位抽样,即以全市所有企业为抽样框,从中随机抽取一部分企业;

18、其次,在抽中的企业中,以车间为抽样单位,即从全部车间中抽取若干车间;最后,再在抽中的车间内抽取青年工人。,第四节 样本规模,一、影响样本规模的因素如果不考虑经费问题,那么样本规模主要取决于抽样精度和总体标准差。一般来说,抽样希望达到的精确度越高,总体的异质性程度越大,所需的样本规模就越大。样本规模主要取决于以下因素:(1)抽样精度:是指抽样中希望达到的精确度,其实就是能够容忍的抽样误差e,一般而言,研究中能够容忍的抽样误差越小,即要求的抽样精度越高,则样本规模也应该越大;反之亦然。(2)总体标准差0是反映总体元素之间异质性程度的指标:一般而言,在给定抽样精度之后,总体异质性程度越小,所需样本规模也就越小,反之亦然。,二、样本规模的估算方法n=t为置信度所对应的临界值,p为总体的成数或百分比,e为抽样误差书例:p107,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号