现代社会调查方法之抽样.ppt

上传人:牧羊曲112 文档编号:5790851 上传时间:2023-08-20 格式:PPT 页数:87 大小:1.92MB
返回 下载 相关 举报
现代社会调查方法之抽样.ppt_第1页
第1页 / 共87页
现代社会调查方法之抽样.ppt_第2页
第2页 / 共87页
现代社会调查方法之抽样.ppt_第3页
第3页 / 共87页
现代社会调查方法之抽样.ppt_第4页
第4页 / 共87页
现代社会调查方法之抽样.ppt_第5页
第5页 / 共87页
点击查看更多>>
资源描述

《现代社会调查方法之抽样.ppt》由会员分享,可在线阅读,更多相关《现代社会调查方法之抽样.ppt(87页珍藏版)》请在三一办公上搜索。

1、章 第四章 抽样 抽样,目的要求,掌握概率抽样的原理、程序与方法;掌握抽样误差的概念与测量方法;熟悉非概率抽样方法与样本规模;了解抽样的意义;,目录,抽样的意义与作用,1,概率抽样的原理与程序,2,概率抽样方法,3,非概率抽样方法,4,样本规模与抽样误差,5,以上现象是否说明了这样一个道理:我们可以通过对部分的观察来推论总体的情况。,“管中窥豹,可见一斑”“一叶知秋”,在日常生活当中所熟知的抽样有哪些?,一、抽样的意义与作用,(一)抽样的意义 人们在研究某个自然现象或社会现象时,往往会遇到不方便、不可能或不必要对所有的对象作调查的情况,于是从中抽取一部分对象作调查,这就是抽样.复杂的社会现象

2、有限的研究资源 抽样主要涉及和处理有关总体与部分之间的关系问题。抽样作为人们从部分认识整体这一过程的关键环节,其基本作用是向人们提供一种实现“由部分认识总体”这一目标的途径和手段。,抽样,(二)抽样的作用 抽样是社会研究的主要内容之一,也是社会调查的一个重要步骤。它与研究目的及研究内容紧密相关。它直接关系到资料的收集、整理与分析。它还涉及到整个研究的费用以及应用的范围。抽样是否科学,直接关系到研究的成败,一、抽样的意义与作用,(三)抽样的相关概念抽样(sampling):从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素的过程。总体(population):构成它的所有元素的集

3、合例:四川省应届毕业生择业倾向调查。通常用N表示样本(sample)从总体中按一定方式抽取出的一部分元素的集合。例:12.8万名应届毕业生中抽取1000名大学生。通常用n表示,一、抽样的意义与作用,抽样单位(sampling unit)一次直接的抽样所使用的基本单位。抽样单位与构成总体的元素有时是相同有时又不同。如12.8万大学生,当以1000名大学生作为样本时?当以40个班级作为样本时?抽样框(sampling frame)抽样范围,指一次直接抽样时总体中所有抽样单位的名单。例:从一所中学的全体学生中抽取200名学生作为调查样本。从一所中学的所有班级中抽取20个班级作为调查样本。参数值(pa

4、rameter)是对总体中某一变量的综合描述,或总体中所有元素某些特征的综合数量表现。最常见的参数值是总体某一变量的平均值。参数值只有对总体中的每一个元素进行调查或测量才能得到。例:某市待业青年平均年龄,某工厂工人的平均收入。,一、抽样的意义与作用,统计值(statistic)是对样本中某一变量的综合描述,或样本中所有元素某些特征的综合数量表现。根据样本计算出来的关于样本变量的数量表现。统计值是从样本中计算出来的,它是相应的参数值的估计值。参数值:确定的、唯一的、未知的。统计值:变化的。置信度(confidence level)总体参数值落在样本统计值某一区间内的概率,或者说,是总体参数值落在

5、样本统计值某一区间内的把握性程度。反映的是样本的可靠性程度。如置信水平为95%,则表示总体参数值落在样本统计值某一区间的概率为95%。置信区间(confidence intevalue)上述“某一区间”,就是置信区间。指在一定置信水平下,样本统计值与总体参数值之间的误差范围。与误差范围成正比。,一、抽样的意义与作用,依据概率论的基本原理,按照等概率原则进行的抽样,能够避免抽样过程中的人为误差,保证样本的代表性,依据研究者的主观意愿、判断或是否方便等因素来抽取对象,往往产生较大误差,难以保证样本的代表性。,(四)抽样的类型根据抽取对象的具体方式分类:,概率抽样,非概率抽样,一、抽样的意义与作用,

6、抽样方法,概率抽样,非概率抽样,简单随机抽样系统抽样分层抽样整群抽样多段抽样,偶遇抽样判断抽样定额抽样雪球抽样,(一)概率抽样的基本原理1.无意识抽样导致的偏差方便获取的样本:易得,但缺乏代表性;例如:如何获取由100个学生构成的样本访问者的偏好影响样本的代表性;例如:有意回避具有某些特(“酷”、“冷”)的受访者抽样的地点影响样本的代表性 例如:图书馆门口访问,二、概率抽样的原理与程序,(一)概率抽样的基本原理2.同质性和异质性 买100支单价为1元的铅笔,在结账的时候是用乘法还是加法?买10支单价为1元的铅笔、20支单价为2元的签字笔和30支单价为5元的钢笔,结账时该如何计算?10*1+20

7、+2+30*5100铅笔具有同质性,60支笔具有异质性(价格不同),二、概率抽样的原理与程序,是否可以这样认为?对于具有同质性的总体,我们只需要了解其中一个成员,就能知道整个群体的情况;对于具有异质性总体,我们往往需要根据总体内部的不同特征选取一定数量具有代表性的样本来推论总体的情况。,例:西南医科大学在校生网购情况分析研究总体:西南医科大学在校大一、大二、大三学生是否具有同质性?否,不同经济状况、消费观念会导致不同的网购行为采用抽样调查:选取100个具有代表性的样本来推论西南医科大学在校生的网购情况。,什么样的样本才能代表总体的情况?从年级分类:大一、大二、大三从学院分类:药学院、法学院、公

8、共卫生学院。从性别分类:男、女采用概率抽样抽取的样本为什么能代表总体的情况?,(二)抽样分布 抽样分布是根据概率的原则而成立的理论分布,它显示出:从一个总体中不断抽取样本时,各种可能出现的样本统计值的分布情况。,二、概率抽样的原理与程序,当样本容量为2个时,根据组合公式计算总共可以抽取45个不同的样本,这些样本的平均数范围从6.5年(当)到14.5年,其中会产生一些相同的平均数,比如6-14,7-13,8-12,9-11这四个样本的平均数都是10年。,当样本容量为3个时,可以抽取120个样本,这些样本的平均数范围从7年到14年,其中相同的平均数更多。,当样本容量继续增大时(越来越接近总体的1/

9、2时),样本平均数的分布会进一步发生变化。趋势是:平均数的范围将逐步缩小(即分布图的底部越来越窄);相同的平均数会相应增多;全部平均数的分布向总体平均数集中的趋势也会越来越明显。,根据“中心极限定理”,当n(抽取的样本量)足够大时(通常假定大于30),无论总体的分布如何,其样本平均数所构成的分布都趋于正态分布。,根据概论统计理论,正态根部曲线下的任何部分的面积都可以用数学方法推算。这意味着,任何两个数值之间的样本平均数次数所占的比例都是可以求得的。,约有68%的样本平均数在“”这两个数值的范围内约有95.46%的样本统计值落在总体参数值正负两个标准差范围内。,在实际应用中,人们更多的是采用以下

10、几个数字:有90%落在 之间;有95%落在 之间;如果从反面来考虑这一结论,可以得出以下推论:对于任何一次随机抽样来说,其样本的统计值落在总体参数值正负1.65个标准差之间的概率是90%。只要我们采用的是随机抽样的方法,就可以根据抽样分布,用样本的数值来推论总体的情况。,界定总体:对从中抽取样本的总体范围与界限作明确的界定 制定抽样框:依据已经明确界定的总体范围,收集总体中全部抽样单位的名单,并通过对名单进行统一编号来建立起供抽样使用的抽样框 决定抽样方案:选择抽样方法,确定样本规模 实际抽取样本:1.先抽好样本,再调查 2.一边抽样一边调查(样本规模较大时)评估样本质量:对样本的质量、代表性

11、、偏差等进行初步的检验和衡量,二、概率抽样的原理与程序,(三)抽样的一般程序,例:西南医科大学在校生学习倦怠的原因及影响因素的调查界定总体:所有西南医科大学在校学生制定抽样框:假定有3万名在校生,则需要搜集所有3万名学生名单,进行统一编号来建立起供抽样使用的抽样框。决定抽样方案:根据实际的情况,选择合适的抽样方法,并确定样本规模。如选择简单随机抽样,样本规模为200人。抽取样本:评估样本质量:对样本的代表性、偏差等进行检验,在实践上可行,可行性,目的性,最有利于研究资料的获取和最符合研究的目的,与研究的可得资源相适应,能够从样本自身计算出有效的估计值或抽样变动的近似值,(四)抽样设计的原则,美

12、国抽样专家科什(kish)教授提出一个优秀的抽样设计应该满足的四条标准:,经济性,可测性,目的性,可行性,四条标准之间存在着一定的制约关系,甚至相互冲突。增加可测性加大样本容量增加资源经济性减弱实际的抽样设计就是研究者在这四条标准中进行取舍和保持平衡的过程,三、概率抽样的方法,偶遇抽样判断抽样定额抽样雪球抽样,简单随机抽系统多层抽样分层抽样整群抽样多段抽样,概率抽样,非概率抽样,抽样类型,概率抽样是按照概率原理进行的,它要求样本具有随机性,即总体中每一个成员都有被抽中的可能性。不同形式的概率抽样对选择涉及调查研究问题的性质、良好的抽样框的获得、调查研究经费的多少、资料收集方法等因素有不同的要求

13、。,三、概率抽样的方法,三、概率抽样的方法,(一)简单随机抽样:又称纯随机抽样,是按照等概率原则直接从含有N个元素的总体中抽取n个元素组成样本(Nn),常用的办法是抽签。概率抽样的最基本形式。,要点:它要求被抽取样本的总体的个体数有限它是从总体中逐个进行抽取它是一种不放回抽样它是一种等概率抽样,方法:1.总体较少:搅拌抽签;2.总体较多:用随机数表,抽签法(抓阄法)将总体中的所有个体(共N个)编号(号码可以从1到N),并把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出1 个号签,连续抽取n次,就得到一个容量

14、为n的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。,三、概率抽样的方法,随机数表法随机数表是统计工作者用计算机生成的随机数,保证表中的每个位置上的数字是等可能出现的用随机数表进行抽样的步骤:将总体中个体编号;选定开始的数字;获取样本号码用随机数表抽取样本,可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。因此并不是唯一的由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的,三、概率抽样的方法,简单随机抽样方法的优缺点优点:可能产生代表性样本缺点:不容易做抽样元素多,编号难必须能够接触到被选中的个体搅拌均匀不易,三、概率抽样

15、的方法,(二)系统抽样 定义:等距抽样或机械抽样,将总体的元素编号排序后,按照固定的间隔抽取个体组成样本的方法。,系统抽样的具体步骤1、给总体中的每一个元素按顺序编上号码,制定出抽样框。2、计算出抽样时间距,方法是用总体的规模除以样本的规模。K(抽样间隔)=N(总体规模)/n(样本规模)3、在最前面的K个元素中,采用简单随机抽样的方法抽取一个元素,记下这个元素的编号(假设为A),A称为随机起点。4、在抽样框中,自A开始,每隔K个元素抽取一个元素,即所抽元素编号为A,A+K,A+2K,A+(n-1)K。5、将这n个元素合起来,就构成了该总体的一个样本。,三、概率抽样的方法,系统抽样例子:某校30

16、00名新生中抽取100名样本。3000/100=30每隔30人取1名。起始值是2号,下一个就是32号。依次类推。,注意1:系统抽样的一个十分重要的前提条件,是总体中个体的排列,相对于研究的变量来说是随机的,即不存在某种与研究变量相关的规则分布。否则,系统抽样的结果将会产生极大的偏差。例如:从总体2000户家庭的社区中,抽取一个50户家庭的样本进行调查消费状况的调查,而这2000户家庭的名单是按每个家庭总收入的多少,由高到低的顺序排列的。初始号码为3和38,所抽样本家庭平均收入有很大区别,消费状况也有很大区别。注意2:元素排列的周期性可能导致抽样的重大偏差!例如:每个班级内的50名学生按照学生成

17、绩的高低来排序,抽样间距为50,每个班抽取一名学生组成样本,初始号码为2或48号,所抽样本的平均成绩差别很大,系统抽样的优缺点,优点:(1)简单易操作(2)当对总体结构有一定了解时,充分利用已有的信息对总体中的个体进行排队后再抽样,可提高抽样效率(3)当总体中的个体存在一种自然编号时,采用系统抽样比较方便缺点:(4)当在不了解样本总体的情况下(如性别差异,经济基础,个人喜好,天气因素等等),所抽出的样本可能会有一定的偏差。,三、概率抽样的方法,(三)分层抽样(stratified sampling)又称类型抽样,它是先将总体中的所有元素按某种特征或标志(如性别、年龄、地域等)划分成若干类型或层

18、次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取一个子样本,最后将子样本合起来构成样本。,三、概率抽样的方法,分层抽样的步骤,1.总体与样本容量确定抽取的比例。2.由分层情况,确定各层抽取的样本数。3.各层的抽取数之和应等于样本容量。4.对于不能取整的数,求其近似值。,三、概率抽样的方法,分层抽样举例 一个单位的职工有500人,其中不到35岁的有125人,3549岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?解:抽取人数与职工总数的比是100:5001:5,则各年龄段(层)的职工人数依次是125:2

19、80:9525:56:19,然后分别在各年龄段(层)运用简单随机抽样方法抽取。答:在分层抽样时,不到35岁、3549岁、50岁以上的三个年龄段分别抽取25人、56人和19人。,三、概率抽样的方法,优点:在不增加样本规模的前提下降低抽样误差,提高抽样精度,增大代表性。便于了解总体内不同层次的情况,以及对总体中的不同层次进行单独研究或者进行比较。缺点:对抽样框的要求比较高,必须有分层的辅助信息;收集或编制抽样框的费用比较高;若调查变量与分层的变量不相关,效率可能降低;,三、概率抽样的方法,分层的标准问题以分析的主要变量或相关变量作为分层的标准保证各层内部同质性强,各层之间异质性强以已有明显层次区分

20、的变量作为分层变量,三种抽样方法的比较,简单随机抽样最简单,但是也是相对复杂的。系统抽样操作简单,在有充分的总体信息的前提下,估计精度比随机抽样高,且操作、简单。分层抽样由于已经利用了总体信息,因此估计精度也比随机简单抽样要高。,三、概率抽样的方法,(四)整群抽样(cluster sampling)将总体按某种标准划分为一些子群体,每个子群为一个抽样单位,用随机方法从中抽若干子群,将抽出的子群中的所有个体结合起来构成样本。,整群抽样例子:大学有100个班,每班30人,现在抽300人,怎么抽样?抽10个班。某城市10万户,要抽取1000户,怎么办?社区200个,社区户数500。选2个社区。,三、

21、概率抽样的方法,整群抽样特点:抽样单位不是单个的个体,而是成群的个体 优缺点:优点:不需要详细的所有元素的名单,简单,费用低 缺点:样本的分布面不广,代表性相对较差 整群抽样和分层抽样的比较:子群间异质性强,群内同质性强分层抽样 子群间同质性强,群内异质性强整群抽样,三、概率抽样的方法,(五)多阶段抽样(multidstage sampling)按抽样元素的隶属关系或层次关系,把抽样分为几个阶段进行。在社会调查中,当总体的规模特别大,或者总体分布的范围特别广时,研究者一般采取多段抽样的方法来抽取样本。例1:大学院系班级学生 例2:城市区街道居委会 家庭个人,如调查“泸州市青年工人收入状况”,首

22、先以企业为单位抽样,即以全市的企业为抽样框,从中随机抽取一部分企业(5);然后在抽中的企业中以车间为抽样单位抽样,即从全部车间中抽取若干个车间(20):最后,在抽中的车间内抽取青年工人(1000人),五种概率抽样方法比较,“四川医科大学在校学生食堂满意度调查”,总共有学生10000人,其中男生6000人,女生4000人;学院22个,大一2000人,大二3000人,大三3000人,大四2000人。抽取1000个样本。简单随机抽样方法:先根据10000个学生的名单制作抽样框,然后根据随机数表或抓阄方式抽取1000名学生。系统抽样:先根据10000个学生的名单制作抽样框计算抽样间距:10000/10

23、00=10在10000个学生中随机抽取一个学生:例如33号在抽样框中从33号开始每隔10个学生抽取一个样本:43、53、63、73.,分层抽样首先把10000名学生分为男生、女生两个部分,男生6000人、女生4000人,比例为3:2采用随机抽样或系统抽样方法,按照每部分抽取个体数:该部分的个体总数=样本容量:总体中的个体数原则,从女生中抽取400人,男生中抽取600人,组成样本。或将10000名学生分为大一、大二、大三、大四四个部分,大一2000人,大二3000人,大三3000人,大四2000人采用随机抽样或系统抽样方法,按照每部分抽取个体数:该部分的个体总数=样本容量:总体中的个体数原则,大

24、一中抽取200人,大二中抽取300人,大三抽取300人,大四中抽取200人,组成样本。,整群抽样把全校22个学院作为抽样框,从22个学院中采用简单随机抽样、分层抽样或系统抽样的方法抽取3个学院,将3个学院中所有的学生所有调查样本。多阶段抽样把全校2个各学院作为抽样框,从22个学院中采用简单随机抽样、分层抽样或系统抽样的方法抽取5个学院;从5个学院的所有班级作为抽样框(如80个班级),从80个班级中采用简单随机抽样、分层抽样或系统抽样的方法抽取个40班级;以40个班级中的所有学生作为抽样框,采用简单随机抽样、分层抽样或系统抽样的方法抽取1000名学生作为调查样本;,三、概率抽样的方法,(六)PP

25、S抽样是一种常用的不等概率抽样方法,叫做“概率与元素的规模大小成比例的抽样”。多段抽样中,其实暗含了一个假定:即每一个阶段抽样时,其元素的规模是相同的。比如第一阶段抽取学校时,暗含了每个学校的规模相同。在这样的假定下,采取上述几种随机抽样的方法,最终每名学生被抽中的概率相等。,但现实生活中,每一个学校包含的学生人数不同,因而按照上述多段抽样的方法来抽取样本时,最终每名学生被抽中的概率实际上是不同的。从100所学校中抽取10所学校(规模不一样大)假设甲学校比较大,有2万名学生,乙学校比较小,只有3千名学生。那么当二者在第一阶段都被抽中后,第二阶段分别从他们中抽取500名学生,甲学校学生被抽中的概

26、率为:(10/100)*(500/20000)=1/400乙学校学生被抽中的概率为:(10/100)*(500/30000)=1/600PPS抽样原理:以阶段性的不等概率换取最终的、总体的等概率。,做法(以二阶段为例):1、在第一阶段,每个群按照其规模(其所含元素的数量)被给予大小不等的抽取概率。2、到了第二阶段,从每个抽中的群中都抽取同样多的元素(也是不等概率的)。正是这一大一小,平衡了由于群的规模带来的概率差异。,公 式,每一个元素被抽中的概率,所抽取的群数,总体的规模,群的规模,群的规模,平均每个群中所要抽取的元素,PPS的做法已经排除了群的规模这一影响因素第一个分子与第二个分母相互约掉

27、了每一个元素的被选中概率变成了:(所抽取的群数*每个群中所抽取的元素数目)/总体的规模。这实际上就是样本规模除以总体规模。,PPS的具体操作方法:1、在确定的总体内,给每个抽样单位按序编号,并且写出它们的规模;2、累计相加每个抽样单位包含的单位数,并根据累计相加结果确定每个单位的号码范围;3、采用随机数表的方法或等距抽样的方法选择号码,号码所对应的单位入选第一阶段样本;4、在被抽取的单位中,按照抽样元素的多少进行第二阶段抽样。,用PPS方法抽取第一阶段样本举例,(七)户内抽样 当研究者以家庭作为分析单位,以入户进行结构式访谈的方法收集资料时,往往采取多阶段的抽样方法,市(县)镇(乡)村(街)居

28、委会(居民组)家庭家庭成员。以家庭为单位时,从入选家庭中抽取一个成年人构成访谈对象的抽样方法。方法:科什选择法(kish)如:关于开展农村土地集中化生产调查研究,具体做法:1.调查表编号:将调查问卷编号为A、B1、B2、C、D、E1、E2、F八种,每种表的数目分别占调查问卷总数的1/6、1/12、1/12、1/6、1/6、1/12、1/12、1/6。2.印制选择卡:印制若干套(1套八种)”选择卡“发给调查员,每人1套。3.给抽中家庭每个成年人按照男性在前、年龄大的在前的方法进行编号并排序。4.根据调查表上的编号找出编号相同的那种“选择表”查出中选个体的序号,进行调查。,Kish 选择表,四、非

29、概率抽样方法,(一)偶遇抽样 定义:方便抽样或自然抽样,指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为对象,或者仅仅选择那些离得最近、最容易找到的人作为对象。适用范围可用于经常性的市场调查;可用于正式市场调查之前 的试验调查;任意调查适用于同质总体。,优点:方便、灵活,简便易行,及时取得所需资料,节约时间和费用成本低缺点:样本的代表性差、有很大的偶然性。例:1.在商场、码头等公共场所调查 2.街头拦截调查 3.报刊的读者调查,四、非概率抽样方法,(二)判断抽样:也叫立意抽样,研究者根据自己的主观判断来抽选样本,分为印象判断抽样和经验判断抽样。印象判断抽样:纯粹凭研究者的主观印象抽样

30、经验判断抽样:根据以往经验和对调查对象的了解抽样注意的问题:判断抽样的关键是抽样标准的确立,这种方法的运用与研究者本人的因素比如理论修养、实践经验以及对调查对象的熟悉程度有关,适用场合:多用于无法确定总体边界、或总体规模小、调查所涉及的范围较窄,或调查时间、人力等条件有限而难以进行大规模抽样的情况。优点:可以充分发挥研究人员的主观能动作用。样本是按照调查人员的需要来选定的,所以较好地满足了特殊的调查需要。缺点:如果调查人员在选取样本时主观判断出现偏差,则判断抽样极易发生较大的抽样误差。样本的代表性难以判断,不能推论。,四、非概率抽样方法,(三)定额抽样 又称配额抽样,先根据总体各个组成部分所包

31、含的抽样单位的比例分配样本数额,然后由调查者在各个组成部分内根据配额的多少采用偶遇抽样或判断抽样方法抽取样本。,定额抽样 例:某高校有2000名学生,其中男生占60,女生占40;文科学生和理科学生各占50;一年级学生占40、二年级、三年级、四年级学牛分别占30、20和10。现在要用定额抽样方法依上述3个变数抽取一个规模为100人的样本。依据总体的构成和样本规模,我们可得到下列定额表,四、非概率抽样方法,定额抽样与分层抽样的区别在于,定额抽样最后抽取样本时所采用的方法是非随机抽样。配额抽样的优点 适用于设计调查者对总体的有关特征具有一定的了解而样本数较多的情况下,实际上,配额抽样属于先“分层”(

32、事先确定每层的样本量)再“判断”(在每层中以判断抽样的方法选取抽样个体);费用不高,易于实施,能满足总体比例的要求。配额抽样的缺点 容易掩盖不可忽略的偏差,四、非概率抽样方法,(四)滚雪球抽样 当无法了解总体时,可以从总体中少数成员入手,对他们进行调查,并进一步询问还知道哪些符合条件的再进一步询问。例:对球迷、戏迷的调查缺点:同质性较强,四、非概率抽样方法,非随机抽样抽选样本的质量,主要取决于调查者的主观状况和各种偶然因素。优点:简单、易行,可以获得对调查对象的大致了解。缺点:代表性差,调查资料不能从数量上推断总体。,五、样本规模与抽样误差,(一)样本规模:又称样本容量,就是指样本所含个案的数

33、量。确定样本规模也是每一项具体的社会研究所必须解决的问题之一.统计学与社会研究的样本统计学中通常以30为界,把样本分为大样本和小样本.社会研究中的样本规模至少不能少于100个个案,五、样本规模与抽样误差,确定样本规模需要考虑的因素:1.推断的把握性与精确度;2.总体的规模;3.总体的异质性程度;4.应答率;5.研究者所拥有的资源。,五、样本规模与抽样误差,1.推断的把握性与精确度 置信度:把握性 置信区间:精确度 一般地说,在其他条件不变的情况下,置信度越高,即推断的可靠程度越高,所要求的样本规模就越大;置信区间越小,即样本值与总体值之间误差范围越小,所要求的样本规模就越大。,五、样本规模与抽

34、样误差,不同允许误差水平所需的最少样本量,五、样本规模与抽样误差,2.总体的规模 在置信度和抽样误差不变的条件下,样本规模是随着总体规模的扩大而扩大,但样本占总体的比重却不断缩小。当总体规模大到一定程度时(例如100万),样本规模的增加对抽样误差的影响就微乎其微。例如:美国大选的民意调查中样本通常不超过3000,五、样本规模与抽样误差,总体规模与样本规模的关系(置信度95%,抽样误差3%),五、样本规模与抽样误差,3.总体的异质性程度:异质性程度越高,所需样本规模越大例如做淘宝店主研究时候,发了六万份问卷,只回收到了2%的问卷,应答率很低,但是淘宝店主是一类同质性很高的总体,如果异质性稍高一些调查也就失败了。,五、样本规模与抽样误差,4.应答率。应答率的多少直接影响到获得数据样本的多少,进而影响到测量效率,应答率高通常就会采用合理的样本量,应达率低通常要增大样本量。,五、样本规模与抽样误差,5.研究者所拥有的资源。可用资源多为了保守起见,通常会对样本量做保守估计,既尽可能增大样本量,反之亦然。,五、样本规模与抽样误差,(二)抽样误差:样本的统计值与总体的参数值之间的误差。由于抽样本身所具有的随机性所引起,是不可避免的。抽样误差:抽样的随机性引起非抽样误差:人为原因导致的误差注意:并非样本规模越大调查结果就越精确!,THANKYOU,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号