《抽样的逻辑课件.ppt》由会员分享,可在线阅读,更多相关《抽样的逻辑课件.ppt(29页珍藏版)》请在三一办公上搜索。
1、第三讲抽样的逻辑,讲解:李素梅,总体与抽样框,概率抽样的应用,提纲,概率抽样的实际操作,抽样:从总体中选出具有代表性样本的过程。以便通过对样本的研究,取得能说明总体的足够可靠的资料,准确地推断总体的情况,从而认识总体的特征或规律性。,抽样知识回顾,抽样原则:样本具有代表性,即所选取的样本能再现总体的结构。,回顾几个概念吧,抽样框与总体的关系:经过正确抽样所得的样本信息,只适合于描述构成抽样框的要素组成的总体,是否能扩展需要分析。 例:对纽约以及新泽西48个社区中68个药房药物的销售情况进行25年的调查(方法:“调查邻近药房的方式”)-能推断整个美国药房销售的情况吗?或是否能推论纽约和新泽西的药
2、房的情况?,总体与抽样框,理想的抽样框:所有的抽样单位必须覆盖总体,抽样框要求每个总体单位都应该对应着一个抽样单位,抽样单位必须相互独立,互不重叠。如以北京的所有街道的名单为一阶抽样中的抽样框,其必须覆盖北京所有的街道。,总体与抽样框,抽样框表现形式-例:电话号码簿、邮政编码簿、车主名单、纳税人名单、领有营业执照的人员名单;大学、学术期刊、报纸、工会等名单,当你用电话簿或名册作为抽样框时,有没有注意它是否包含了总体所有单位呢?,抽样框误差来源于:1. 不能覆盖总体单位;2 . 包含了非总体单位;3 . 复合联接; 4 . 抽样框老化。,总体与抽样框,非概率抽样方法就近法、目标式抽样、配額抽样、
3、滾雪球抽样,确定合适的样本量,执行抽样设计,界定总体,决定抽样框,确定抽样步骤,抽样的设计,概率抽样方法 简单随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样,概率抽样(Probability Sampling),概率抽样:按照概率论和数理统计的原理,根据随机原则从调查研究的总体中抽选样本,使每个要素以已知非零的机会进入样本的方法。 特点:1、按随机原则抽选样本;2、总体中每一个单位被抽中的概率已知非零,样本具有代表性;3、可以估计可能出现的误差并加以控制。,简单随机抽样(Simple Random Sampling),总体各单元不经过任何排队或分类, 从总体N个单位中任意抽取n个单位作为样
4、本,使每个可能的样本被抽中的概率相等的一种抽样方式,是其他概率抽样方法的基础。,方法:抛硬币、掷骰子、抽签、查随机数表等。,随机数表法例:(例:K=100,n=10)1. 给每个要素编码;2. 从随机表中随机选取10个数字: 确定所选择的随机数的位数; 随意从随机数表中任何一区的任何一个数目开始,依次向各个方向顺序连续选取数字。,评价:概率抽样的理想类型,没有偏见,简单易行。但当总体所含个体数目太多时,费时、费力,费用高;而且在总体异质性很高时,误差较大。因此,名册齐全的话,一般会用系统抽样法而不是简单随机抽样法。,黑人白人机会均等,步骤:(1)将总体的所有单位按一定顺序排列起来。(2)计算抽
5、样间距: k=总体大小(N)样本大小(n) 。(3)随机确定一个起点a (1ak) 作为第一个样本单位。(4)每隔k个单位抽取1个,即由a,a+k,a+2k.a+(n-1)k组成容量为n的样本。,2. 系统抽样( Systematic Sampling ),亦称等距抽样或机械抽样,系统化地选择完整名单中每第K个要素组成样本的概率抽样方法。,1 2 3 4 5 6 7 8 9 10,31 32 33 34 35 36 37 38 39 40,21 22 23 24 25 26 27 28 29 30,11 12 13 14 15 16 17 18 19 20,N=40n=8k=5,我的fans多
6、得不得了呢.,优点比简单随机抽样方便简单样本在总体中的分布比较均匀局限性是以总体单位的无规律排列为前提的,如果总体的排列出现规律性,特别是周期性时,就可能会使抽样出现系统偏差。,如果在一栋公寓楼里选选择公寓样本,如上图样本间距是8,那么所选样本的每个要素可能全是西北角上房间,这样样本就可能会缺乏代表性. 如果有周期性,可以采取在每个间隔内随机抽取等方法解决。,3. 分层抽样(Stratified Sampling),先将总体按照一种或几种特征将总体的N个单位分成互不交叉、互不重复的若干个组(层);然后从每层中独立、随机地抽取一个子样本,将子样本合在一起,即为总体的样本。,腌菜缸厂家想了解各类腌
7、菜的长度,于是.,变量的选择:1. 研究涉及到的主要变量或相关的变量;2. 保证各层内部同质性强的变量;3. 有明显分层区分的变量;如:某厂职工购买书籍的情况”文化程度”; 某高校宿舍使用电脑情况“本科生、研究生”等常用指标:行政区划、地理位置、海拔高度、行业、经济发达程度、企业规模、家庭收入水平、性别、年龄、民族等,分层应遵循原则:尽可能层内样本的变异小,层间变异大。,优点:1. 样本同质性高,样本分布均匀,样本结构与总体结构接近;2. 也可对各子层的参数进行推断; 3. 组织实施比较方便。 应用上最为普遍。尤其是 总体数目较大,内部结构复杂时常能取得比较好的效果;注意:要求调查者对总体及各层有一定的了解,否则无法作出科学的分类。,步骤:1. 变量的选择。可按一种或几种特征对总体进行分层。如调查某年高考生的语文成绩,可根据科目分类,如文科 、理科、艺术、体育、外语等层次来进行简单随机抽样;男性白人、女性白人、男性黑人、女性黑人;2. 确定在各层中抽取样本单位的数量。可采取等比例和不等比例抽取两种不同的方法。,