抽样技术5整群抽样.ppt

上传人:小飞机 文档编号:5979854 上传时间:2023-09-10 格式:PPT 页数:50 大小:479.50KB
返回 下载 相关 举报
抽样技术5整群抽样.ppt_第1页
第1页 / 共50页
抽样技术5整群抽样.ppt_第2页
第2页 / 共50页
抽样技术5整群抽样.ppt_第3页
第3页 / 共50页
抽样技术5整群抽样.ppt_第4页
第4页 / 共50页
抽样技术5整群抽样.ppt_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《抽样技术5整群抽样.ppt》由会员分享,可在线阅读,更多相关《抽样技术5整群抽样.ppt(50页珍藏版)》请在三一办公上搜索。

1、第七章 整群抽样,第5章 整群抽样,群规模相等时的整群抽样群规模不相等的整群抽样,5.1 概述,一、整群抽样(cluster sampling)的定义:由若干个基本单元所组成的集合称为群。将总体划分为若干群,然后以群为抽样单元,从总体中简单随机抽取一部分群,对抽中的群中的所有基本单元进行调查的一种抽样技术。二、应用:1、农产品实割实测某地产量时,在地块中布点作为样本块,群可以是一行或两行。2、欲调查某大学的学生体质状况,群可以是班级或系等。3、工厂产品(例如食品)质量检查时,群可以 是一箱、一包,或若干包等。一旦抽中,对群中的每一个单元都进行调查。,5.1 概述,整群抽样是由一阶抽样向多阶抽样

2、过渡的桥梁。在第二阶 段中,如果抽出后对其中的所有单元进行调查,是整群抽样;如果再从中抽取子样,即两阶段抽样;也可以从中再继续抽样,叫多阶段抽样;多阶段抽样中,如果最后一次对抽中群里所有的单元进行调查,则称为多阶段整群抽样。,整群抽样分类:1、群规模相等的抽样。(抽样方式和估计方法简单)2、群规模不相等的抽样。,5.1 概述,引例:欲估计某校学生的每月个人消费,假定40000个学生,共10000个宿舍(假设每个宿舍住4人),以下三种抽样方案:,方案一:根据学生名录,按简单随机抽取400名学生方案二:根据学生宿舍名录简单随机抽取100个宿舍,对抽到的宿舍全面调查。方案三:先简单随机抽取400个宿

3、舍,每个宿舍简单随机抽取1人。,都是等概抽样,由于抽样方法不同,产生的抽样误差也不同。,二、整群抽样特点:1.可以简化抽样框的编制。2.实施调查便利,节省费用。3.通常比简单随机抽样的抽样误差大,可通过加大样本量来弥补。三、群的划分:1.根据行政区或地域形成的群体。(方便,节约)2.调查人员人为确定的。如一大块地分为若干块较小面积的群。3.分群的原则:群内单元差异大,群间差异小,这样,被抽到的群代表性好,抽样误差小。(和分层抽样中划分层的原则相反)。,5.1 概述,5.2 群规模相等时的估计量及其方差,一、符号:总体群数:N每群含有的单元数:M总体第i群第j个单元的指标值:Yij总体中单元总数

4、:M0=NM样本群数:n,样本中单元总数:nM样本第i群第j个单元的观测值:yij,5.2 群规模相等时的估计量及其方差,一些记号:,5.2 群规模大小相等时的估计,二 1、总体均值的简单估计量 SRS抽群,群规模相同,均为M,则 的估计如下,且是无偏的,5.2 群规模大小相等时的估计,5.2 群规模大小相等时的估计,3、的样本估计为 因为 是的 无偏估计,所以 是 的无偏估计,整群抽样的抽样误差和群间方差有关,减少群间差异,增加群内差异有助于提高抽样精度(抽样设计原则),5.2 群规模大小相等时的估计,总体总值据此,可直接推出其估计量及相应的方差,相应可以得到总体均值、总值估计的置信度为95

5、%的置信区间,例:在一次对某寄宿中学在校生零花钱的调查中,以宿舍作为群进行整群抽样,每个宿舍有6个学生。用简单随机抽样在全部315个宿舍中抽取8个宿舍。全部48个学生上周每人的零花钱及相关数据如下:试估计该学校平均每个学生每周的零花钱,并给出置信度为95%的置信区间。,解:,例:调查一片荒地上煌蝻的数量,调查以一平方米为单位,计算煌蝻数,该荒地有5000平方米,现在为方便调查将其划分为每10平方米一块的地块,从500个地块中简单随机的抽取20个样本,然后对抽中的地块调查每平方米煌蝻数,作整群抽样,调查数据如下表,估计整块荒地的煌蝻数。(本例子选自北京大学教材“抽样调查”125页),每平方米平均

6、有煌蝻数的估计为:,这一估计的方差为;,自己练习带入数据进行计算,也可用软件编程计算,三、整群抽样的设计效应:1.群内、群间差异的定量刻划:,2.群内相关系数:是表达总体中群内小单元间相关程度的一个指标。定义:,例:假设一小总体为1、2、3、5、6、7,若分成群(1,2,3)和(5,6,7),试计算其群内相关系数。,解:可以算出该总体均值为4,,5.2 群规模大小相等时的估计,事实上,的方差可用群内相关系数近似表示,有此式可推出,5.2 群规模大小相等时的估计,假定直接从总体抽取一个样本容量nM的简单随机抽样,样本均值的方差 为:由此可计算出等群抽样的设计效应为,整群抽样的效果很大程度上取决于

7、群内相关系数,5.2 群规模大小相等时的估计,整群抽样的Deff与群内相关系数 的关系密切相关,当群内单位不一致时,整群抽样效率要高于简单随机抽样例:假设总体容量N=6,若分成群(1,2,3)和(5,6,7)与分成群(1,5,7)和(2,3,6),试计算分析其抽样效率。,5.2 群规模大小相等时的估计,解:可以算出该总体均值为4,,相关系数是正值,且较高,表明群内有较强的同质性抽样效果要差一些,5.2 群规模大小相等时的估计,若此例改为(1,5,7)和(2,3,6)两个群,计算其相关系数。,解:,要想提高抽样效率,分群时,尽可能的降低 的值,它通过增大群内单元的差异来实现,即前面涉及的群的划分

8、原则。,群内相关系数的另一表示法,用样本统计量估计如下:,例:估计上例中以宿舍为群的群内相关系数和设计效应,解:利用已求出的样本群间方差,=,Deff=1+(M-1),=1+(6-1)0.348256=2.741,设计效应说明:为达到同样的设计精度,整群抽样的 样本量大约为简单随机抽样样本量的2.741倍。,nsrs=nM/deff=48/2.74,18,简单随机抽样的样本量是18即可达到整群抽样48个学生样本量相同的估计精度.,类似这样的问题再抽样时,根据给定的精度,先算出简单随机抽样需要的样本量,再计算整群抽样需要的样本量,5.3 群规模不相等的一般情形,一、符号:总体群数:N总体第i群含

9、有的单元数:Mi总体第i群第j个单元的指标值:Yij样本群数:n样本第i群含有的单元数:Mi样本第i群第j个单元的观测值:yij总体中单元总数:,5.3 群规模不相等的一般情形,5.3 群规模不等时的估计,当群Mi规模不等时,抽样方法:将群按大小分层,每一层的规模大小相等,层内可按群规模大小相等的处理方法;也可以按不等概抽样方法进行抽样。估计方法:一般采用比率估计法,把群规模看成辅助变量。,5.3 群规模不等时的估计,一.等概抽样,比率估计总体均值估计为,5.3 群规模不等时的估计,与 的样本估计分别是,可用样本规模均值代替,5.3 群规模不等时的估计,5.3 群规模不等时的估计,例:某县有3

10、3个乡,726个村,该年度某种作物总种植面积30525亩,现采用等概整群抽样随机抽出10个乡,要求估计全县总产量,并计算估计量标准差。调查资料如下:,样本乡编号,村庄数 Mi,作物总产量(乡)yi(万公斤),种植面积(乡)xi(亩),12345678910,15182614202821193117,22.022.830.221.725.331.226.020.533.823.6,800780100070088011008508001200830,1.46671.26671.16151.551.2651.11431.23811.0791.09031.3882,合计 209 257.1 8940,

11、5.3 群规模不等时的估计,1、等概抽样,比率估计用村庄作辅助变量,评价:有偏,n较大时比较理想,2.用种植面积作辅助变量 已知:种植面积X30525(亩),评价:和上面的方法相比,后者方差更小,因为选择了关系更密切的辅助变量,因而有较好的估计效果。,5.3 总体比例的估计,令 ai 为第i群中具有某特征的单位数 为第i群中具有某属性占的比例srs方法抽取n群,对总体比例P进行估计一.群规模相等时的估计,5.3 总体比例的估计,M为每群中的单位数。M1M2=M 规模相等 为 的无偏估计,增加例题(选自倪加勋著“抽样调查”),例:某工厂采用三班制连续生产,每班有5个班组同时生产,该月30天,共有

12、450班组(日),随机抽8个班组日,每班6个工人,求每个工人的平均每班的产量。若工人中每班的产量不到1000件,则需要重新培训,由此估计需要培训的工人比例,并计算抽样标准误。,解:从表中的数据可得:,5.4 总体比例的估计,二 群规模不等时的估计Mi不等,srs方法抽取群 为比估计形式式中 为群平均规模,5.4 总体比例的估计,例题:某居民小区有415个居民小组,现采用整群等概抽样,随机抽取25个小组为样本,调查女性所占比例,数据如下:,群(i)居民数(Mi)女性人数(ai)群(i)居民数(Mi)女性人数(ai),12345678910111213,81245667583265,4713344232132,141516171819202122232425,1093655468738,541423133403,合计 151 72,5.4 总体比例的估计,以95的置信区间估计该小区女性所占比例,并同简单随机抽样方法进行比较。这是群规模不等的比例估计,5.4 总体比例的估计,置信区间,5.4 总体比例的估计,还可进一步计算群内相关系数,群内相关系数为负,表明群内差异大而群间差异小。有一些变量如性别,如果以家庭户为群,群内的成员男女差异大,而家庭之间的构造则很相似。此时整群抽样的效果要好。,小结,群规模相等的整群抽样群规模不相等的整群抽样用软件求解,不等群的整群抽样,采用比率估计量,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号