《第六章整群抽样.ppt》由会员分享,可在线阅读,更多相关《第六章整群抽样.ppt(27页珍藏版)》请在三一办公上搜索。
1、第七章 整群抽样,第一节 概述第二节 群大小相等时的整群抽样第三节 估计总体比例的整群抽样第四节 群大小不相等的一般情形,第一节 概述,一、什么是整群抽样整群抽样是将总体划分为若干群,然后以群为抽样单元,从总体中随机抽取一部分群,对中选群中的所有基本单元进行调查的一种抽样技术。要求:群与群之间不重叠,且总体的任何一个基本单位都只能且必须属于某一群。,二、整群抽样的特点及适用场合抽样框的编制得以简化实施调查便利,节省费用通常情况下其抽样误差较大,可通过适当增大样本量的方法弥补估计精度的损失当群的大小接近时,常采用简单随机抽样当群的大小相差比较大时,为提高效率则更多地采用不等概率抽样,第二节 群大
2、小相等的整群抽样,对群进行简单随机抽样时的估计量与方差一、符号说明总体群数 N,样本群数 n第i群中包含的总体单位数 M总体第i群第j个单位指标值 Yij样本第i群第j个单位指标值 yij,总体第i群的群和样本第i群的群和总体第i群的平均数样本第i群的平均数,总体平均群和样本平均群和总体均值样本均值,总体总方差:样本总方差:总体群间方差:,样本群间方差:总体群内方差:样本群内方差:,二、估计量及其性质,例1:在一次某城市居民小区居民食品消费量调查中,以每个楼层(相当于居民小组)为群进行整群抽样。每个楼层都有M=8个住户。用简单随机抽样在全部N=510个楼层中抽取n=12个楼层。全部96个样本户
3、人均月食品消费额yij及按楼层的平均数 与标准差si如下表所示。试估计该居民小区人均食品消费额的户平均值,并给出其95%的置信区间(P213)。,12个楼层96户居民人均月食品消费额资料,三、群内相关系数与设计效应 1、群内相关系数(interclass correlation cofficient)表示同一群内不同小单元的指标值对总体均值的离差乘积的期望值与总体中所有小单元指标值对总体均值离差平方的期望值之比。,2、设计效应,整群抽样的方差约为简单随机抽样的方差的 倍。,例2:在某地进行一次人体测量,采用以工厂为群的整群抽样。其中成年男子组抽了9个工厂,共测了740人;成年女子组抽了7个工厂
4、,共测了531人。下表分别是以身高(单位mm)为指标值的男女两组样本资料的平方和分解表,试计算各自的群内相关系数及整群抽样的设计效应(P217)。,9个工厂成年男子身高资料的平方和分解变差来源 平方和 自由度 均方(方差)群(工厂)间 35 618 8=4 452群(工厂)内 1 978 596 731=2 707 总 计 2 014 214 739=2 726,7个工厂成年女子身高资料的平方和分解变差来源 平方和 自由度 均方(方差)群(工厂)间 19 112 6=3 185群(工厂)内 1 216 203 524=2 321 总 计 1 235 315 530=2 331,四、整群抽样效率
5、分析及群的划分原则 在总体方差固定的条件下,整群抽样的精度取决于群内相关系数,群内相关系数愈小,即群内差异或群内方差愈大,则估计量的精度愈高。整群抽样中群所起的作用与分层抽样中层所起的作用正好相反。在分层抽样中,估计量的方差取决于层内方差,对于整群抽样,应该采用尽可能使群间方差小而群内方差大的划分方式。,第三节 估计总体比例的整群抽样,一、问题的提出在判断一个单元是否具有所考察的某项特征的调查,普遍采用整群抽样,因它总的效率较高。在估计总体比例时,群大小无论相等或不相等,对群的抽样均可采用简单随机抽样,不过估计量需要采用不同的形式:在群大小相等时,一般采用简单估计;在群大小不等时,需采用比估计
6、。,二、群大小相等情形以 分别表示总体(样本)第i群中具有所考察特征的小单元数及其在小单元总数中的比例,在总体中按简单随机抽样抽取n个群,则,例3:在例1中,对某居民小区居民进行食品消费调查的同时,也进行网络使用情况的调查,下表是12个样本楼层使用网络的住户数 及在楼层8户中所占的比例 的资料,试对该小区的网络使用率 进行估计(P224)。,三、群大小不等情形所抽取群的大小为,群中具有所考虑特征的小单位数为,总体比例的估计为:,第四节 群大小不等的一般情形,若群大小Mi 相差不多,以平均群大小 代替M,仍可按群大小相等处理;若Mi 相差较大,有两种处理方法。一、记号总体第i群第j个小单位指标值
7、 Yij,i=1,2,N;j=1,2,Mi,Mi 是群的大小。样本第i群第j个小单位指标值 yij,i=1,2,n;j=1,2,mi,mi 是群的大小。,是总体中小单元的总数;,二、按简单随机抽样抽群简单估计,比估计,例4:从共有790个单位的某系统中按简单随机抽样抽取n=20个单位,这些单位的职工人数,月奖金总额 及人均月奖金 如表(P232)所示。试用简单估计与比估计两种方法估计该系统人均月奖金,并比较其精度。已知该系统共有职工人数=337208人(P232)。,三、按与群大小成比例的不等概率抽样抽群放回PPS抽样,总体总和Y的汉森-赫维茨估计量:,不放回PS抽样 总体总和Y的估计应用霍维茨-汤普森估计量:,