《《抽样技术》第六章.ppt》由会员分享,可在线阅读,更多相关《《抽样技术》第六章.ppt(21页珍藏版)》请在三一办公上搜索。
1、抽样技术第六章,王学民 编,1,第六章 不等概率抽样,6.1 概述6.2 放回不等概率抽样6.3 不放回不等概率抽样,2,6.1 概述,当Y1,Y2,YN之间的大小相差很大时,S2也将很大。此时可考虑分层,但更为精细的方法是使用不等概率抽样。,3,在不等概率抽样中,每个单元都被赋予一个大小不等的入样概率,而这个概率通常与某个辅助变量有关,如表示单元规模(大小)的某种度量。不等概率抽样的常见应用情形:总体单元规模相差很大。整群抽样和多阶抽样中,若初级单元相差很大。系统抽样。不等概率抽样的主要优点:可以大大提高估计的精度,减少抽样误差。一个必要条件:对总体中的每一个单元,都要已知一个辅助量用以确定
2、其入样概率或两个单元同时入样的概率。,4,6.2 放回不等概率抽样,一、多项抽样与PPS抽样二、多项抽样的实施方法三、汉森一赫维茨估计量及其性质,5,一、多项抽样与PPS抽样,多项抽样 总体:Y1,Y2,YN入样概率:Z1,Z2,ZN放回抽样n次,共抽到n个单元。取Zi=Mi/M0,其中Mi是第i个单元的大小,此时每个单元在每次抽样中的入样概率与单元大小成比例,称这种特殊的多项抽样为(放回的)与大小成比例的概率抽样,简称PPS抽样。,6,二、多项抽样的实施方法,1.代码法2.拉希里法,7,1.代码法,例6.1 设某个总体有N10个单元,欲用多项抽样从中抽取n5个单元,给定的入样概率 Zi。令M
3、i=100Zi,则其皆为整数,对Mi累加,赋以每个单元的代码列在下表中。在1,100内产生5个随机数:04,73,25,49,82。,8,2.拉希里法,令,每次抽取一个1,N范围内的随机数i及1,M*范围内的随机数m,若Mim,则第i个单元入样;否则重抽一组(i,m)。在例6.1中,N10,M*24。设1,10中的一个随机数为4,1,24中的随机数为9,由于M468,故第2个单元被抽中。如此重复直到抽到n个单元(允许重复)为止。拉希里法适用于N很大的情况。,9,三、汉森赫维茨估计量及其性质,汉森赫维茨(Hansen-Hurwitz)提出的对总体总和Y的估计如下:汉森一赫维茨估计量 具有如下性质
4、:若所有的Zi0,i=1,2,N,则1,即它是无偏的;2.3.若n1,则是 的无偏估计。,10,例6.2,下表是某系统全部N36个单位上一年职工人数Xi及当年职工人数Yi的数据。以Xi为单位大小Mi的度量,对单位进行PPS抽样,n6,估计全系统当年职工总人数Y,并与简单随机抽样作精度比较。,11,12,6.3 不放回不等概率抽样,一、包含概率与PS抽样二、霍维茨汤普森估计量及其性质三、n=2的严格PS抽样,13,一、包含概率与PS抽样,在不放回抽样中,每个单元Yi被包含到样本的概率i=P(i)及任意两个单元(Yi,Yj)都包含到样本的概率ij=P(i,j)通称为包含概率。抽取了n个单元的样本。
5、包含概率i与ij满足以下性质:1.2.3.,14,最感兴趣的是i与单元大小Mi成比例的情形。若仍记Zi=Mi/M0,则有:i=nZi这种不放回的与(单元)大小成比例的概率抽样称为PS抽样。严格的PS抽样实施起来非常复杂。事实上,只有当n=2时,才有一些简单且实用的方法。对于n2,严格的PS抽样都相当复杂。对于大的n,有时根本不可能。除了实施方面的原因外,当n大时,ij的计算也极其困难,而这对于方差估计是不可少的。,15,二、霍维茨汤普森估计量及其性质,对不放回的不等概率抽样,霍维茨(Horvitz)与汤普森(Thompson)提出了以下总体总和Y的估计量:对于PS抽样,由于i=nZi,与相应P
6、PS抽样的 形式上完全一致。若i0,i=1,2,N,则 是Y的无偏估计,且它的方差为:,16,又有若i0,ij0(i,j=1,2,N,ij),则是 的无偏估计。也是 的无偏估计。,17,三、n=2的严格PS抽样,1.布鲁尔(Brewer)方法2.德宾(Durbin)方法,18,第一个样本单元以概率Zi抽取,设抽到的是单元i;第二个样本单元按与Zj成比例的概率(即Zj/(1Zi))抽取,则 此时,i不与Zi成正例。,19,1.布鲁尔(Brewer)方法,该方法要求对每个i,都满足。两个样本单元采用逐个抽取法抽取:第一个单元按与成比例的概率抽取;第二个单元则在剩下的N1个单元中按与Zj成比例的概率抽取。,20,2.德宾(Durbin)方法,两个样本单元仍用逐个抽取法抽取。第一个样本单元以概率Zi抽取,设抽到的是单元i;第二个样本单元则按与成比例的概率抽取。德宾方法与布鲁尔方法是等价的。,21,