抽样调查 第7章 系统抽样ppt课件.ppt

上传人:牧羊曲112 文档编号:1826851 上传时间:2022-12-20 格式:PPT 页数:71 大小:1.27MB
返回 下载 相关 举报
抽样调查 第7章 系统抽样ppt课件.ppt_第1页
第1页 / 共71页
抽样调查 第7章 系统抽样ppt课件.ppt_第2页
第2页 / 共71页
抽样调查 第7章 系统抽样ppt课件.ppt_第3页
第3页 / 共71页
抽样调查 第7章 系统抽样ppt课件.ppt_第4页
第4页 / 共71页
抽样调查 第7章 系统抽样ppt课件.ppt_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《抽样调查 第7章 系统抽样ppt课件.ppt》由会员分享,可在线阅读,更多相关《抽样调查 第7章 系统抽样ppt课件.ppt(71页珍藏版)》请在三一办公上搜索。

1、7.1 引言,一、系统抽样的定义系统抽样(systematic sampling)是将N个总体单元按一定顺序排列,先随机抽取一个单元作为样本的第一个单元,然后按某种确定的规则抽取其他样本单元的一种抽样方法。,系统抽样的特点 系统抽样是一种被广泛采用的抽样方法,系统抽样比简单随机抽样易于操作,但抽样误差的估计比较复杂。实践中,各种抽样调查,如人口调查、产品质量调查、城乡居民调查等都普遍采用系统抽样。 系统抽样中最简单也是最常用的规则是等间隔抽取,这种系统抽样又称等距抽样。,二、系统抽样的一般方法,1.直线等距抽样,假设总体单元数为N,样本容量为n,N是n的整数倍.,个单元,然后在第一段的k个单元

2、中随机抽出一个,单元,假设为r,然后每隔k个单元抽出一个单元.即,直到抽出n个单元.,例如 某学院共有200个学生,要抽10个学生做样本首先计算抽样间距 然后在120中随机抽出一个数字,假设抽中排在第3位的学生,则其余样本单元依次为第23,43, 63,83,103,123,143,163,183位共10个学生抽取.,2.循环等距抽样,当N不是n的整数倍,即抽样间距 不是整数时,实际抽取的样本量是不确定的,每个总体单元入样的概率也是不等的,这时用直线等距抽样就有可能产生偏倚,若采用循环等距抽样则可以解决此问题. 其方法是将N个总体单元排成首尾相接的一个圆从1到N中随机抽取一个起点作为起始单元,

3、然后每隔k个单元抽出一个,直到抽出n个单元为止.,循环等距抽样,例如总体有14个单元,欲抽取n=3,则,直到抽满。因此样本的编号为:,3,8,13。,3. 不等概系统抽样法,不等概系统抽样中每个单元的入样概率不相等.最常用也是最简单的不等概系统抽样是 抽样.即入样概率 与单元大小 成比例的系统抽样.令,表示总体所有单元大小的总和,则,实施不等概系统抽样最简单的方法是代码法:,下面以例7.1来说明,【例7.1】设总体由10个行政村组成,N=10,每个行政村的人数 见下表.利用 系统抽样抽取n=3个行政村.,用 系统抽样抽选行政村,从1,k中随机抽取一个整数 r=100,则代码为:r=100, r

4、+k=100+623=723, r+2k=100+2623=1346,所对应的行政村入样,其序号依次为1,4,8.,在系统抽样中,对于特别大的单元一定要注意.如果出现 ,该单元肯定被抽入样本,而且还可能被重复抽到.为了避免这种情况,可以事先将这些单元抽出直接入样.,三、总体单元的排序,系统抽样时N个总体单元的排序情况大致有以下三种:,(1)按无关标志排队(2)按有关标志排队(3)介于上述两者之间,四、系统抽样的优缺点,系统抽样的优点:,1.简便易行,容易确定样本单元,2.样本单元在总体中分布比较均匀,系统抽样的缺点:,1.如果单元的排列存在周期性的变化,而抽样者对此缺乏了解或缺乏处理经验,抽取

5、的样本的代表性就可能很差。,2.系统抽样的方差估计较为复杂,一般不存在无偏估计量。,五、系统抽样、整群抽样和分层抽样的关系,系统抽样既可以看成一种特殊的整群抽样,又可以看成一种特殊的分层抽样。下面以一般的等距抽样为例说明:,假设抽样间距为k,总体单元数为N=nk。将总体的N个单元排列成k行n列,如下表所示。表中的每一行单元都是系统抽样的一个样本。,系统抽样的总体单元,如果将每一行单元视为一个群,则总体由k个群组成,一个单元,被选中单元所在行的所有单元就构成系统抽样,的一个样本。,7.2 等概率系统抽样估计量,一、符号说明,第r行第j列的单元指标值:,总体单元数:N 样本单元数:n,系统样本平均

6、数:,系统样本均值估计量:,层 均 值:,总体方差:,系统样本内方差:,样本内相关系数:,层内方差:,同一系统内对层均值离差的相关系数:,二、估计量,假设起始值为R,相应系统样本的平均值为:,取系统样本的平均数作为总体均值 的估计量:,性质1 当 N=nk 时,有k个可能样本:,因此 是无偏估计量。,是有偏的。,个可能样本所包含的单元数不全相等,因此,三、估计量方差的不同表示形式,它的方差按定义为:,下面给出方差的三种不同的表示形式。,为样本内方差。,如果从总体N中直接抽取样本量为n的简单随机,样本,则总体均值 的估计量 的方差为:,式中, 为总体方差;n为样本量;f为抽样比。,对于固定总体,

7、总体方差是惟一确定的,因此,系统样本内的方差 越大,系统抽样的精度越高.为了提高系统抽样的精度,总体单元的排列应尽可能增大样本内方差。,比较等距抽样方差 和简单随机抽样方差 ,,形式二 系统抽样可看作一种特殊的整群抽样系统抽样估计量的方差可以用样本内相关系数 表示:,系统样本内正相关越大,即系统内单元越相似,则估计量方差越大,等距抽样精度越差。,形式三、系统抽样可看做一种特殊的分层抽样,系统抽样估计量的方差可以用层内方差 表示:,为同一系统样本内对层均值离差的相关系数。,比较系统抽样方差 与比例分配的分层随机,体均值估计量的方差。,因此当,系统抽样的精度低于分层随机抽样;,系统抽样的精度与各层

8、抽取一个单元的分层随机抽样相同;,系统抽样的精度高于分层随机抽样。,【例6.3】 设某总个体N=30个单元,总体单元排列如下表,我们要产生一个样本量n=5为的系统样本,试与其他抽样方法的结果进行比较。,下面通过一个模拟的例子说明系统抽样与其他抽样方法的联系,并对不同抽样方法的效果进行比较。,N=30,k=6, n=45 等距样本数据,从上表可计算出:总体方差平均群(行)内方差平均层(列)内方差,下面我们按不同的抽样方法计算总体均值估计量的方差。,(1) 以行为群的整群抽样或以行为“系统样本”的系统抽样k=6,n=5.,(1) 以行为群的整群抽样或以行为“系统样本”的系统抽样k=6,n=5.,(

9、2) 以列为群的整群抽样或以列为“系统样本”的系统抽样k=5,n=6.,(3)以行为层的分层随机抽样(每层抽1个单元)L=6,n=6,f=6/30.,(4)以列为层的分层随机抽样(每层抽1个单元)L=5,n=5,f=5/30.,(5)简单随机抽样n=5,f=5/30.,(6)简单随机抽样n=6,f=6/30.,【评价】从上面的结果可以看出: (1)像整群抽样一样,系统抽样的估计精度几乎完全取决于其“系统样本”内差异与总体差异的对比。 (2)系统抽样与其他抽样方法相比其优劣难以定论,可能好也可能差,这完全取决于其“系统样本”内差异与总体差异的对比,而这个对比则取决于系统抽样中的总体单元排列顺序。

10、 (3)另外三种方法的比较同样难定优劣,都需要具体情况具体分析。 我们下面将上表中总体单元的顺序重新排列,来研究总体单元不同排列对系统抽样的影响。,依某种随机化程序将总体单元重新排列,从上表可计算出:总体方差平均群(行)内方差平均层(列)内方差,下面我们按不同的抽样方法计算总体均值估计量的方差。,(1) 以行为群的整群抽样或以行为“系统样本”的系统抽样k=6,n=5.,(2) 以列为群的整群抽样或以列为“系统样本”的系统抽样k=5,n=6.,(3)以行为层的分层随机抽样(每层抽1个单元)L=6,n=6,f=6/30.,(4)以列为层的分层随机抽样(每层抽1个单元)L=5,n=5,f=5/30.

11、,(5)简单随机抽样n=5,f=5/30.,(6)简单随机抽样n=6,f=6/30.,【评价】将此结果与上例结果比较我们不难发现:(1)简单随机抽样的方差未变,说明简单随机抽样的结果与顺序无关; (2)系统抽样、整群抽样以及分层抽样都与单元顺序有关,这表明在选择抽样方式时,必须尽可能多地掌握有关单元的顺序和总体结构和特点。 (3)本例中分层抽样方差的结果优于简单随机抽样,而简单随机抽样优于系统抽样和整群抽样。,【例6.5】 设某个总体有N=32个单元,总体单元排列显然有稳定上升的趋势。我们要产生一个样本量为4的等距样本,将总体单元排列如下表,k=8,n=4,每一列都是一个等距样本。共8个等距样

12、本。,N=32,k=8, n=4 等距样本数据,显然,层内有正相关,前4个样本与各层均值的离差都是正数,后4个样本与各层均值的离差都是负数,由性质4,当 时,系统抽样的精度低于分层随机抽样.层内方差与总方差分别为:,【例7.3】 利用例7.2的数据,但将第二层与第四层的观察值次序颠倒,数据见下表:,显然,等距样本内数据与各层均值得离差有正有负,例如第一个等距样本对各层均值的离差分别为-2.75,4.5,-4.875,5.75.该样本内六对离差组合中四对的乘积是负数.因此,由性质4, ,系统抽样的精度高于分层随机抽样.,数据顺序的这种改变不会影响简单随机抽样均值估计的方差 和分层随机抽样均值估计

13、的方差 。这时等距抽样均值估计的方差为:,本例中,等距抽样比简单随机抽样和分层随机抽样都更有效。 由此可见,相对于分层随机抽样和简单随机抽样来说,系统抽样的效率很大程度上取决于总体性质。即使是相同的总体数据,对于不同的单元排列顺序,就有不同的样本群内方差 或相关系数 从而系统抽样估计量的方差也就不同。 因此,若要有效地采用系统抽样,必须先了解总体的特征。,6.3 方差估计及其改进一、方差的近似估计 虽然有各种各样的估计量方差的理论公式,但难以得到抽样估计量方差的无偏估计,这是系统抽样的最大的缺点。因此,许多从事抽样设计的业者在决定是否采用系统抽样时往往犹豫不决。 为此,我们分别针对几种不同总体

14、模型,介绍几种近似估计方法,以期选择较为合适的估计量。,(1)随机次序排列的总体,按照无关标志排列的总体单元,可以看着是随机排列的。 在这种情况下,系统抽样方差与简单随机抽样方差是相等的。即总体单元按随机排列顺序时,就可以采用简单随机抽样的方差作为系统抽样的方差估计。,方差估计为:,估计量的方差为:,趋势排列情形 当总体存在或很易找到与研究变量相关程度较高的辅助变量作为排序依据时,或是自然的排列顺序与总体单元的变量值的大小分布呈现某种相依或相悖的趋势时,总体单元的排列顺序就处于趋势排列状态,其中线性趋势最为典型。 对于来自趋势排列总体的等概系统样本,通常可视为分层样本,其整体均值的估计为:,抽

15、样方差的无偏估计为:,二、线性排列情形抽样与估计的改进,1.线性趋势的总体,若总体单元按指标值从小到大顺序排列或按某个与其有线性相关的辅助变量的大小顺序排列,此时指标值 与单元序号 也线性相关.这种按有关标志排列的总体称为线性趋势的总体,如下图所示.,我们先假定一种简单的线性趋势总体,即单元指标值 是单元序号i的线性函数,即,经过线性变换后,记,以下仍用 表示,在具有线性趋势总体下,比较系统抽样的方差,故总体均值,总体方差,从而简单随机抽样的方差:,分层随机抽样的方差:,系统抽样的方差:,比较三式可知,等号当且仅当 时成立。,2.对线性趋势总体的系统抽样法的改进,虽然严格的线性趋势排列总体在实

16、际问题中很难成立,但其结论在定性上还是适合的.,为了使系统抽样法达到更高的精度,有必要对线性趋势总体的系统抽样法进行改进.主要有两个途径:一种是抽样方法的改进;(如中心位置抽样法和对称系统抽样法)另一种是估计方法的改进(如首尾校正法).,(1) 中心位置抽样法,初始样本不是随机抽取,而是直接取第一段的n个单元中处于中间位置的单元.,(2) 对称系统抽样法,Sethi对称系统抽样法(P206),Singn对称系统抽样法(P207),(3) 首尾校正法,Yates首尾校正法,Bellhouse和Rao首尾校正法,(见P205),Bellhouse和Rao首尾校正法,如果初始单元编号 r 较大,满足

17、r+(n-1)kN,则有越过单元N的样本单元有n2个,相应的权数如下:,解:由于,其他3个样本单元的权数为:0.2,首样本单元 的权数为:,尾样本单元 的权数为:,三、周期波动的总体,周期性波动是指总体单元指标值按其顺序程周期性变化.例如商店的日销售额以7天为周期变化,一般周末为销售高峰期,周一、周二下降;城市交通量以24小时为周期变化,上下班时间为高峰期。,对于周期性波动总体,使用系统抽样一定要特别注意。系统抽样的估计效果与抽样间距k及单元指标值的变化周期直接的关系。,7.4 系统抽样的方差估计,系统抽样法的缺点之一,就是很难得到估计方差的无偏估计。本节介绍几种形式相对简单的估计方法,这些方

18、差估计方法只能进行近似计算而且不同的方法适应于不同的总体模型。,一、等概系统抽样的方差估计,(一)系统样本来自随机排列总体,系统样本可视为简单随机样本,从而可用简单随机抽样下的抽样方差的无偏估计:,(二)系统样本分层随机抽取,如果把系统样本看成从各层抽取两个单位分层随机抽样,可采用以下方法。,1。从第二个样本单元开始,每个样本单元与前一个样本单元组成一对,共 n-1对,第I对的样本单元的,进行平均,再乘以,得 的估计:,2.设N为偶数,将样本单元按顺序两两分成一组,共,组,第I对样本单元的方差估计为,从而得到,(三)系统样本来自线性趋势总体,设,(四) 样本量为n的系统样本分成m个子样本独立抽

19、取,则总体均值的估计值为:,的估计为:,二、不等概系统抽样的方差估计,(一)估计量及其方差,关于不等概系统抽样,对总体总和的估计可采用通常不放回的不等概抽样中的,HorvitzThompson估计量:,对于PS系统抽样,有,的方差为:,(二)不等概系统抽样的方差估计,1。将不放回的PS系统样本作为放回的PPS样本处理,可得到以下的方差估计形式:,2。由于实际抽样是不放回的,因此应考虑乘以有限总体修正系数1-f,我们使用f的以下估计:,因而得到方差估计量的一种形式:,3。用相邻样本单元差值的平方和来表示方差,这里用,HT估计为:,则不等概系统抽样方差的估计为:,对于随机排列总体,以上估计方法的效果都不错,,为较好的选择。对于线性趋势总体, 和 的,与等概系统抽样相似, 的效果不太理想,一般,效果最好, 相对更适用于样本量较小的情况。,不推荐使用。,本章小结(1)系统抽样方法是最常用抽样方法、系统抽样可以看成特殊的整群抽样或分层抽样。 (2)系统抽样最显著的优点是简便易行,在了解总体特征的前提下,可以得到很高的精度.(3)系统抽样的方差估计比较复杂,一般难以找到设计意义下的无偏估计量。,本章作业,(1)熟悉本章附录的证明;(2)思考书后习题1-习题3;(3)在作业本上完成书后习题4-习题6。,(第七章结束),

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号