《第四讲part1抽样技术ppt课件.pptx》由会员分享,可在线阅读,更多相关《第四讲part1抽样技术ppt课件.pptx(32页珍藏版)》请在三一办公上搜索。
1、第3章 分层随机抽样,3.1 定义与符号,2023/1/11,2,一、定义在抽样之前,先将总体N个单元划分成L个互不重复的子总体,每个子总体称为层,它们的大小分别为,这些层合起来就是整个总体,然后,在每个层中分别独立地进行抽样,这种抽样就是分层抽样,所得到的样本称为分层样本。,不重不漏,总体中的每一个单元一定属于并且只属于某一个层,而不可能同时属于两个层或不属于任何一个层。,分层抽样的先决条件,在调查设计前需要相关的分层信息,即抽样框数据中应有分层变量。例:学院、性别、地区,定义3.1 层:如果一个包含N个单元的总体可以分成“不重不漏”的L个子总体,即每个单元必属于且仅属于一个子总体,则称这样
2、的子总体为层。即L个子总体所包含的单位数分别为,则有定义3.2 分层抽样:又称为类型抽样或分类抽样,即在每一层中独立进行抽样,总的样本由各层样本组成,总体参数则根据各层样本参数的汇总做出估计,这种抽样就称为分层抽样,所得样本称为分层样本。设总得样本量为n,从L个子总体中所抽取的样本量分别为 则有定义3.3 分层随机抽样:如果每层中的抽样都是独立地按照简单随机抽样进行的,那么这样的分层抽样称为分层随机抽样,所得的样本称为分层随机样本。,分层随机抽样的三个必要条件,(1)每层都抽;(2)各层都独立地抽;(3)各层的抽样都是简单随机抽样。,2023/1/11,6,分层抽样特点:,样本在总体中分布更均
3、匀,更具代表性。每层的抽样都是独立进行,允许各层选择不同的抽样方法。分层抽样不仅能对总体指标进行估计,而且能对各层指标进行估计。分层抽样的抽样效率较高,也就是说分层抽样的估计精度较高。(这是因为分层抽样估计量的方差只和层内方差有关,和层间方差无关。),2023/1/11,7,符号说明(关于第h层的记号),层号,2023/1/11,8,3.2 简单估计量及其性质,3.2.1 总体均值的简单估计及其性质分层样本,总体均值 的估计分层随机样本,总体均值 的简单估计,定理 3.1:对于分层随机抽样,是 的无偏估计。,定理 3.2:对于分层抽样,有,定理 3.3:对于分层随机抽样,的估计量 具有如下性质
4、:,第h层样本的样本方差。,定理 3.4:对于分层随机抽样,的方差 的无偏估计量:,推论 3.1:对于分层随机抽样,总体总量 的简单估计量 有如下性质:(1)(2)(3)是 的一个无偏估计。,推论 3.2:对于分层随机抽样,总体比例 的简单估计量 有如下性质:(1)(2)(3)是 的一个无偏估计。,推论 3.3:对于分层随机抽样,总体中具有指定特征的单元总数 的简单估计量 为:具有如下性质:(1)(2)(3)是 的一个无偏估计。,2023/1/11,15,例3.1,调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户划分为4层,每层按简单随机抽样抽取10户,调查获得
5、如下数据(单位:元),要估计该地区居民奶制品年消费总支出及其置信区间。,2023/1/11,17,两种途径:分别比估计:对每层样本分别考虑比估计量,然后对各层的比估计量进行加权平均,即先“比”后“加权”;联合比估计:对比率的分子和分母分别加权计算出总体均值或总体总量的分层估计量,然后用对应的分层估计量来构造比估计,即先“加权”后“比”。,3.3 比率估计量及其性质,分别比估计量要求每一层的样本量都比较大,如果达不到这个要求,则它的偏差可能比较大,这时要使用联合比估计量。,3.3.1 分别比估计,定义 3.4 总体均值 和总体总量 的分别比估计为:,定理 3.5 对于分层随机抽样的分别比估计,若
6、各层的样本量 都比较大,则有,根据定理3.5,很容易推得在各层样本量 都比较大的情况下,有,3.3.2 联合比估计,定义 3.5 总体均值 和总体总量 的联合比估计为:,定理 3.6 对于分层随机抽样的分别比估计,若各层的样本量 都比较大,则有,根据定理3.6,很容易推得在各层样本量 都比较大的情况下,有,两种途径:分别回归估计:对每层样本分别求取回归估计量,然后对各层的回归估计量进行加权平均,即先“回归”后“加权”;联合回归估计:对两个变量先分别计算出总体总值或总体均值的分层简单估计量,然后再对它们的分层估计量来构造回归估计,即先“加权”后“回归”。,3.4 回归估计量及其性质,分别回归估计
7、量同样要求每层的样本量都比较大,如果达不到这个要求,加之各层的简单随机抽样误差较大,整个分层随机抽样就会产生较大的偏差,这时要使用联合比估计量。,3.4.1 分别回归估计,定义 3.6 分别回归估计是指在分层随机抽样中,先在每层中对层均值或层总和做回归估计,然后再对各层的回归估计按总体层权进行加权平均。对 的分别回归估计为:对 的分别回归估计为:,1.各层的回归系数 事先给定,2.不能事先设定各层的回归系数,若 不能事先设定,则将 取为第h层总体回归系数 的最小二乘估计,即为样本回归系数:,第h层样本相关系数的平方,3.4.2 联合回归估计,定义 3.7 联合回归估计是指在分层随机抽样中,先对 和 作分层估计:,进而构造总体均值 的联合回归估计为:总体总量 的联合回归估计为:,1.当 为事先设定的常数,2.当回归系数 不能事先设定,当 不能事先设定,取 的样本估计:,第h层样本相关系数的平方,小结,在比估计中,分别比估计与联合比估计均为有偏估计量,当各层样本量都比较大时,分别比估计与联合比估计近似无偏;当某些层的样本量不够大,而总样本量较大时,联合比估计近似无偏。,在回归估计中,少数情况下,回归系数是可以事先设定的常数,其估计量无偏;多数情况下,回归系数需利用样本回归系数进行估计,其估计有偏,但在大样本的情况下近似无偏。,