抽样估计与样本量确定ppt课件.ppt

上传人:牧羊曲112 文档编号:1333772 上传时间:2022-11-10 格式:PPT 页数:49 大小:11.51MB
返回 下载 相关 举报
抽样估计与样本量确定ppt课件.ppt_第1页
第1页 / 共49页
抽样估计与样本量确定ppt课件.ppt_第2页
第2页 / 共49页
抽样估计与样本量确定ppt课件.ppt_第3页
第3页 / 共49页
抽样估计与样本量确定ppt课件.ppt_第4页
第4页 / 共49页
抽样估计与样本量确定ppt课件.ppt_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《抽样估计与样本量确定ppt课件.ppt》由会员分享,可在线阅读,更多相关《抽样估计与样本量确定ppt课件.ppt(49页珍藏版)》请在三一办公上搜索。

1、1,第10章 抽样估计与样本量确定,10.1 引言10.2 加权及权数调整10.3 抽样分布与抽样误差10.4 参数估计10.5 样本量的确定,2,10.1 引言,抽样调查的目的是用样本推断总体。确定样本权数是估计过程中一个重要组成部分。当确定了每个样本单元的权数后,就可以将它们应用于抽样估计,包括总体总量、均值和比例等简单估计值的计算,抽样误差的估计。,3,10.2 加权及权数调整,估计的第一步,是给每个样本单元或样本中的每个回答赋予一个权数。权数指每个样本单元所代表的调查总体的单元数,由抽样设计决定,所以通常称为设计权数(即样本单元入样概率的倒数)10.2.1 等概率抽样的加权10.2.2

2、 不等概率抽样加权10.2.3 权数的调整,4,10.2.1 等概率抽样的加权(自加权设计),入样概率,入样概率,入样概率,5,10.2.2 不等概率抽样加权纽曼分层抽样即是一种不等概率抽样。,各层样本单元权数,6,10.2.3 权数的调整无回答时需要对权数调整;考虑来自其他渠道、更具权威性的某些辅助信息,合并到权数中。1. 对无回答的权数调整2. 使用辅助信息调整权数3. 事后分层4. 比率估计,7,1. 对无回答的权数调整无回答调整因子是原来样本单元的权数与给出回答的单元的权数和的比值。对于自加权设计,该比值也等于原样本单元数与给出回答的单元数的比值。,8,2. 使用辅助信息调整权数原因:

3、首先,应使调查的估计值与已知的总体总值相匹配,非常重要;其次为了提高估计值的精度。辅助信息还可以用来对不同子总体所对应的不同无回答率进行修正。还可以用来调整由于抽样框涵盖误差导致的调查总体与目标总体之间的差异所造成的影响。,9,3. 事后分层数据收集之前,我们可能无法得到合适的分层信息(如年龄或性别),或者抽选样本后可以得到更新、更可靠的分层信息。在数据收集之后,可以利用收集的信息对样本进行分层,从而对样本的权数进行调整,这就是所谓的事后分层。,10,例10-5,利用设计权数计算调查估计值,11,例10-5,12,4. 比率估计比率估计:用一个乘数因子对各类权数进行调整,这个乘数因子就是各类的

4、辅助变量值与同类的样本估计值的比率。如例10-5中,男性层的调整因子(男性数量与男性估计值之比)即是一种乘数因子。,13,10.3 抽样分布与抽样误差,总体分布:总体各单位的观测值所形成的频数分布。样本分布:一个样本中各个观测值形成的频数分布。抽样分布:样本统计量的抽样分布是一种理论分布,是指在重复抽取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布。,14,10.3.1 样本均值的抽样分布及抽样误差例10-6:一个总体,含四个元素1、2、3、4,现抽取n=2个简单随机样本。,15,抽样均值及方差,16,结论,1)2) OR3)若总体 那么, 4)总体不服从正态分布,当样本量足够大

5、时(大于等于30),样本均值也服从正态分布。,17,10.3.2 样本比例的抽样分布及抽样误差,样本容量足够大时,重复抽样条件下,18,10.3.3 正态分布及标准值Z,标准化,19,P223-224例题,在一项样本量为400的抽样调查中,得知某市夏天人均冷饮消费额50元,标准差50元,而数据直方图表明冷饮消费量近似于正态分布。根据初步的数据分析,可以估计该市夏天冷饮费100元以上消费者的比例。,20,10.4 参数估计,参数估计就是根据从样本中收集的信息对总体参数进行推断的过程。根据中心极限定理等推断理论所阐明的抽样分布与总体分布之间的关系,由样本统计量的具体值(估计值)估计总体参数。点估计

6、区间估计,21,点估计用样本的估计量直接作为总体参数的估计量。存在抽样误差。区间估计在点估计的基础上,对总体参数的区间或范围进行估计(样本统计量加减抽样误差),点估计值落在该区间范围内的概率为置信度或置信系数或置信水平。,22,1、总体均值的区间估计,当总体标准差 未知时,一般通过样本标准差S来估计总体标准差,当总体标准差 已知时,样本均值标准误可以通过如下公式:,23,例10-7,24,2、总体比例的区间估计,25,例10-8,26,3、总体方差的区间估计对于来自正态总体的简单随机样本,则(n-1)倍的样本方差与总体方差的比值的抽样分布服从自由度为(n-1)的x2分布。总体方差在1-a置信水

7、平下的区间估计为:,or,27,举例P227,28,练习题,课后思考与训练题P237-238第4、5、7题,29,10.5 样本量的确定,样本量的确定问题,首先涉及对总体参数估计值的精度要求,同时也涉及与各种运作限制(如可获得的预算、资源和时间)之间的平衡问题。抽样调查估计值的精度是对抽样误差大小的度量。因此确定样本量是为控制抽样误差,而不是非抽样误差。,30,10.5.1 估计精度与样本量之间的关系,但实际抽样调查中,以上假定条件可能很难都满足。如样本可能不是重复抽样;抽样方法可能是分层抽样、系统抽样、分群抽样,而非简单随机抽样;调查的回答率实际上很少能达到100%,31,10.5.2 假定

8、条件下样本量的计算及其应用考虑1、确定样本量的基本公式1)给定总体均值估计的精度下确定样本量的公式,32,2)给定比例估计的精度下确定样本量的公式如果在以往调查中可以得到总体比例的一个较好的估计,那么直接代入公式即可。否则可以取=0.5,因为此时总体的方差最大。,33,2、对样本量基本公式的应用考虑1)多大抽样误差对调研目标而言是可以接受的2)是否需要对调查总体中的子总体(域)进行估计3)相对于调查估计值的抽样误差应该多大为宜4)精度要求的实际含义是什么,34,精度要求与样本量,0.0693,0.0196,35,10.5.3 关于确定样本量的现实复杂考虑及计算1、关于确定样本量的现实复杂考虑1

9、)总体的变异程度2)总体大小3)样本设计和估计量4)调查的回答率,36,1)总体的变异程度总体的变异程度是指总体单位特征的一致性,可用方差或标准差来衡量。为确定调查所需样本量,首先需要得到目标总体的研究指标变异程度的估计值。但通常情况下变异的真值是未知的,需要从过去相关主题的调查或试调查中得到它的估计值。为确保达到调查要求的精度,在计算样本量时,建议对某一指标的总体变异程度采取保守估计,例如二元变量应假设变异程度50%-50%,p=0.5,此时方差最大。,37,2)总体大小确定样本量的基本公式中,样本量的确定与总体没有关系(大总体的重复抽样)。而实际抽样中总体单元数量可能是有限的,样本抽取采取

10、不放回的非重复抽样,此时总体大小对样本容量的影响就不可忽视。,38,非重复抽样下的样本量计算,39,总体大小对确定样本量的影响(表10-11),40,3)样本设计和估计量以上所讨论的抽样方法都假定的是简单随机抽样,当调查采用了复杂的样本设计时,就应考虑实际使用抽样设计的效率,并对计算样本量的基本公式作出调整。通常的做法是在简单随机抽样的样本量计算公式的基础上乘以一个设计效应因子。设计效应(Deff)是指在给定抽样设计下估计值的抽样方差,与相等样本量下的简单随机抽样的估计值的抽样方差之比。,41,设某一抽样设计样本估计值的方差为 ,同等样本量的简单随机抽样设计的样本估计值的方差为 在抽样设计效应

11、Deff为:对于分层抽样设计,设计效率一般小于等于1;对于整群抽样设计,设计效率一般大于等于1.,42,4)调查的回答率指调查回收的有效问卷数占计划访问的样本数量的百分比。为了达到要求的精度,调研机构需要根据预计的回答率调整样本量的大小。,43,2、基于现实复杂考虑的样本量的计算对一般抽样设计,假设调查回答率小于100%,在给定比例估计精度条件下,确定样本量的过程是从计算初始样本量开始的,然后根据总体的大小、设计效应和回答率分别对它进行调整,最后求得最终样本量。,44,以比例估计为例计算样本量的步骤,第1步:计算初始样本量(满足两个假设条件)。第2步:根据总体大小对初始样本量进行调整。方差估计

12、中直接考虑总体大小的调整因子初始样本量基础上乘以总体大小的调整因子第3步:根据实际的抽样设计效应因子对样本量继续调整第4步:根据预计回答率r再次调整,得最终样本量,45,例10-9,46,方案一:假设不需要各层精确估计,已知:N=760000,E=0.05,r0.65,a/2(195%)/2=0.025,标准值Za/2=1.96,=0.5(没有历史资料,取方差最大)。第1步:计算初始样本量第2步:根据总体大小调整样本量第3步:根据设计效应调整样本量第4步:根据预计回答率再次调整样本量,47,方案二:假定对每层都要求精度,城市读者(层1)与乡村读者(层2)都是大总体,其他已知条件和估计精度与方案一相同,可以推断,第1层和第2层需要抽取的样本量与方案一相同,都是591。以下求海外读者(层3)样本量,第1步:初始样本量,第2步:根据总体调整样本量,第3步:根据抽样效率调整样本量,取Deff=1,第4步:根据回答率调整样本量,方案二所需的总体样本量应为三层样本量之和,591(城市层)+591(乡村层)+764(海外层)=1946,是方案一中样本量591的3.3倍,48,10.5.4 各种运作限制对样本量影响的考虑精度费用时间其他一些现场操作因素,如数据收集方法、有无合适的现场调查人员、数据编码和审核人员以及处理数据的设备等,49,结 束,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号