《第六章 抽样调查.docx》由会员分享,可在线阅读,更多相关《第六章 抽样调查.docx(8页珍藏版)》请在三一办公上搜索。
1、第六章 抽样调查第一节 抽样调查的意义及基本概念一、抽样调查的意义抽样调查(随机抽样):按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。二、抽样调查的适用范围抽样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用面广等优点。一般适用于以下范围: 1. 实际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;2. 虽可进行全面调查观察,但比较困难或并不必要;3. 对普查或全面调查统计资料的质量进行检查和修正;4. 抽样方法适用于对大量现象的观察,即组成事物总体的单
2、位数量较多的情况;5. 利用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍。三、抽样调查的基本概念(一) 全及总体和抽样总体(总体和样本)全及总体:所要调查观察的全部事物。 总体单位数用N表示。抽样总体:抽取出来调查观察的单位。 抽样总体的单位数用n表示。 n 30 大样本 n 30 小样本(二) 全及指标和抽样指标(总体指标和样本指标)全及指标:全及总体的那些指标。抽样指标:抽样总体的那些指标。第二节 抽样调查的组织形式通常有以下四种组织形式:一、 简单随机抽样(纯随机抽样)即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。随机抽选可有各种不同的具体做
3、法,如:1.直接抽选法;2.抽签法;3.随机数码表法;二、类型抽样(分类抽样)先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原则抽取样本,组成一个总的样本。类型的划分:一是必须有清楚的划类界限;二是必须知道各类中的单位数目和比例;三是分类型的数目不宜太多。类型抽样的好处是:样本代表性高、抽样误差小、抽样调查成本较低。如果抽样误差的要求相同的话则抽样数目可以减少。两种类型:1.等比例类型抽样(类型比例抽样);2.不等比例类型抽样(类型适宜抽样)。三、机械抽样(等距抽样)先将全及总体的所有单位按某一标志顺序排队,然后按相等的距离抽取样本单位。排列次序用的标志有两种:1. 选择标
4、志与抽样调查所研究内容无关, 称无关标志排队。例: 研究工人的平均收入水平时,按工号排队。 2. 选择标志与抽样调查所研究的内容有关, 称有关标志排队。例: 研究工人的生活水平,按工人月工资额高低排队。机械抽样按样本单位抽选的方法不同,可分为三种:1.随机起点等距抽样2.半距起点等距抽样3.对称等距抽样机械抽样的好处:1. 可以使抽样过程大大简化,减轻抽样的工作量;2. 如果用有关标志排队,还可以缩小抽样误差,提高抽样推断效果。机械抽样,实际上是一种特殊的类型抽样。因为,如果在类型抽样中,把总体划分为若干相等部分,每个部分只抽一个样本,在这种情况下,则类型抽样就成了机械抽样。四、整群抽样整群抽
5、样即从全及总体中成群地抽取样本单位,对抽中的群内的所有单位都进行观察。整群抽样的好处:组织工作比较简单方便,适用于一些特殊的研究对象。其不足之处是,一般比其它抽样方式的抽样误差大。五、多阶段抽样即把抽样本单位的过程分为两个或几个阶段来进行。(如果一次就直接抽选出具体样本单位,这叫单阶段抽样)具体讲: 先抽大单位(可以用类型抽样或机械抽样), 再在大单位中抽小单位(可用整群抽样或简单随机抽样),小单位中再抽更小的单位;而不是一次就直接抽取基层的调查单位。六、重复抽样和不重复抽样以上每一种组织方式又有不同的抽取样本方法(机械抽样和整群抽样没有重复抽样):重复抽样:又称有放回抽样不重复抽样:又称不放
6、回抽样。第三节 抽样平均误差一、抽样误差的概念及其影响程度在统计调查中,调查资料与实际情况不一致,两者的偏离称为统计误差。抽样误差即指随机误差,这种误差是抽样调查固有的误差,是无法避免的。抽样误差的影响因素:1. 全及总体标志变异程度。正比关系2. 抽样单位数目的多少。反比关系3. 不同的抽样方式。4. 不同的抽样组织形式。抽样误差的作用:1. 在于说明样本指标的代表性大小。 误差大,则样本指标代表性低; 误差小,则样本指标代表性高; 误差等于0,则样本指标和总体指标一样大。2. 说明样本指标和总体指标相差的一般范围。二、抽样平均误差抽样平均误差实际上是样本指标的标准差。通常用表示。在N中抽出
7、n样本,从排列组合中可以有各种各样的样本组:1. 如果是重复抽样:2. 如果是不重复抽样:考虑顺序的不重复抽样:不考虑顺序的不重复抽样:三、纯随机抽样的抽样平均误差(一) 平均数的抽样平均误差1.重复抽样取得的途径有:1.用过去全面调查或抽样调查的资料,若同时有n个的资料,应选用数值较大的那个;2. 用样本标准差S代替全及标准差;3. 在大规模调查前,先搞个小规模的试验性的调查来确定S,代替;4. 用估计的方法。例: 某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时(一般为重复抽样),根据以往资料:=20小时,根据以往资料,产品质量不太稳定,若=200
8、小时,2.不重复抽样:(二) 成数的抽样平均误差已证明得:成数的方差为p(1-p) 某玻璃器皿厂某日生产15000只印花玻璃杯,现按重复抽样方式从中抽取150只进行质量检验,结果有147只合格,其余3只为不合格品,试求这批印花玻璃杯合格率(成数)的抽样平均误差。四、类型抽样的抽样平均误差在重复抽样情况下: ; 五、机械抽样(等距抽样)的抽样平均误差1.若按无关标志排队公式用以上纯随机抽样的公式,一般采用不重复抽样公式:2. 若按有关标志排队公式用类型抽样的公式:六、整群抽样的抽样平均误差整群抽样的抽样平均误差受三个因素影响:(1)抽出的群数(r)多少 (反比关系)(2)群间方差( ) (正比关
9、系) (3) 抽样方法七、多阶段抽样的抽样平均误差 以两阶段抽样为例设总体分R组,每组包含 个单位,若各组 相等,则在抽样第一阶段,从R组中抽出r组;在抽样第二阶段,在中选的r组中随机抽选 个单位,若各组m相等,则n=rm则:在重复抽样下在不重复抽样下设某大学在学期初对学生进行体重抽样调查,先从全校80个班以不重复抽样方法随机抽取8个班,然后再从抽取的班中再分别抽取10个人作为第二阶段抽样单位。计算所得的抽样平均体重为60.5千克,抽样各班内方差平均数 为50,各班之间体重方差 为22。假设全校各班均为40人。试以94.45%(t=2)的概率,推断该校学生平均体重的范围。已知: 第四节 全及指
10、标的推断一、点估计和区间估计(一)点估计只要在样本代表性大,且对全及指标精确性要求不高的情况下,可采用点估计法。如能满足下列三个准则:无偏性、一致性、有效性,就会得到合理的估计(二)区间估计是根据样本指标和抽样误差去推断全及指标的可能范围,它能说清楚估计的准确程度和把握程度。根据中心极限定理,得知当n足够大时,抽样总体为正态分布,根据正态分布规律可知,样本指标是以一定的概率落在某一特定的区间内,统计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概率F(t)的保证下: 抽样极限误差=t,(t为概率度)可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。抽样误差范围的实际意义是要求被估计的
11、全及指标或P落在抽样指标一定范围内,即落在的范围内。例:当F(t)=68.27%时,抽样极限误差等于抽样平均误差的1倍(t=1);当F(t)=95.45%时,抽样极限误差等于抽样平均误差的2倍(t=2);当F(t)=99.73%时,抽样极限误差等于抽样平均误差的3倍(t=3);二、全及平均数和全及成数的推断例1:某农场进行小麦产量的抽样调查,该农场小麦播种面积为10000亩,采用不重复的简单随机抽样从中选100亩作为样本,进行实割实测,得到样本的平均亩产量为400千克,样本标准差为12千克。则:例2:某机械厂日产某种产品8000件,现采用纯随机不重复抽样方式(按重复抽样公式计算),从中抽取40
12、0件进行观察,其中有380件为一级品,试以概率95.45%的可靠程度推断全部产品的一级品率及一级品数量的范围。则:抽样一级品率:三、全及总体总量指标的推断(一) 直接推断法抽样平均数(成数)总体单位数=总体标志总量1.如果采用点估计方法:上例1中:40010000=400(万千克) 如果用区间估计方法:上例1中该农场小麦总产量的范围为: t=2: (397.62 402.38)10000=397.62 402.38(万千克) t=3: (396.43 403.57)10000=396.43 403.57(万千克) 2.上例2中,全部一级品数量的范围为: (92.82% 97.18%)8000=7425.6 7774.4(件)例2:某市房地局,年报工资总额3218.1万元。现抽查14个单位: 年报:415.03万元 多报:0.44万元 少报:1.47万元 抵冲后 1.47-0.44=1.03(万元)第五节 必要抽样数目的确定一、影响必要抽样数目的因素二、必要抽样数目的计算公式(一) 简单随机抽样 (二) 类型抽样重复抽样: 不重复抽样: (三) 机械抽样在有总体差异程度和比重的全面资料时,可采用类型抽样的公式; 没有总体的全面资料时,可采用简单随机抽样的公式。(四) 整群抽样