抽样分布与参数估计PPT.ppt

上传人:小飞机 文档编号:6575048 上传时间:2023-11-14 格式:PPT 页数:63 大小:2.74MB
返回 下载 相关 举报
抽样分布与参数估计PPT.ppt_第1页
第1页 / 共63页
抽样分布与参数估计PPT.ppt_第2页
第2页 / 共63页
抽样分布与参数估计PPT.ppt_第3页
第3页 / 共63页
抽样分布与参数估计PPT.ppt_第4页
第4页 / 共63页
抽样分布与参数估计PPT.ppt_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《抽样分布与参数估计PPT.ppt》由会员分享,可在线阅读,更多相关《抽样分布与参数估计PPT.ppt(63页珍藏版)》请在三一办公上搜索。

1、第六章 抽样分布与参数估计,第六章 抽样分布与参数估计,学习目标:1、理解抽样分布的特点;2、理解抽样估计的概念、特点、作用以及几个基本概念;3、掌握抽样误差的含义和影响抽样误差的主要因素素;4、熟练掌握抽样平均误差的计算;5、熟练掌握总体均值和总体成数的区间估计方法;6、掌握必要抽样数目的确定方法;7、能够正确选择抽样组织方式。,6.1 抽样推断的概述,6.1.1 抽样推断的概念、特点和作用 6.1.2 抽样推断相关的几个基本概念 6.1.3 抽样误差 6.1.4 抽样调查的理论依据,6.1.1 抽样推断的概念、特点和作用,1、抽样推断的概念 抽样推断是按随机原则从全部研究对象中抽取一部分单

2、位进行观察,根据样本资料计算样本的特征值,然后以样本的特征值,对总体的特征值做出具有一定可靠性的估计和判断,以反映总体的数量特征和数量表现的一种统计方法。所谓随机原则,即是在抽取样本时,排除人们主观意图的作用,使得总体中的各单位均以相等的机会被抽中。随机原则又称为等可能性原则。2、抽样推断的特点(1)调查单位的确定是按随机原则从全部总体单位中抽取的。(2)用部分单位的指标数值去推断和估计总体指标数值。(3)抽样调查中的抽样误差是不可避免的,事先是可以计算并加以控制的。,6.1.1 抽样推断的概念、特点和作用,3、抽样推断的作用(1)有些现象是无法进行全面调查的,为了测算全面资料,必须采用抽样调

3、查的方法。(2)从理论上讲,有些现象虽然可以进行全面调查,但实际上没有必要或很难办到,也要采用抽样调查。(3)抽样调查的结果可以对全面调查的结果进行检查和修正。(4)抽样调查可以用于工业生产过程的质量控制。(5)利用抽样调查原理,可以对某些总体的假设进行检验,来判别这种假设的真伪,依决定行动的取舍。,6.1.2.1 全及总体和抽样总体,1、全及总体也称为总体或母体,是指所要认识的研究对象的全体,它是由所研究范围内具有某种共同性质的全体单位所组成的集合体。在本章用大写的字母N代表全及总体的单位数。2、抽样总体就是按随机原则从全及总体中抽取的一部分单位组成的小总体。抽样总体简称样本,它也是由许多性

4、质相同的单位组成的。本章中用小写n代表样本的单位数,样本单位数n也称为样本容量,即一个样本中所包含的单位数。组成样本的每个单位称为样本单位。注意:作为抽样推断对象的全及总体是唯一确定的,但作为观察对象的样本就不是唯一的。从一个全及总体中可以抽取很多个样本,每次抽到哪个样本是不确定的。,6.1.2.2 全及指标和抽样指标,1、全及指标又称总体指标或总体参数 根据总体各单位的标志值或标志属性计算的反映总体数量特征的综合指标称为全及指标,又称总体指标。常用的全及指标主要有四个:全及平均数、全及成数、总体数量标志的标准差及方差、总体是非标志的标准差及方差。2、抽样指标又称样本指标或样本统计量 根据样本

5、总体各单位标志值计算的反映样本特征的综合指标称为抽样指标,又称样本指标或样本统计量。它是用来估计总体参数的。与总体参数相对应,常用的抽样指标也有四个指标:抽样平均数、抽样成数、样本数量标志标准差及方差、样本是非标志标准差及方差。,6.1.2.3 样本容量与样本个数,1、样本容量 样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,一般用n表示,它表明一个样本中所包含的单位数。样本容量大,样本误差会小,但调查费用必须增加,反之,样本容量过小,又将导致抽样误差增大,甚至失去抽样推断的价值。样本按照样本容量的大小可以分为大样本和小样本。一般地说,n30为大样本,n30为小样本。在对社会经

6、济现象进行抽样调查时,多数采用大样本。2、样本个数 样本可能数目又称样本个数,是指从全及总体中可能抽取多少个样本。它既和每个样本的容量有关,也和抽样的方法有关。当样本容量给定时,样本的可能数目便由抽样方法决定。,6.1.2.4 重复抽样和不重复抽样,1、重复抽样 重复抽样是从全及总体中抽取样本时,随机抽取一个样本单位,记录该单位有关标志表现以后,把它放回到全及总体中去,再从全及总体中随机抽取第二个单位,记录它有关标志表现以后,也把它放回全及总体中去,照此下去直到抽选n个样本单位。一般地说,从总体N个单位中,随机重复抽取n个单位构成样本,则共有样本个数为:NNNN=Nn个。可见,重复抽样时全及总

7、体单位数在抽选过程中始终没有减少,而且各单位有被重复抽中的可能。,6.1.2.4 重复抽样和不重复抽样,2、不重复抽样 不重复抽样是从全及总体中抽取第一个样本单位,记录该单位有关标志表现后,这个样本单位不再放回全及总体中参加下一次抽选。然后,从总体N-1个单位中随机抽选第二个样本单位,记录了该单位有关标志表现以后,该单位也不再放回全及总体中去,再从全及总体N-2单位中抽选第三个样本单位,照此下去直到抽选出n个样本单位。一般地说,要从总体N个单位中随机不重复抽取n个单位为:N(N1)(N2)(Nn+1)=N!/(Nn)!由此可见,在相同的样本容量要求下,不重复抽样的样本总是比重复抽样的样本个数少

8、 可见,不重复抽样时,总体单位数在抽选过程中是逐渐减少的,而且各单位没有重复被抽中可能。两种抽样方法会产生三个差别:抽取的样本可能数目不同;抽样误差的计算公式不同;抽样误差的大小不同。,6.1.3 抽样误差,1、抽样误差的一般概念 抽样误差是指根据样本数据计算而得的样本统计量值与被它估计的未知的总体参数真值之间的偏差。具体地是指样本平均数 与总体平均数 的差(-),样本成数p与总体成数P的差(p-P)。2、影响抽样误差的因素 1)总体内各单位被研究标志的变异程度。2)样本容量的大小,即样本单位数的多少。3)抽样的组织形式。4)抽样的方法。,对一个全及总体进行抽样调查时,可以抽出很多个样本。而每

9、一个样本都可以计算抽样的平均数和抽样成数,这样,样本的平均数与总体的平均数,样本的成数与总体的成数之间的误差,也有多种多样。因此,必须用抽样平均误差来反映抽样误差的一般水平。抽样平均误差为抽样平均数(或抽样成数)对总体平均数(或总体成数)的标准差。为了区别于通常的标准差,我们分别用 表示抽样平均数的平均误差,用 表示抽样成数的平均误差。用M表示样本的可能数目。则有:在实际中,作为总体的平均数 和总体成数P是未知的。同时也不可能把所有样本的平均数和成数都计算出来。所以,按照上述计算抽样平均误差的方法,实际上也是办不到的。,6.1.3.3 抽样平均误差,6.1.3.3 抽样平均误差,A、抽样平均数

10、的抽样平均误差,a.在重复抽样的条件下,(6-3),b.在不重复抽样条件下,(6-4),6.1.3.3 抽样平均误差,B、抽样成数的抽样平均误差,a.在重复抽样的条件下,(6-5),b.在不重复抽样的条件下,(6-6),6.1.3.4 抽样极限误差,抽样平均误差是所有可能样本指标与总体指标之间的平均离差。但是在进行抽样推断时,我们实际只抽取一个样本,用一个样本指标去推断总体指标。由于抽样是按随机原则进行的,所有不同的样本组合都可能抽到,这样所得到的每个样本实际误差可能大于抽样平均误差,也可能小于抽样平均误差,因此包括在抽样平均误差范围内的只有一部分样本,而不是所有的样本组合。但对于某一项调查来

11、说,根据客观要求一般应有一个允许的误差范围,也就是说若抽样误差在这个范围之内就认为是可行的。这一允许的误差范围就称作抽样的极限误差。抽样极限误差是抽样指标与总体指标之间,在一定概率保证程度下的,抽样误差的最大可能范围。总体指标虽然是一个确定的量,但它是未知的,而样本指标是一个随机变量,其取值是不定的,它是围绕着总体指标左右变动的,因此,我们只能在一定的概率保证程度下,用一定的范围来控制误差。,6.1.3.4 抽样极限误差,通常用表示抽样极限误差,设x和p分别表示抽样平均数和抽样成数的可能误差范围,则有:x=-(6-7)p=p-P(6-8)根据概率论数理统计原理,样本平均数和样本成数分别渐进地服

12、从于N(X,)和N(P,p(1-p)的正态分布。因此有:P-2=0.9545 Pp-P2=0.9545 即抽样极限误差在2倍的抽样平均误差范围内的可能性为95.45%。也就是说,我们有95.45%的可靠性程度来判断,样本指标与总体指标之间的误差不超过2 或者2。,6.1.3.4 抽样极限误差,抽样极限误差的计算公式为:=t(6-9)即有:x=t(6-10)p=t(6-11)式中的t表示极限误差范围为抽样平均误差的若干倍,t称为概率度。,6.1.3.5 抽样估计的置信度,抽样极限误差的估计总是要和一定的概率保证程度联系在一起的。因为既然抽样误差是一个随机变量,我们就不能期望抽样平均数(成数)落在

13、一个区间内是一个必然事件,而只能给予一定的概率保证程度。所以在进行抽样估计时,不但要考虑抽样误差的可能范围有多大,而且还必须考虑到落在这一范围内的概率有多少。前者我们称为抽样估计的精确程度,后者则是抽样估计的可靠程度,也是在概率上的保证程度问题。我们称之为抽样估计的置信度。抽样估计的置信度和抽样的极限误差有着密切联系。根据中心极限定理,当抽样误差范围增大时,抽样估计的置信度也增大,抽样估计的精确程度则降低,反之亦然。实质上,抽样估计的精确度与置信度是一对反方向运动的矛盾。科学的调查方法要合理地协调它们之间的矛盾。,6.1.4 抽样调查的理论依据,抽样调查是建立在概率论大数定律基础上的。大数定律

14、的一系列定理为抽样调查提供了数学依据。大数定律是阐明大量随机现象平均结果的稳定性的一系列定理的总称。它说明如果被研究的总体是由大量的相互独立的随机因素所构成,而且每个因素对总体的影响都相对的小。那么将这些大量因素加以平均,因素的个别影响将相互抵消,而呈现出共同作用的影响,使总体具有稳定的性质。,6.2 抽样分布,6.2.1 样本空间 6.2.2 重复抽样分布 6.2.3 不重复抽样分布,6.2.1 样本空间,样本分布就是样本统计量的概率分布,在一个抽样框里可以抽取多套样本,组成样本空间,每一个样本空间可以构造出多个统计量,如样本均值、样本成数、样本方差等。由随机抽样抽到的各个样本单位不同,其数

15、据表现不同,统计量的取值也不同。在同一个总体中抽出样本容量相同的所有可能样本后,计算每个样本统计量的值和相应的概率,就组成样本统计量的概率分布,简称抽样分布。在进行随机抽样时,按样本抽取方法的不同,可分为放回的重复抽样和不放回的不重复抽样,从而形成重复抽样的样本分布和不重复抽样的样本分布。,6.2.2 重复抽样分布,1、样本平均数的抽样分布 样本平均数分布是由所有组合样本平均数的值与其相应的概率表示。例6-5某工作班组有4个工人,其小时工资分别为1、2、3、4元,则:总体平均数:总体方差:,现用重复抽样的方法从4人中随机抽取2人样本,用样本的平均工资来推断总体的平均工资。按重复抽样所组成的样本

16、平均数的空间分布列表如下:,表6-1 重复抽样样本小时平均工资组合(单位:元),根据上表整理的样本频数分布及样本统计量,计算如下:表6-2 样本均值及频数分布,根据以上资料,计算样本平均数的数学期望和抽样方差如下:抽样方差的开平方即为抽样误差,用符号表示,重复抽样的样本统计量与总体参数之间存在的关系:1、重复抽样的样本平均数的数学期望(样本总平均数)恒等于总体平均数。即 2、随机变量的抽样方差等于总体方差的1/n,即 即,6.2.2 重复抽样分布,2、抽样成数的抽样分布 成数是指具有某种特征现象的数量占总体数量的比重,则 现用重复抽样方法抽取n个单位,计算样本成数p,应用样本平均数分布的性质推

17、广到成数的分布,则有,其方差,(6-14),(6-15),6.2.3 不重复抽样分布,1.样本平均数的抽样分布 例6-7仍用前述的例子,按不重复抽样所组成的样本平均数的空间分布如下:,表6-3 不重复抽样的样本小时平均工资组合,根据上表整理的样本频数分布及样本统计量计算如下:,表6-4 样本均值及频数分布,根据以上资料,计算样本平均数和抽样方差如下:不重复抽样的样本统计量与总体参数之间存在的关系:1、不重复抽样的样本平均数的数学期望(样本总平均数)恒等于总体平均数 即 2、样本变量的抽样方差等于总体方差的1/n,再乘以一个不重复抽样时的调节系数(N-n)/(N-1)即 不重复抽样与重复抽样相比

18、,其抽样方差多了一个调节系数:(N-n)/(N-1)(N-n)/N=(1-n/N)由此可见不重复抽样的抽样方差都是比重复抽样的抽样方差小。,6.2.3 不重复抽样分布,2、抽样成数的抽样分布 不重复抽样的成数统计量,比照前述的公式,有:,例6-8引用前述例子,在不重复抽样情况下,产品合格率的抽样平均误差为:(N=10000),上述计算也可看出,当N相对n很大时,不重复抽样的抽样误差与重复抽样的抽样误差很接近。,在重复抽样和不重复抽样的情况下,抽样平均数和抽样成数的抽样平均误差的公式列表,表6-5 抽样平均误差公式,6.3 总体参数估计,6.3.1 总体参数估计概述 6.3.2 总体参数的点估计

19、 6.3.3 总体参数的区间估计 6.3.4 样本容量的确定 6.3.5 使用计算公式求必要样本容量时应注意的问题,6.3.1 总体参数估计概述,总体参数估计就是用样本统计量去估计未知的总体参数。总体参数是一个常量,样本统计量是一个随机变量,用样本统计量去估计总体参数时,必然会产生一个随机误差。总体参数估计有两种方法:点估计和区间估计。点估计:即直接用样本统计量的值直接估计总体参数的值。区间估计:即用样本统计量去估计总体参数的值时存在的误差范围有多大,它要解决的是估计的精确度问题,误差范围越小,其估计的精确程度也就越高。同时还要考虑可靠性问题,即参数估计的正确性概率有多大。在进行参数估计时,应

20、根据所要解决问题的重要性和工作需要,综合考虑参数估计的精确度(可允许的误差区间,亦称置信区间)和可接受的估计概率(置信概率)。精确度和精确程度是一对矛盾。,6.3.2 总体参数的点估计,点估计又称定值估计,它是直接用样本统计量的值来估计总体参数的值,其特点是简易直观,但它并不考虑估计的误差范围和估计的可靠程度。,6.3.2.1 点估计的三个优良标准,1、无偏性。即样本统计量的值的数字期望(平均数)等于被估计的总体参数,用符号表示为。2、一致性。即随着样本单位 n的不断增大,样本统计量的值与被估计总体参数的值之间的误差越来越小,亦即原本统计量的值接近总体参数的值的可能性越来越大。一致性要求可以从

21、大数定律的角度来理解,用公式表示:公式中 为任意小的一个数。上式公式表明,样本统计量 与总体参数 之间差的绝对值小于一个任意小的数,当n趋于无穷大时,其发生的概率是肯定存在的,或者说这一事实肯定会发生的。3、有效性。即作为优良估计量的方差应该比其它方差小。例如,用随机抽样计算的统计量的值与用非随机抽样计算的统计量的值,分别估计总体参数的值,因为随机抽样的误差更小,则前者的估计比后者更有效。又如,用随机抽样统计量的样本平均数和中位数分别估计总体参数的值,由于样本平均数的抽样误差更小,则用前者的估计比后者更有效。,6.3.2.2 矩估计法,矩估计法也称数字特征法。它是用样本各阶原点矩的函数来估计总

22、体各阶原点矩的同一个函数,相应的总体估计量称为矩估计量。“矩”又称为“动量”,它本来是一个物理学中力学的概念,表示作用力、力臂和与其平衡点之间的数量关系。统计学借用“矩”这概念,通过计算一系列“矩”指数的数值来描述数据的分布特征。算术平均数、方差及平均差等都可以看成是“矩”的特例。,矩的表现形式,或,当取,时,其一阶原点的矩就是算术平均数。,当取,时,其二阶矩就是变量分布的方差。,当取,时,其一阶矩的绝对离差之和就是变量分布的平均差。,通过样本数量特征的计算来估计与之相应的总体数量特征是最常用的矩估计法。,6.3.2.2 顺序统计量法,顺序统计量即是前面有关章节已讲过的位置平均数的统计量,它用

23、中位数来表示。样本中位数和极差 R都是重要的统计量。当样本数值中含有极端数值时,样本中位数比平均数更适宜作为总体参数值的统计量,计算更简便直观。,对于正态总体 的样本中位数 渐进地服从正态分布 因而对于正态总体,用 估计总体 是适宜的。对于总体标准差的估计,可以用样本极差来估计。与R有如下关系:一般情况下,可近似地取为:用样本极差R来估计总体标准差 时,其缺点是不如用样本标准差来得可靠,当n越大,两者差别越大。当n10时,可直接用样本标准差来估计总体标准差。,(6-20),6.3.3 总体参数的区间估计,区间估计是指由样本统计量的值来估计总体未知参数的值的时候,其误差的区间范围有多大,并给出可

24、靠程度的估计概率。在正态分布的情况下,估计概率(亦称置信概率)是由概率度(置信度)和相应的概率函数 来表示,常用的数值如下(双侧):表6-6 在正态分布下估计概率常用数值,,,正态分布图,在进行区间估计时,根据研究目的和数据分布的特征,给定估计的概率保证程度(概率度)来推算抽样误差范围,或根据给定的允许误差范围(亦称极限误差)来推断相应的概率保证程度。,抽样极限误差、抽样平均误差和概率度三者之间有如下关系:抽样极限误差概率度抽样平均误差,重复抽样:,(6-21),不重复抽样:,(6-22),6.3.3.1 总体平均数的区间估计,1、总体方差已知时 当总体方差已知,或样本容量n充分大(n30)时

25、,样本数据可用正态分布的概率来估计。2、总体方差未知时 当总体服从正态分布但总体方差未知时,可用样本标准差s来代替总体标准差,但这要应用t分布的统计量进行总体参数的区间估计。同时,样本容量是小样本(n30)时,也要应用t统计量。其区间估计的公式为:重复抽样:(6-23)不重复抽样:(6-24),例6-9某地区从10000亩水稻面积中,以不重复抽样方法随机抽取100亩耕地进行调查,实测计算平均亩产600公斤,标准差为72.6公斤,求(1)以0.9973的概率可靠程度进行其平均亩产和总产量的区间估计。(2)若要求极限误差不超过14.4公斤,则其估计的概率可靠程度是多少?,解:已知 公斤,公斤,N=

26、10000亩,n=100亩,=14.4公斤 抽样平均误差:(公斤)抽样极限误差:(公斤)平均产量的区间估计(公斤)总产量的区间估计(万公斤)当公斤时,则,例6-10对某电视节目进行收视率调查,在随机抽样调查的100人中,有20人经常看该节目,求该电视节目收视率的置信度为95%的估计区间?,解:已知,抽样平均误差:,抽样极限误差:,估计区间:,即该电视节目的收视率在12.16%到27.84%之间。,例6-11某企业对一批10000件产品进行质量检验,以不重复抽样方法随机抽取100件产品进行检验,发现其中有3件废品,请以90%的置信概率估计这批产品的废品率?,解:已知,抽样平均误差:,抽样极限误差

27、:,估计区间:,即该批产品的废品率在0.21%到5.79%之间。,6.3.4 样本容量的确定,样本容量的确定就是在已知估计的置信概率、允许的误差区间及样本标准差的情况下,推出必要的样本容量。,6.3.4.1 抽样平均数的样本容量,1、重复抽样的样本容量 2、不重复抽样的样本容量,6.3.4.2 抽样成数的样本容量,1、重复抽样成数的样本容量 2、不重复抽样成数的样本容量,例6-12 某地区开展城镇居民的家计调查,从历史资料得知该市居民的人均年收入的标准差为3000元,家庭消费中食品支出占总支出(恩格尔系数)的50%,要在95.45%的概率保证下,平均收入的极限误差不超过300元,恩格尔系数的极

28、限误差不超过4%,求必要的样本数?(假设该城镇有10 000户居民家庭),A:求人均收入的必要样本容量,解:在重复抽样的条件下:,(户),在不重复抽样的条件下:,(户),B:求样本成数的必要样本容量,在重复抽样的条件下:,(户),在不重复抽样的条件下:,(户),从上述两种调查目的要求来看,在重复抽样的条件下,至少要抽取625户城镇居民进行调查;在不重复抽样的条件下,至少要抽取589户城镇居民进行调查。,6.3.5 使用计算公式求必要样本容量时应注意的问题,1.当调查对象总体的方差和成数未知时,可用有关资料替代:1)使用历史资料;2)使用相同条件同类现象的资料;3)在正式调查前进行若干次试调查,

29、用试调查中的方差最大值来代替总体方差;4)当成数方差未知时,取成数方差最大值0.25代替。2.通过计算得出小数的数值,不能适用四舍五入的法则,不管小数的值大小如何都应该入,而凑成一个整数。3.当有两种调查目的时,分别计算平均数和成数的必要样本容量,可取一个较大的样本容量值来同时满足两种调查目的的需要。,6.4 抽样组织形式和误差估计,6.4.1 纯随机抽样(简单随机抽样)6.4.2 分层(类型)抽样 6.4.3 系统(等距)抽样 6.4.4 整群抽样 6.4.5 多(二)阶段抽样,6.4 抽样组织形式和误差估计,抽样组织形式有纯随机抽样、分层(类型)抽样、系统(等距)抽样、整群抽样和二(多)阶

30、抽样。评价多种抽样组织形式的抽样效果关键是对抽样误差的控制。抽样误差越小,则抽样效果也越好。,影响抽样误差的几个影响因素,1、总体单位标志值的变异性,变异越大,则方差越大,抽样误差也越大;2、样本容量,抽取的样本单位数越多,抽样误差越小;3、抽样方法,不重复抽样的误差比重复抽样的小,但总体单位数N与样本单位数n相比较很大时,抽样比n/N很小时,两种抽样方法的抽样误差很接近,有时也可用重复抽样的误差代替不重复抽样的误差;4、抽样的组织形式,严格来讲,纯随机抽样形式是最符合概率抽样理论,其它各种形式的抽样计算的抽样误差都应该与纯随机抽样误差进行对比,若前者小于后者,则说明该形式的抽样效果更好。,6

31、.4 抽样组织形式和误差估计,考虑抽样效果,同时还得考虑抽样调查的成本费用问题。考核抽样效果有一个很重要的原则:在既定调查费用的情况下,抽样误差越小越好;在既定的抽样误差范围控制的情况下,调查费用越少越好。调查费用包括:固定费用、调查方案设计费用,调查实施费用,办公费用及数据处理费用等。对一个抽样设计而言,并不是抽样误差越小越好,只要能够满足调查目的要求,综合平衡数据的准确性和可靠性就可以了。,6.4.1 纯随机抽样(简单随机抽样),用概率抽样方法抽取样本单位需要按照给定的入样概率通过一定的随机化程序来确定。当用样本统计量的值来估计总体参数值时,不仅要考虑样本观察值的特征,还要考虑其入样概率。

32、在目标总体单位(抽样框)中抽取样本单位时,每个单位都有非零概率入样,因其规模及入样条件不同,其入样概率是不一样的,称之为不等概率抽样。概率抽样的特点之一就是根据入样概率,样本可以估计抽样误差,而不一定需要重复抽取不同的样本,进而对总体参数做出有一定概率保证程度的推断估计。纯随机抽样的实施方法:1)抽签法,2)掷骰子法,3)落球法,4)随机数表法。,6.4.2 分层(类型)抽样,分层抽样也称类型抽样,它根据总体现象的特征,先按一定的标志把总体各单位分成若干层,然后在每一层中按随机原则抽取样本单位。为加强对总体现象的认识,通常先对总体进行观察分析,找出与研究标志有密切关系的辅助信息,以辅助信息为标

33、志,对总体进行分层。,6.4.3 系统(等距)抽样,系统抽样也称机械抽样,它将总体各单位按某种顺序排列,在规定的范围内随机抽选起点单位,然后按一定规则逐个抽选样本单位。系统抽样最常用的是采用等距抽样的方法,它是根据某个标志(与研究目的有关或无关的标志)把总体单位按某个顺序排列,随机抽取起始单位,然后等距地逐个抽取样本单位。,6.4.4 整群抽样,整群抽样也称集团抽样或聚点抽样,它把总体单位按某个标志划分为不同的群,然后随机抽取若干群,对抽中的样本群内所有单位进行全面调查。当群的大小相等,即群内单位相等时,称为等概率抽样,如果各群的大小并不相等,称为不等概率抽样。,6.4.5 多(二)阶段抽样,

34、多阶段抽样是整群抽样的进一步深化,它是在总体单位中随机抽一个较大的单位作为一阶样本,再从一阶样本中抽二阶样本,以此类推,直至抽到多阶样本。,本章小结,1、抽样推断是按随机原则从总体对中抽取一部分单位进行观察,然后以其结果对总体的特征值做出具有一定可靠性的估计和判断的一种统计方法。2、抽样推断牵涉下列基本概念:全及总体和抽样总体、全及指标和抽样指标、样本容量与样本个数、重复抽样和不重复抽样、抽样误差、抽样平均误差、抽样极限误差、抽样估计的置信度。3、样本平均数和抽样成数的抽样分布可以分为重复抽样和不重复抽样两种情况。4、总体参数估计就是用样本统计量去估计未知的总体参数。有点估计和区间估计两种方法。点估计又称定值估计,它是直接用样本统计量来估计总体参数的值;区间估计是指用样本统计量的值来估计总体未知参数的值的时候,其误差的区间范围有多大,并给出可靠程度的估计概率,分总体平均数的区间估计和总体成数的区间估计两种。5、样本容量的确定就是在已知估计的置信概率、允许的误差区间及样本标准差的情况下,推出必要的样本容量。6、抽样组织形式有纯随机抽样、分层(类型)抽样、系统(等距)抽样、整群抽样和二(多)阶抽样。评价多种抽样组织形式的抽样效果关键是对抽样误差的控制。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号