《六章抽样估计课件.ppt》由会员分享,可在线阅读,更多相关《六章抽样估计课件.ppt(123页珍藏版)》请在三一办公上搜索。
1、第六章 抽样估计,第六章 抽样估计,主要内容,1.抽样估计概述2.抽样误差3.抽样估计的方法4.样本容量的确定,主要内容1.抽样估计概述,设计抽样方案,定义总体及样本,选择抽样框,选择抽样方法,确定样本容量,抽样调查的程序,进入调查阶段,设定选选确抽样调查的程序进,选 择 抽 样 框,抽样框就是所有总体单位的集合,是总体的数据目录或全部总体单位的名单。根据抽样框可以重新界定总体。如抽样框是电话簿,则家庭成员总体可以被重新界定为列入电话簿中的那部分家庭的成员。,选 择 抽 样 框抽样框就是所有总体单位的集合,是总体的数据,抽 样 框,例 如:要从商学院的全体学生中抽取500名学生作为调查样本,则
2、商学院全体在校生的名单就是这次抽样的样本框;如果是从该校所有班级中抽取部分班级的全体同学作为调查样本,则此时的抽样框就是全校所有班级的名单,因为此时的抽样单位已经不再是单个的学生,而是单个的班级。,抽 样 框例 如:要从商学院的全体学生中抽取500名学生作,注 意:一般街道居委名录、企业名录、电话本、花名册、俱乐部名录、黄页簿、工商局企业登记库、行业年鉴等都是市场调查中常用的抽样框。,注 意:一般街道居委名录、企业名录、电话本、花名册、俱乐部名,1.抽样估计的概述,概念:在抽样调查的基础上,用样本的实际资料计算样本指标,并据此估计和推断总体相应数量特征的一种统计推断方法。特点:随机原则抽取;部
3、分单位推断总体;误差可算可控;基于概率的一种统计推断方法。,1.抽样估计的概述概念:,理论基础: 大数法则、中心极限定理大数法则:关于大量的随机现象具有稳定性质的法则。它论证了抽样平均数趋近于总体平均数的趋势,为抽样估计提供了重要的依据。中心极限定理:研究变量和分布序列的极限定理。如果总体变量存在有限的平均数和方差,那么不论这个总体变量分布如何,随着抽样单位数n的增加,抽样平均数的分布将趋近于正态分布。,理论基础:,抽样估计中的基本概念,(一)总体和样本(二)总体指标和样本指标(三)重复抽样和不重复抽样,抽样估计中的基本概念(一)总体和样本,总体和样本,总体:研究现象的全体,由所研究范围内具有
4、某种相同性质的全体单位所组成的整体。通常用N表示。,品质标志,数量标志,总体,属性总体,变量总体,总体和样本总体:研究现象的全体,由所研究范围内具有某种相同性,样本(子样):从总体中随机抽取出来,代表总体的那部分单位的集合。样本单位数,又称样本容量,通常用n表示。,样本容量如何确定呢?,样本(子样):从总体中随机抽取出来,代表总体的那部分单位的集,样本容量的确定,一般来讲:当 n 30,称为大样本; 当 n 30,称为小样本。,样本容量的确定一般来讲:当 n 30,称为大样本,样本容量,调查误差,调查费用,小样本容量节省费用但调查误差大,大样本容量调查精度高但费用较大,找出在规定误差范围内的最
5、小样本容量,确定样本容量的意义,找出在限定费用范围内的最大样本容量,样本容量调查误差调查费用小样本容量节省费用但调查误差大大样本,总体指标和样本指标,总体指标:根据总体中各单位的标志值或标志属性计算的,反映总体数量特征的综合指标。,总体是唯一确定的,总体指标的数值也是唯一确定的,样本数据(已知) 总体指标(未知),总体指标和样本指标总体指标:根据总体中各单位的标志值或标志属,统计推断,总体指标:参数(未知量),样本总体指标:统计量(已知量),总体是唯一确定 的,样本总体不唯一,注 意,统计推断总体指标:参数(未知量)样本总体指标:统计量(已知量,设总体变量X为:X1,X2,X3,XN,则有:,
6、或,或,对于变量总体,常用的总体指标有总体平均数 、总体标准差,设总体变量X为:X1,X2,X3,XN,则有:或或对于变量,对于属性总体,最常用的指标是成数。 总体成数表示总体中具有某种性质的单位数在总体全部单位数中所占的比重,以P表示;总体中不具有某种性质的单位数在总体全部单位数中所占的比重则以Q表示。,设总体N个单位中,有N1个单位具有某种性质,N0个单位不具有某种性质,N1+ N0=N,则有:,,,对于属性总体,最常用的指标是成数。 设总体N个单,样本指标:根据样本各单位标志值或标志属性计算的综合指标,也称统计量,它是来估计和推断总体参数的。与总体指标相对应,有样本平均数、样本成数及样本
7、标准差等。,样本指标:根据样本各单位标志值或标志属性计算的综合指标,也称,设样本变量x的观察值为:x1,x2,xn,则:,样本平均数:,样本标准差:,样本方差:,样本成数:,或,或,或,样本成数的标准差:,设样本变量x的观察值为:x1,x2,xn,则:样本平均数,重复抽样,又称作重置抽样、有放回抽样,抽出个体,登记特征,放回总体,继续抽取,特点,同一总体单位有可能被重复抽中,而且每次抽取都是独立进行,重复抽样又称作重置抽样、有放回抽样抽出登记放回继续特点同一总,不重复抽样,又被称作不重置抽样、不放回抽样,抽出个体,登记特征,继续抽取,特点,同一总体中每个单位被抽中的机会并不均等,在连续抽取时,
8、每次抽取都不是独立进行。,是最常用的抽样方法,用于无限总体和许多有限总体样本单位的抽样。,不重复抽样又被称作不重置抽样、不放回抽样抽出登记继续特点同一,名 称样 本总 体定义从总体中抽出的部分单位研究对象的全部单,1. 纯随机抽样(简单随机抽样) 对总体不做任何分类或排序,完全按随机原则抽样。 适用范围: 总体规模不大,内部差异较小。例:一个班组有A、B、C、D、E 5个工人,随机抽取2个工人的日工资数作为了解整个班组平均工资水平的样本。 可能的结果是,有放回抽样:25个样本不放回抽样:20个样本,随机抽样设计,1. 纯随机抽样(简单随机抽样)有放回抽样:25个样本随机抽,2. 等距抽样(机械
9、抽样或系统抽样) 将总体按某一标志值顺序排列,然后相等距离或相等间隔抽取样本单位。 间隔距离: N:总体单位数 n:需要抽取的样本单位数 例:从某企业5000名职工中抽取100人进行家庭收入水平调查。 样本的距离= 起点的选择:按姓氏排序,在第一个间隔中随机选取。,2. 等距抽样(机械抽样或系统抽样)排序标志无关标志,优点: 1.能保证被抽取的单位在总体中均匀分布 2.能使抽样过程简化 应用中的注意事项: 注意抽样间隔或样本距离和现象本身的节奏性和循环周期相重合的问题,第六章抽样估计课件,3. 类型抽样(分类抽样或分层抽样),先将总体中的所有单位按某个标志分组,然后从各组按纯随机抽样或等距抽样
10、方式抽样。采用这种方法,由于各单位之间的差异因划类或分层而缩小,这就比较容易选出有代表性的样本 适用范围:总体情况复杂,各类型或层次之间的差异较大而总体容量又较大。,优点:比简单纯随机抽样更精确,能以较少的抽样单位数得到较准确的推断结果。特别是当总体各单位变量值大小悬殊、各组标志变动程度很大时,划分类型能保证各组都有选中的机会。,3. 类型抽样(分类抽样或分层抽样) 先将总体中的所,类型抽样分类,类型比例抽样:按统一的比例来确定各类型组应抽选的样本单位数,即各类型中抽取的样本单位数 占各类型组所有单位数 的比例是相等的,等同于样本单位总数 n 占总体单位数 N 的比例类型适宜抽样:考虑各类型标
11、志变动程度 不同,变动程度大的组要多抽样,变动程度小的类型组可少抽样,使得各类型组的变动程度 在所有类型变动程度之和 中的比例相同,等同于 或,类型抽样分类类型比例抽样:按统一的比例来确定各类型组应抽选的,例:某项粮食播种面积20000亩,其中有平原和山区两种地形。以类型抽样的方法了解平均粮食产量。,类型抽样确定各组样本的方法:,地形全部面积(Ni)样本面积(ni)平原 14000,4. 整群抽样 将总体按某个标志分为多个群,按纯随机抽样方式或等距抽样方式,抽取若干群,然后对所抽中的各群中的全部单位一一进行调查。 适宜范围:不适合单个抽样的场合,就可采用整群抽样方式。 优缺点:调查方便,但抽样
12、误差较大。 例:从某县100个村中抽出10个村,进行全面调查,就可以大致了 解农村家庭副业发展情况。,总群数 R =13,C DG K,样本数 r =4,样本容量,n=nc+nd+ng+nk,4. 整群抽样总群数 R =13C D样本数 r =,5. 多阶段抽样 总体包含的单位很多,分布很广,要通过一次抽样抽选样本很困难,此时,可以将其分成若干阶段,然后逐阶段进行抽样,以完成整个抽样过程。 特点:多个阶段、多种方法综合抽样,优点是降低抽样成本。 例:对某山区的林采蓄积量作抽样调查。将总体50块面积相等的地划为10个区,每个区包括5个地块。采用两阶段抽样,先从10个区选中30%,再从选中的区域中
13、抽取60%的地块组成样本进行调查。,第六章抽样估计课件,2.抽样误差,抽样误差地概念抽样误差的侧度,2.抽样误差抽样误差地概念,-指所选取的样本的结果不能完全代表总体而导致的误差。,抽样误差,误差种类,样本单位的结构与总体单位结构分布不一致而产生的误差。,-指所选取的样本的结果不能完全代表总体而导致的误差。抽,三种误差的区别:,登记误差:由于人的主观失误在观察、登记、计算时造成的误差,可以避免。系统性误差:由于有意识选取调查单位造成的系统偏差,理论上可以避免。随机误差:由于按照随机原则抽取样本而产生的误差,无法避免但可以控制。,因 此:理论上讲,抽样误差一般指随机误差,而不包括登记性误差和系统
14、性偏差。,三种误差的区别:登记误差:由于人的主观失误在观察、登记、计算,影响抽样误差的因素,总体各单位的差异程度: 标准差越大,抽样误差越大; 样本单位数的多少: n 越大,抽样误差越小; 抽样方法:不重复抽样比重复抽样小; 抽样组织方式:简单随机抽样最大。,影响抽样误差的因素 总体各单位的差异程度:,抽样误差的侧度,(一)抽样实际误差(二)抽样平均误差(三)抽样极限误差,抽样误差的侧度(一)抽样实际误差,抽样实际误差,在一次具体的抽样调查中,由随机因素引起的样本指标与总体指标之间的离差。 抽样实际误差是无法计算的。同时,抽样实际误差仅仅是一系列可能出现的误差数值之一,因此,抽样实际误差没有概
15、括所有可能产生的抽样误差。,抽样实际误差 在一次具体的抽样调查中,由随机因素引起的样,抽样平均误差,反映抽样误差一般水平的一个指标。是指抽样平均数的标准差或抽样成数的标准差。设以 表示样本平均数的抽样平均误差,以 表示样本成数的抽样平均误差,M表示全部可能的样本数目,则有:,抽样平均误差反映抽样误差一般水平的一个指标。,(例题分析),【例】设一个总体,含有4个元素(个体) ,即总体单位数N=4。4 个个体分别为x1=1、x2=2、x3=3 、x4=4 。总体的均值、方差及分布如下,均值和方差,(例题分析)【例】设一个总体,含有4个元素(个体) ,即总体,(例题分析), 现从总体中抽取n2的简单
16、随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为,(例题分析) 现从总体中抽取n2的简单随机样本,在重复,(例题分析), 计算出各样本的均值,如下表。并给出样本均值的抽样分布,(例题分析) 计算出各样本的均值,如下表。并给出样本均值,(例题分析), = 2.5 2 =1.25,总体分布,(例题分析) = 2.5 总体分布14230.1.2,在实际抽样调查中,总体单位数N常常很大,样本单位数n一般也不小于30,由此产生的所有样本数目是极大的,不可能抽完所有可能的样本;同时,在开展抽样调查之前,总体指标是未知的。因此,实际工作中,定义式缺乏可操作性。,在实际抽样调查中,总体单位数
17、N常常很大,样本单位,抽样平均误差,1.平均数的抽样平均误差(1)在简单随机重复抽样条件下:式中: 代表总体标准差,n代表样本单位数。(2)在简单随机不重复抽样条件下:,修正因子1,故不重复抽样的抽样平均误差总是小于重复抽样的抽样平均误差。,抽样平均误差1.平均数的抽样平均误差修正因子1故不重复抽样,当总体单位数N足够大的情况下,不重复抽样的抽样平均误差可以采用其近似公式计算:,当总体单位数N足够大的情况下,不重复抽样的抽样平均误差可以采,2.成数的抽样平均误差(1)在简单随机重复抽样条件下:(2)在简单随机不重复抽样条件下:,2.成数的抽样平均误差,上述公式中计算时需要注意:公式中的参数都是
18、总体指标,在实际应用中,选取的抽样估计方法。,上述公式中计算时需要注意:公式中的参数都是,第一,在大样本下,可用样本的标准差S代表总体标准差 ,用样本成数p代表总体成数P;小样本下,总体标准差 用修正的样本标准差S*代替,其计算公式为:,第一,在大样本下,可用样本的标准差S代表总体标准差,第二,若过去进行过同样的调查,可用过去的总体标准差 代替现在的总体标准差 ,用过去的总体成数P代替现在的总体成数P.,第二,若过去进行过同样的调查,可用过去的总体标准差 代,抽样极限误差,由于抽样只是从所有可能样本的角度来度量的抽样误差的一般水平,而任意一次抽样的实际抽样误差可能大于其抽样平均误差,也可能小于
19、其抽样平均误差。 在抽样估计中,不仅需要计算抽样平均误差,还需要了解在一定可能性下抽样误差的可能范围。,抽样极限误差 由于抽样只是从所有可能样本的角,定义:指的是样本指标与总体指标之间的误差范围。用 和 分别表示样本平均数和样本成数的抽样极限误差,则有:,定义:指的是样本指标与总体指标之间的误差范围。用 和,抽样极限误差是一个可能而非完全肯定的范围。因此这个可能范围的大小是可能大小的相对应。在抽样估计中,表示这个可能性大小的概念叫做置信度(又称可靠程度、把握程度、概率保证程度等),通常用(1- )表示。,抽样极限误差是一个可能而非完全肯定的范围。因此这个可能范围的,1.在大样本下,样本平均数
20、服从以总体平均数 为中心的正态分布,该分布的标准差就是抽样平均误差 。,68.2%95.45%99.73%,样本平均数落在的范围,可能性大小,1.在大样本下,样本平均数 服从以总体平均数,平均数的抽样极限误差可以用抽样平均误差的倍数来度量,其计算公式:同理,也可以得到在大样本条件下成数的抽样极限误差的计算公式为:,平均数的抽样极限误差可以用抽样平均误差的倍数来度量,其计算公,168.27%295.45%399.73%1.9695%1.,置信度(1- )越大, 越大,抽样极限误差也就越大,抽样估计的精确度也就越低,所以在抽样估计中,要求达到100%的置信度是不太可能的。另一方面,置信度小了,估计
21、结论的可靠性太低,又会影响估计本身的价值。因此,在做估计时,应该将置信度要求与估计的精确度要求结合起来考虑。,置信度(1- )越大, 越大,抽样极限误差也就越,在小样本条件下,要用修正的样本方差来估计总体方差。这时,有关的抽样分布不再是标准正态分布而是一个t分布。t分布依赖自由度,随自由度的增大,t分布逐渐趋于标准正态分布,在小样本条件下,要用修正的样本方差来估计总体方差。这时,有关,t 分布的图形(红色的曲线是标准正态分布),n = 1,n=15,n =2,不同的样本容量对应不同的自由度,因此对应的 t 分布也不同。,自由度概念,可以自由选择的数值的个数。,t 分布的图形(红色的曲线是标准正
22、态分布)n = 1n=15,因此,在小样本条件下,平均数的抽样极限误差要根据如下公式来计算:式中: 是置信度 时自由度为(n-1)的t分布变量的值。对于给定的置信度 , 可查t分布表(P242)而得。,因此,在小样本条件下,平均数的抽样极限误差要根据如下公式来计,抽样估计的方法,估计量与估计值点估计与区间估计评价估计量的标准,抽样估计的方法估计量与估计值,1.估计量:用于估计总体参数的随机变量如样本均值,样本比例、样本方差等例如: 样本均值就是总体均值 的一个估计量 2.参数用 表示,估计量用 表示 3.估计值:估计参数时计算出来的统计量的具体值如果样本均值 x =80,则80就是的估计值,估
23、计量与估计值 (estimator & estimated value),1.估计量:用于估计总体参数的随机变量估计量与估计值,参数估计的方法,估 计 方 法,点 估 计,区间估计,参数估计的方法估 计 方 法点 估 计区间估计,一个总体参数的估计,一个总体参数的估计总体参数符号表示样本统计量均值比例(成数),点估计(point estimate),1.用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计值 用样本成数直接作为总体成数的估计值2.没有给出估计值接近总体参数程度的信息3.点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等,点估计(point e
24、stimate)1.用样本的估计量直,评价估计量的标准,在参数估计中,要有合适的样本指标作为估计量。但不是所有的样本指标都能够充当很好的估计量。这就需要评价样本指标的优良标准。作为优良的估计量,应该符合以下标准:,评价估计量的标准在参数估计中,要有合适的样本指标作为估计量。,无偏性(unbiasedness),无偏性:估计量抽样分布的数学期望等于被估计的总体参数,抽样平均数的平均数等于总体平均数,抽样成数的平均数等于总体成数。,无偏性(unbiasedness)无偏性:估计量抽样分布的,有效性(efficiency),有效性:指对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效。,优
25、良估计量,有效性(efficiency)有效性:指对同一总体参数的两,一致性(consistency),一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。,式中 为任意小的数。,一致性(consistency)一致性:随着样本容量的增大,区间估计 (interval estimate),1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的。 2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量。 比如,某班级平均分数在7585之间,置信水平是95%,区间估计 (interval estimate),区间估计是根
26、据给定的置信度的要求,估计出可能包含总体参数的区间下限和上限。一般来说,对于总体被估计参数 ,由样本构造出两个估计量 和 (其中 ),使区间( , )涵盖被估计参数真值得概率为( ),即,置信度,区间下限,区间上限,区间估计是根据给定的置信度的要求,估计出可能包含总体参数的区,可将抽样极限误差的公式变形,如下:,对总体平均数和总体成数进行区间估计的公式。即当有了样本指标,并根据给定的置信度计算出抽样极限误差之后,就可得到以同样的置信度水平来估计总体平均数和总体成数的区间。,可将抽样极限误差的公式变形,如下:对总体平均数和总体成数进行,总体均值的区间估计,1.区间估计的基本原理2.正态总体或大样
27、本的估计3.正态总体小样本的估计,总体均值的区间估计1.区间估计的基本原理,区间估计的图示,区间估计的图示X95% 的样本 -1.96 x +1,1.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 2.表示为 (1 - 为是总体参数未在区间内的比例 3.常用的置信水平值有 99%, 95%, 90%相应的 为0.01,0.05,0.10,置信水平,1.将构造置信区间的步骤重复很多次,置信区间包含总体参,1.由样本统计量所构造的总体参数的估计区间称为置信区间。 2.统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间。,置信区间 (c
28、onfidence interval),1.由样本统计量所构造的总体参数的估计区间称为置信,置信区间与置信水平,均值的抽样分布,(1 - ) % 区间包含了 % 的区间未包含,用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个,置信区间与置信水平 均值的抽样分布(1 - ) % 区间包,总体均值的区间估计 (正态总体、已知,或非正态总体、大样本),总体均值的区间估计 (正态总体、已知,或非正态总体、大,总体均值的区间估计,1.假定条件总体
29、服从正态分布,方差() 已知如果不是正态分布,可由正态分布来近似 (n 30) 2.总体均值 在1-置信水平下的置信区间为,重复抽样,不重复抽样,总体均值的区间估计 1.假定条件重复抽样不重复抽样,(例题分析),【例】某种零件的长度服从正态分布,从某天生产一批零件中按重复抽样方法随机抽取9个,测得其平均长度为21.4cm。已知总体标准差为=0.15cm。试估计该批零件平均长度的置信区间,置信水平为95%。,解:已知N(,0.152),n=9, 1- = 95%,z/2=1.96 总体均值在1-置信水平下的置信区间为,该批零件平均长度的置信区间在21.302cm21.498cm之间,(例题分析)
30、【例】某种零件的长度服从正态分布,从某天生产一批,(例题分析),【例】在某天生产的500袋食品中,按不重复抽样方法随机抽取25袋进行检查,测得平均每袋的重量为996g。已知该种袋装食品的重量服从正态分布,且标准差为20g。试估计该种食品平均重量的置信区间,置信水平为95%。,解:已知N(,202),n=25, 1- = 95%,z/2=1.96 总体均值在1-置信水平下的置信区间为,该种食品平均重量的置信区间为988.35g1003.65g之间,(例题分析)【例】在某天生产的500袋食品中,按不重复抽样方,总体均值的区间估计 (正态总体、未知、小样本),总体均值的区间估计 (正态总体、未知、小
31、样本),总体均值的区间估计 (小样本),1.假定条件总体服从正态分布,且方差() 未知小样本 (n 30)2.使用 t 分布统计量,总体均值 在1-置信水平下的置信区间为,总体均值的区间估计 (小样本)1.假定条件总体均值 在1,t 分布,分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布,t 分布 分布是类似正态分布的一种对称分布,它通常要比正态,总体均值的区间估计(例题分析),【例】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(小时)如下。建立该批灯泡平均使用寿命9
32、5%的置信区间,总体均值的区间估计(例题分析)【例】已知某种灯泡的寿命服从正,总体均值的区间估计(例题分析),解:已知N(,2),n=16, 1- = 95%,t/2=2.131。根据样本数据计算得: , 总体均值在1-置信水平下的置信区间为,该种灯泡平均使用寿命的置信区间为1476.8小时1503.2小时,总体均值的区间估计(例题分析)解:已知N(,2),n,总体比例的区间估计,大样本重复抽样时的估计方法大样本不重复抽样时的估计方法,总体比例的区间估计大样本重复抽样时的估计方法,总体比例的区间估计(重复抽样),1.假定条件总体服从二项分布可以由正态分布来近似2.使用正态分布统计量,3. 总体
33、比例在1-置信水平下的置信区间为,总体比例的区间估计(重复抽样)1.假定条件3. 总体比例,总体比例的区间估计(不重复抽样),1.假定条件总体服从二项分布可以由正态分布来近似2.使用正态分布统计量,3. 总体比例在1-置信水平下的置信区间为,总体比例的区间估计(不重复抽样)1.假定条件3. 总体比例,总体比例的区间估计(例题分析),【例】某城市想要估计下岗职工中女性所占的比例,随机抽取了100个下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间,解:已知 n=100,p65% , z/2=1.96,该城市下岗职工中女性比例的置信区间为55.65%74.3
34、5%,总体比例的区间估计(例题分析)【例】某城市想要估计下岗职工中,总体比例的区间估计(例题分析),【例】某企业共有职工1000人。企业准备实行一项改革,在职工中征求意见,采取不重复抽样方法随机抽取200人作为样本,调查结果显示,有150人表示赞成该项改革,50人表示反对。试以95%的概率确定赞成改革的人数比例的置信区间,解:已知 n=100,p75% ,z/2=1.96,该企业职工中赞成改革的人数比例的置信区间为69.63%80.37%之间,总体比例的区间估计(例题分析)【例】某企业共有职工1000人,样本容量的确定,组织抽样调查的一项重要工作就是要确定合适的样本容量。样本容量直接关系到调查
35、的精度、调查费用、调查时间、需要配备的人力物力等许多方面。,样本容量多大才合适呢?,样本容量的确定 组织抽样调查的一项重要工作就是要确,必要样本容量的计算公式,在重复抽样条件下,样本平均数的抽样极限误差的公式为:故可以反推出必要样本容量的计算公式:,必要样本容量的计算公式在重复抽样条件下,样本平均数的抽样极限,同样,在不重复抽样条件下,样本平均数的抽样极限误差的公式为:故可以反推出必要样本容量的计算公式:,同样,在不重复抽样条件下,样本平均数的抽样极限误差的公式为:,同样,在重复和不重复抽样条件下成数的必要样本容量分别为:,同样,在重复和不重复抽样条件下成数的必要样本容量分别为:,从上述公式中
36、可以看出,样本的必要单位数n受抽样极限误差 的制约, 越小则样本n就需要越多。,从上述公式中可以看出,样本的必要单位数n受抽样极限误差,(例题分析),【例】拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望边际误差为400元,应抽取多大的样本容量?,(例题分析)【例】拥有工商管理学士学位的大学毕业生年薪的标准,解: 已知 =2000, =400, 1-=95%, z/2=1.96 12 /22置信度为90%的置信区间为,即应抽取97人作为样本,解: 已知 =2000, =400, 1-=95,1. 的取值一般小于0.12. 未知时,可取最大值0
37、.5,确定样本容量应该注意的问题,1. 的取值一般小于0.1确定样本容量应该注意的问,(例题分析),【例】根据以往的生产统计,某种产品的合格率约为90%,现要求边际误差为5%,在求95%的置信区间时,应抽取多少个产品作为样本?,解:已知=90%,1-=95%, Z/2=1.96,E=5%,应抽取的样本容量为,应抽取139个产品作为样本,(例题分析)【例】根据以往的生产统计,某种产品的合格率约为9,课堂练习,课堂练习,一、判断题部分,1.从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。( ),一、判断题部分 1.从全部总体单位中按照随机原则抽取,2.在抽样推断中,全及指标值
38、是确定的、唯一的,而样本指标值是一个随机变量。( ),2.在抽样推断中,全及指标值是确定的、唯一的,而样本指标,3.抽样成数的特点是:样本成数越大,则抽样平均误差越大。( ),3.抽样成数的特点是:样本成数越大,则抽样平均误差越,4.抽样平均误差总是小于抽样极限误差。( ),4.抽样平均误差总是小于抽样极限误差。(,5.从全部总体单位中抽取部分单位构成样本,在样本变量相同的情况下,重复抽样构成的样本个数大于不重复抽样构成的样本个数。( ),5.从全部总体单位中抽取部分单位构成样本,在样本变,6.抽样平均误差反映抽样误差的一般水平,每次抽样的误差可能大于抽样平均误差,也可能小于抽样平均误差。(
39、),6.抽样平均误差反映抽样误差的一般水平,每次抽样的误,7.在抽样推断中,抽样误差的概率度越大,则抽样极限误差就越大于抽样平均误差。( ),7.在抽样推断中,抽样误差的概率度越大,则抽样极限误差,8.抽样估计的优良标准有三个: 无偏性、可靠性和一致性。( ),8.抽样估计的优良标准有三个: 无偏性、可靠,9.抽样推断的目的是,通过对部分单位的调查,来取得样本的各项指标。( ),9.抽样推断的目的是,通过对部分单位的调查,来取得,10.总体参数区间估计必须具备三个要素即:估计值、抽样误差范围和抽样误差的概率度。( ),10.总体参数区间估计必须具备三个要素即:估计值、抽样,1.抽样平均误差是(
40、 )。A.抽样指标的标准差B.总体参数的标准差C.样本变量的函数 D.总体变量的函数,二、单项选择题部分,A,1.抽样平均误差是( )。二、单项选择题部分A,2.抽样调查所必须遵循的基本原则是( )。A.准确性原则 B.随机性原则C.可靠性原则 D.灵活性原则,B,2.抽样调查所必须遵循的基本原则是( )。B,3.在简单随机重复抽样条件下,当抽样平均误差缩小为原来的1/2时,则样本单位数为原来的( )。 A.2倍 B.3倍 C.4倍 D.1/4倍,C,3.在简单随机重复抽样条件下,当抽样平均误差缩小为原来的1/,4.在一定的抽样平均误差条件下( )。A.扩大极限误差范围,可以提高推断的可靠程度
41、 B.扩大极限误差范围,会降低推断的可靠程度 C.缩小极限误差范围,可以提高推断的可靠程度 D.缩小极限误差范围,不改变推断的可靠程度,A,4.在一定的抽样平均误差条件下( )。A,5.反映样本指标与总体指标之间的平均误差程度的指标是( )。A.平均数离差 B.概率度 C.抽样平均误差 D.抽样极限误差,C,5.反映样本指标与总体指标之间的平均误差程度的指标是( )。,6.以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值本身,这一标准称为( )。A.无偏性 B.一致性 C.有效性 D.准确性,A,6.以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的,7.抽样误差是指(
42、 )。A.调查中所产生的登记性误差B.调查中所产生的系统性误差C.随机的代表性误差D.计算过程中产生的误差,C,7.抽样误差是指( )。C,8.抽样极限误差和抽样平均误差的数值之间的关系为( )。A.抽样极限误差可以大于或小于抽样平均误差B.抽样极限误差一定大于抽样平均误差C.抽样极限误差一定小于抽样平均误差D.抽样极限误差一定等于抽样平均误差,A,8.抽样极限误差和抽样平均误差的数值之间的关系为( )。A,1.抽样推断的特点是( ) .由推算认识总体的一种认识方法 .按随机原则抽取样板单位 .运用概率估计的方法 .可以计算,但不能控制抽样误差 .可以计算并控制抽样误差,三、多项选择题部分,1
43、.抽样推断的特点是( ) 三、多项选择题,2.抽样估计中的抽样误差( ) .是不可避免要产生的 .是可以通过改进调查方式来消除的.是可以事先计算出来的 .只能在调查结束后才能计算的.其大小是可能控制的,2.抽样估计中的抽样误差( ) ,3.从总体中抽取样本单位的具体方法有( ).简单随机抽样 .重复抽样 .不重复抽样 .等距抽样 .非概率抽样,3.从总体中抽取样本单位的具体方法有( ),4.抽样推断中,样本容量的多少取决于( ).总体标准差的大小 .允许误差的大小 .抽样估计的把握程度 .总体参数的大小 .抽样方法和组织形式,4.抽样推断中,样本容量的多少取决于(,5.用抽样指标估计总体指标,所谓优良估计的标准有( ) .客观性 B.无偏性 C.一致性 D.有效性 E.优良性,5.用抽样指标估计总体指标,所谓优良估计的标准有(,本章结束,本章结束,