统计学:抽样推断课件.ppt

上传人:小飞机 文档编号:1850815 上传时间:2022-12-21 格式:PPT 页数:44 大小:971.50KB
返回 下载 相关 举报
统计学:抽样推断课件.ppt_第1页
第1页 / 共44页
统计学:抽样推断课件.ppt_第2页
第2页 / 共44页
统计学:抽样推断课件.ppt_第3页
第3页 / 共44页
统计学:抽样推断课件.ppt_第4页
第4页 / 共44页
统计学:抽样推断课件.ppt_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《统计学:抽样推断课件.ppt》由会员分享,可在线阅读,更多相关《统计学:抽样推断课件.ppt(44页珍藏版)》请在三一办公上搜索。

1、第七章 抽样推断,2,本 章 内 容,抽样推断的基础理论,1,抽样误差,2,抽样估计,3,样本容量的确定,4,3,教学目的与要求:抽样推断是统计研究中的一种重要分析方法。学习本章要求掌握能利用统计资料来推断总体数量特征的原理及方法,其具体要求:1、理解抽样推断的概念及特点2、深刻理解抽样误差产生的原因3、对抽样误差、抽样平均误差、抽样极限误差加以区别4、重点掌握简单随机抽样组织形式的区间估计方法5、掌握必要样本单位数的确定方法重点掌握:1、抽样推断的概念及特点。 2、简单随机抽样组织形式的区间估计。 3、简单随机抽样单位数的确定方法。,4,导入案例,现实生活中,可能遇到这样的情况:某企业对所生

2、产灯泡的使用寿命进行质量检验,当然该企业不可能把全部灯泡逐一加以检查和实验直至破坏。企业只能从全体产品中,随机抽取一部分进行检验,将样本检验结果当作对全体真实信息的估计,由此推断出该企业灯泡的使用寿命。 这种从研究对象全体中抽取一部分来观察,进而对整体进行推断的方法,即抽样推断。,5,7.1 抽样推断的基础理论,抽样推断过程:,总体指标,样本,样本统计量,6,7.1 抽样推断的基础理论,概念:抽样推断是按随机原则从全部研究对象中抽取一部分单位进行调查,并以调查结果对全部研究对象的数量特征作出具有一定可靠程度的估计与推断,从而认识现象总体的一种统计方法。 特点: 1.按随机原则抽选调查单位 2.

3、非全面调查 3.抽样误差是可以事先计算并控制 4.运用概率估计的方法 作用:1.不能进行全面调查时,可以采用抽样调查 2.对全面调查资料进行必要的补充和修正 3.应用于时效性强的统计资料 4.对于某些不必要火灾经济上不允许经常使用全面调查的经济现象。,7,有关抽样的基本概念(一)总体和样本总体:又称全及总体。指所要认识的研究对象全体。总体单位总数用“N”表示。样本:又称子样。是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体。样本单位总数用“n”表示。(二)参数和统计量参数:反映总体数量特征的全及指标。统计量:根据样本数据计算的综合指标。,8,7.1 抽样推断的基础理论,9,

4、(三)样本容量和样本个数样本容量:一个样本包含的单位数。用 “n”表示。一般要求 n 30样本个数:从一个全及总体中可能抽取的样本数目。,10,7.1 抽样推断的基础理论,样本容量 样本容量是指一个样本所包含的单位数,也称样本单位数,以n表示。,样本个数 又称样本可能数目。是指从一个总体中可能抽取的样本个数。,11,(四)重复抽样和不重复抽重复抽样:又称回置抽样。可能组成的样本数目: Nn不重复抽样:又称不回置抽样。可能组成的样本数目:N(N-1)(N-2)(N-n+1),12,7.1 抽样推断的基础理论,重复抽样 从总体N个单位中随机抽取一个单位,算作一次调查,调查完成后,又将这个单位重新放

5、回总体中参加下一次抽选,依次下去,直到抽取n次构成样本。,不重复抽样 从总体N个单位中随机抽取一个单位,算作一次调查,调查完成后,不再将这个单位放回总体中参加下一次抽选,依次下去,一共抽取n个单位组成一个样本。,13,7.1 抽样推断的基础理论,12345,14,7.2 抽样误差,一、抽样误差的概念和影响抽样误差的主要因素 (一)抽样误差的概念1、定义 抽样误差是指样本指标与总体指标之间的离差。具体地讲,就是样本平均数与总体平均数的离差或样本成数与总体成数的离差.,15,2、来源在抽样中误差的来源有许多方面。一类是登记性误差,即在调查过程中由于观察、测量、登记、计算上的差错所引起的误差,这类误

6、差是所有统计调查都可能发生的。另一类是代表性误差,即样本各单位的结构不足以代表总体而引起的误差。代表性误差的发生有以下两种情况:一种是由于违反抽样调查的随机原则,如有意地多选较好的单位或较坏的单位进行调查。这样做,所据以计算的抽样指标必然出现偏高或偏低现象,造成系统性的误差。系统性误差和登记性误差都是不应当发生的,是可以也应该采取措施避免发生或将其减小到最小限度。另一种情况是,即使遵守随机原则,由于被抽选的样本有各种各样,只要被抽中的样本其内部各单位被研究标志的构成比例和总体有所出入,就会出现或大或小的偶然性代表性误差。我们所讲的抽样误差就是指这种偶然性代表性误差。即按随机原则抽样时,在没有登

7、记性误差和系统性误差的条件下单纯由于不同的随机样本得出不同估计量而产生的误差。抽样误差是抽样调查所固有的,是无法避免与消除的,但可以运用数学方法计算其数量界限,并通过抽样设计程序控制其范围,所以这种抽样误差也称为可控制误差。需要指出,抽样误差不是固定不变的数,它的数值是随样本不同而变化的,所以它也是随机变量。,16,(二)影响抽样误差大小的因素1、样本单位数的多少在其他条件不变的情况下,抽样单位数愈多,抽样误差就愈小;反之,抽样单位数愈少,抽样误差就愈大。2、总体被研究标志的变异程度在其他条件不变的情况下,总体单位标志值的变异程度愈小,则抽样误差也愈小,抽样误差和总体变异程度成正比变化。3、抽

8、样方法抽样方法不同,抽样误差也不同,一般说重复抽样的误差比不重复抽样的误差要大。4、抽样调查的组织形式不同的抽样组织形式就有不同的抽样误差.,二、抽样平均误差 抽样平均误差是反映抽样误差一般水平的指标。 由于从一个全及总体中可以抽出很多个样本,因而抽样指标(如样本平均数、样本成数)就有许多不同数值。这就是说,从理论上讲,可以计算出很多个误差,这些误差有大有小。要反映抽样误差的一般水平,就有必要计算抽样平均误差。,17,18,(一)、抽样平均误差,1、抽样平均误差(定义公式),注:在实际运算中总体单位数很多,甚至无限大,所能抽取的样本可能数目也很多,因此上述公式在实际中是无法使用的。,7.2 抽

9、样误差,19,2、抽样平均数的平均误差,重复抽样 不重复抽样,7.2 抽样误差,20,例5-1 有四名同学,数学期末成绩分别为72分、80分、88分和90分,从中随机抽取2人成绩构成样本,求抽样平均误差。,解: 分 分,7.2 抽样误差,21,重复抽样下 : 分不重复抽样下: 分 因此,重复抽样下,数学成绩的抽样平均误差为7.03分;不重复抽样下,数学成绩的抽样平均误差为4.11分。,7.2 抽样误差,22,3、抽样成数的平均误差,重复抽样不重复抽样,7.2 抽样误差,23,例5-2 某高校有在校生1万人,随机抽取500人,其中持有手机的学生占380人,求手机持有率的抽样误差。 解:,7.2

10、抽样误差,24,重复抽样下:不重复抽样下: 因此,重复抽样下,手机持有率的抽样平均误差为1.9%;不重复抽样下,手机持有率的抽样平均误差为1.84%。,7.2 抽样误差,25,7.3 抽样估计,一、 抽样估计 根据样本平均数或成数估计总体平均数或成数。 二、抽样估计方法 点估计 区间估计,26,(一)点估计,点估计又叫定值估计,即直接用样本指标作为总体指标的估计值。 例:某中学抽选300名学生进行手机持有率的调查,结果75%的学生都持有手机,可作出如下估计:该中学学生手机持有率为75% .优缺点:点估计的方法优点是简便易行,原理直观,常为实际工作采用。但不足之处是没有表明抽样估计的误差,更没有

11、表明误差在一定范围内的概率保证程度有多大。要了解这个问题,就必须采用区间估计方法。,7.3 抽样估计,27,(二)区间估计,1.概念 在一定概率保证下,以点估计值为中心,并给出总体指标落在这个区间的一个估计范围。 2. 内容 抽样极限误差 概率度 区间估计的计算,7.3 抽样估计,28,(一)抽样极限误差,概念:即可允许的误差范围,它是指样本指标所允许取的上限或下限与总体指标之差的绝对值。设以表示抽样极限误差,则有: 区间( , )称为平均数的估计区间; 区间( , )称为成数的估计区间。,7.3 抽样估计,29,(二)概率度,基于理论上的要求,抽样极限误差要用抽样平均误差作为衡量尺度。用 或

12、 分别除 或 ,得出相对数t,称为概率度。,7.3 抽样估计,30,(三)区间估计的计算,已知抽样误差范围,求概率保证程度 : 1.抽取样本,计算样本指标,作为总体指标估计值,并推算抽样平均误差。 2.根据给定的抽样极限误差范围,估计总体指标所在的上下限。 3.求概率度t值,再根据正态分布概率表求出相应的置信度F(t)。,7.3 抽样估计,31,7.3 抽样估计,根据已给定的概率保证程度进行区间估计,具体步骤:1.抽取样本,计算样本指标,作为总体指标估计值,并推算抽样平均误差。 2.根据给定的概率保证程度,查表求得概率度t的值;3.根据概率度和抽样误差推算出,并根据抽样极限误差求出被估计总体指

13、标的上下限。,区间估计与点估计的区别一是区间估计不像点估计那样用一个数值对总体指标进行估计,而是用一个范围对总体指标进行估计;二是点估计是一个确切的估计值,而区间估计的是区间,根据概率度的要求可宽可窄;三是点估计无法回答估计值的把握程度,而区间估计可以回答估计区间的把握程度。,32,33,例5-3 对某高校四级考试成绩进行调查,随机抽取了300名同学,求得平均成绩为62分,标准差为15分,若要求允许误差 ,试估计该校的四级平均成绩的区间 。,7.3 抽样估计,34,例5-3 对某高校四级考试成绩进行调查,随机抽取了300名同学,求得平均成绩为62分,标准差为15分,若要求允许误差 ,试估计该校

14、的四级平均成绩的区间 。 解:由题可知 则:,7.3 抽样估计,35,上限= 下限= F(t)=F(2.3)=0.9786 可作如下区间估计:在97.86%的概率保证程度下,该校四级平均成绩在6064分之间。,7.3 抽样估计,36,练习题:在4000件成品中按不重复方法抽取200件进行检查结果有废品8件,当概率为0.9545(t=2)时,试估计这批成品废品量的范围.,解:,37,废品率的范围:4%2.7% 废品率的区间范围在1.3%-6.7%之间。 废品数量区间:40001.3%-40006.7% 废品量的区间范围在52(件)-268(件)之间。,38,7.4 样本容量的确定,一、影响样本容

15、量的因素 1.总体单位标志变异程度 2.允许误差范围 3.置信度F(t) 4.抽样方法和抽样组织方式,39,二、样本容量的确定1.推断总体均值时样本容量的确定 重复抽样 不重复抽样 2.推断总体成数时,样本容量的确定 重复抽样 不重复抽样,7.4 样本容量的确定,40,例5-7 某市8000名学生参加数学中考,根据去年的情况,中考成绩的标准差为20分,而及格率为80%,用重复抽样法,要求在99.73%的概率保证下,平均成绩的极限误差不超过2分,中考成绩合格率的极限误差不超过5%,问至少要抽取多少名同学进行成绩调查? 解:由题可知:,7.4 样本容量的确定,41,样本均值的单位数: 样本成数的单

16、位数: 注意:两个样本指标的单位数不同,应取比较多的单位数,才能满足不同的要求,即应抽取900名同学进行成绩调查。,7.4 样本容量的确定,42,某单位按简单随机重复抽样方式抽取40名职工,对其业务情况进行考核,考核成绩资料如下: 68 89 88 84 86 87 75 73 72 68 82 99 58 81 54 79 76 95 76 6060 91 65 76 72 76 85 89 92 7064 57 83 81 78 77 72 61 70 87 要求:(1)根据上述资料按成绩分成以下几组:60分以下,6070分,7080分,8090分,90100分,并根据分组整理成变量分配数列;(2)根据整理后的变量数列,以97.45%的概率保证程度推断全体职工业务考试成绩的区间范围;(3)若其它条件不变,将允许误差范围缩小一半,应抽取多少名职工?,43,本 章 小 结,44,本 章 小 结,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号