统计学课件-第七章抽样调查.ppt

上传人:牧羊曲112 文档编号:6440892 上传时间:2023-10-31 格式:PPT 页数:169 大小:1.86MB
返回 下载 相关 举报
统计学课件-第七章抽样调查.ppt_第1页
第1页 / 共169页
统计学课件-第七章抽样调查.ppt_第2页
第2页 / 共169页
统计学课件-第七章抽样调查.ppt_第3页
第3页 / 共169页
统计学课件-第七章抽样调查.ppt_第4页
第4页 / 共169页
统计学课件-第七章抽样调查.ppt_第5页
第5页 / 共169页
点击查看更多>>
资源描述

《统计学课件-第七章抽样调查.ppt》由会员分享,可在线阅读,更多相关《统计学课件-第七章抽样调查.ppt(169页珍藏版)》请在三一办公上搜索。

1、2023/10/31,课件,1,第七章 抽样调查,第一节 抽样调查的意义,第二节 总体和样本,第三节 抽样调查的数理基础,【学习目标】通过本章学习,通过对本章的学习,重点掌握参数估计和假设检验的方法;掌握抽样调查的基本概念和数理基础的核心内容;了解抽样调查的意义和抽样组织设计的应用。重点与难点:抽样平均误差的计算;抽样推断的优良标准;总体平均数、总体成数的和总体方差的检验;类型抽样设计和推断方法。,第五节 抽样设计,第四节 总体参数估计,第六节 总体假设检验,2023/10/31,课件,2,第一节 抽样调查的意义,一、抽样调查的概念和特点,(一)抽样调查的概念,抽样调查是一种科学的非全面调查。

2、它是按照随机原则从调查对象的总体中抽取部分单位进行调查,并根据这部分单位的调查结果推断总体的数量特征。,抽样调查必须按照随机原则来抽取被调查单位。,第七章 抽样调查,2023/10/31,课件,3,第一节 抽样调查的意义,(二)抽样调查的特点,1.随机抽取样本单位,2.推断总体数量特征,3.抽样调查结果只有可控性误差,第七章 抽样调查,2023/10/31,课件,4,第一节 抽样调查的意义,二、抽样调查的应用范围,1.用于不可能进行全面调查的现象,2.用于进行全面调查就会失去现实意义的现象,3.用于经济上不允许或精度上 不必要进行全 面调查的现象,4.用于时效性要求较强的调查,第七章 抽样调查

3、,2023/10/31,课件,5,第一节 抽样调查的意义,三、抽样调查的作用,1.经济性好,2.准确性高,3.速度快,4.可以取得比较详细的统计资料,5.可以对全面调查的资料进行补充和修正,第七章 抽样调查,2023/10/31,课件,6,第二节 总体和样本,一、全及总体和样本总体,(一)全及总体,也叫母体,简称为总体。,(二)抽样框,在实际进行抽样的总体范围内,包括全部抽样单位的名单框架称为抽样框。抽样框的主要形式有三种:名单抽样框 区域抽样框 时间表抽样框。,第七章 抽样调查,2023/10/31,课件,7,区域抽样框,在商场的大门口,在微波炉柜台前,在市区街道旁边,在某个住宅小区,中山路

4、桥西区桥东区华北地区东北地区居民一组居民二组,某外国公司在大连进行微波炉市场调查:,2023/10/31,课件,8,时间表抽样框,连续出产的产品总体可以编制抽样框:均匀的出产时间、可以预见到的产品总量。,连续到加油站加油的汽车总体无法编制抽样框:时间不定、总量也无法确定。,2023/10/31,课件,9,第二节 总体和样本,(三)样本总体,样本总体,又叫子样,简称样本(sample)。它是从全及总体中随机抽取出来(具体是从抽样框中抽取出来的),用来代表全及总体的那部分单位构成的总体。,样本总体的单位数称为样本容量,通常用小写字母n来表示。,样本容量n与总体单位数N的比值()称为抽样比。,样本容

5、量n在30以下时,称为小样本;达到或超过30时称为大样本。,第七章 抽样调查,2023/10/31,课件,10,第二节 总体和样本,二、总体指标和样本指标,(一)总体指标,总体指标是根据全及总体所有单位的标志值计算出来的,反映总体的数量特征。,总体指标也称为总体参数(Parameter),或参数。,。,总体指标主要有:总体平均数:,总体方差:,总体标准差:,总体比率(或),第七章 抽样调查,2023/10/31,课件,11,第二节 总体和样本,(二)样本指标,由样本总体各个单位的标志值计算的综合指标称为样本指标,样本指标又称为样本统计量(Statistic),简称为统计量。,样本指标主要有:样

6、本平均数:,样本方差:,样本标准差:,样本比率(或),第七章 抽样调查,2023/10/31,课件,12,第二节 总体和样本,三、抽样方法和样本可能数目,(一)抽样方法,1.重复抽样,重复抽样(sampling with replacement)也叫重置抽样,是指每次抽取一个单位记录其标志表现后又放回,重新参加下一次的抽选。,2.不重复抽样,不重复抽样(sampling without replacement)也叫不重置抽样,是指每次从总体中抽取一个单位记录其标志表现后不再放回,从剩余的单位中抽取下一个单位。,第七章 抽样调查,2023/10/31,课件,13,第二节 总体和样本,(二)样本可

7、能数目,样本可能数目是指抽样组织和抽样方法一定时,从总体N个单位中随机抽取一个容量为n的样本,该样本不同构成的可能数目,一般用m来表示。,1.重复抽样的样本可能数目(通常为考虑单位排列顺序),2.不重复抽样的样本可能数目(通常为考虑单位排列顺序),第七章 抽样调查,2023/10/31,课件,14,第三节 抽样调查的数理基础,一、抽样分布,抽样分布(sampling distribution)就是指样本统计量的概率分布。,例如,设总体有3名学生A、B和C,他们的考试成绩分别为5分、4分和3分。,现在采用抽样调查方法抽取其中的2名学生作为样本,了解这3名学生的平均成绩。,样本统计量为:,第七章

8、抽样调查,2023/10/31,课件,15,第三节 抽样调查的数理基础,若采用重复抽样,样本构成情况如下表所示。,重复抽样的样本统计量取值情况,第七章 抽样调查,2023/10/31,课件,16,第三节 抽样调查的数理基础,重复抽样的样本统计量分布表,第七章 抽样调查,2023/10/31,课件,17,第三节 抽样调查的数理基础,二、大数定律及其意义,大数定律是阐述大量随机变量的平均结果具有稳定性的一系列定律的总称。,1.独立同分布大数定律,独立随机变量 具有相同分布,且存在有限的数学期望 和方差,则对于任意小的正数,有,第七章 抽样调查,2023/10/31,课件,18,第三节 抽样调查的数

9、理基础,2.贝努力大数定律,设m是 n 次独立随机试验中事件A发生(“成功”)的次数,p是事件A在每次试验中发生的概率,则对于任意小的正数,有,大数定理从理论上揭示了样本和总体之间的内在联系,即随着抽样单位数n的增大,样本平均数(或比率)有接近于总体平均数(或比率)的趋势。,第七章 抽样调查,2023/10/31,课件,19,第三节 抽样调查的数理基础,大数定律可归纳如下:,1)现象的某种总体性规律(或称统计规律),只有当具有这种现象的足够多数的单位综合汇总在一起的时候,才能显示出来。因此,只有从大量现象的总体中,才能研究这些现象的规律性。2)现象的总体性规律或倾向通常是以平均数(或比率)的形

10、式表现出来的。3)当所研究的现象总体包含的单位越多,平均数(或比率)也就越能够正确反映出这些现象的规律性。,第七章 抽样调查,2023/10/31,课件,20,第三节 抽样调查的数理基础,4)各单位的共同倾向(这些表现为主要的、基本的因素)决定着平均数(或比率)的水平,而各单位对平均数(或比率)的离差(这些表现为次要的、偶然的因素)则会由于足够多数单位的综合汇总的结果,而相互抵消,趋于消失。,大数定律可归纳如下:,根据大数定律的内容特点,运用抽样法时,必须注意以下两个问题:,第一、抽样必须遵循随机原则。,第二、抽样必须遵循大量原则。,第七章 抽样调查,2023/10/31,课件,21,第三节

11、抽样调查的数理基础,三、正态分布及其意义,(一)正态分布的概念及其特点,1.正态分布的概念,正态分布的分布密函数为:,x为随机变量,e为自然对数的底,为圆周率,为变量x的平均数,为变量标准差。,第七章 抽样调查,2023/10/31,课件,22,第三节 抽样调查的数理基础,2.关于密度函数 的二个参数 和,平均数 决定密度函数 的中心位置。,第七章 抽样调查,2023/10/31,课件,23,第三节 抽样调查的数理基础,标准差 决定密度函数曲线 的陡缓程度,第七章 抽样调查,2023/10/31,课件,24,第三节 抽样调查的数理基础,3.正态分布密度函数的特点,1)对称性。,2)非负性。,3

12、)在 时达到极大值,4)的曲线在 处有拐点。,5)当 时,的曲线以x轴为渐近线。,第七章 抽样调查,2023/10/31,课件,25,第三节 抽样调查的数理基础,4.标准正态分布,标准正态分布的概率密度为:,若随机变量 服从标准正态分布,则记为它具有如下性质或结论。,第七章 抽样调查,2023/10/31,课件,26,第三节 抽样调查的数理基础,(二)正态分布的应用,求正态变量的概率,通常是先将一般正态变量转换为标准正态变量,然后从标准正态分布概率表中查出相应标准正态变量值所对应的分布函数值,再计算出所求正态变量研究区间的概率。,第七章 抽样调查,2023/10/31,课件,27,第三节 抽样

13、调查的数理基础,(二)正态分布的应用,部分常用z值和相应概率值,第七章 抽样调查,2023/10/31,课件,28,第三节 抽样调查的数理基础,四、中心极限定理及其意义,中心极限定理论证了如下几点:,1)如果总体服从正态分布,样本平均数也同样服从正态分布。,2)如果总体很大,但不服从正态分布,只要样本足够大,样本的总和或平均数就会趋近于正态分布。,。,3)样本平均数分布的数学期望(该抽样的所有可能样本平均数的均值)等于总体均值。即。,第七章 抽样调查,2023/10/31,课件,29,第四节 总体参数估计,第七章 抽样调查,一、参数估计的优良标准,(一)无偏性,(二)有效性,(三)一致性,20

14、23/10/31,课件,30,评价准则,的数学期望等于总体参数,即,该估计量称为无偏估计,无偏性,有效性,当 为 的无偏估计时,方差 越小,无偏估计越有效。,一致性,对于无限总体,如果对任意,则称 是,的一致估计。,估计量,第七章 抽样调查,2023/10/31,课件,31,第四节 总体参数估计,第七章 抽样调查,二、抽样误差,(一)抽样误差的意义,1.抽样误差的概念,抽样调查过程中的误差根据其来源大体上可以归纳为两类:一类是登记性误差,另一类是代表性误差。,代表性误差包括系统误差和随机误差两种。,2023/10/31,课件,32,第四节 总体参数估计,第七章 抽样调查,2.影响抽样误差的因素

15、,1)总体变异度,2)样本容量,3)抽样方法,4)抽样组织方式,2023/10/31,课件,33,第四节 总体参数估计,抽样平均误差一般如下公式表示:,为第 可能样本的平均数,为总体平均数,是样本可能数目,第七章 抽样调查,(二)抽样平均误差,1.概念:抽样平均误差是指所有可能样本的估计值与所要估计参数离差的平均数。,2023/10/31,课件,34,第四节 总体参数估计,2.抽样平均误差的计算,1)样本平均数的抽样平均误差,重复抽样情况下:,不重复抽样情况下:,第七章 抽样调查,2023/10/31,课件,35,第四节 总体参数估计,2)样本比率的抽样平均误差,在重复抽样情况下:,在不重复抽

16、样情况下:,第七章 抽样调查,2023/10/31,课件,36,第四节 总体参数估计,(三)抽样极限误差,在一次抽样中允许的最大误差范围称为抽样极限误差。是变动的抽样指标与唯一确定的但又是未知的全及指标之间离差的可能范围。,设x与p分别表示样本平均数与样本比率的抽样极限误差,则有:,第七章 抽样调查,2023/10/31,课件,37,第四节 总体参数估计,抽样极限误差通常需要以抽样平均误差为标准单位来加以衡量,把抽样极限误差除以相应的抽样平均误差,得出数值z,以表明抽样极限误差是抽样平均误差的多少倍。,在概率统计中,z称为概率度。其计算公式为:,第七章 抽样调查,2023/10/31,课件,3

17、8,第四节 总体参数估计,为了表示抽样误差的相对程度,需要计算抽样误差系数 和,由抽样误差系数还可以计算抽样估计精度(Ax或Ap)。,第七章 抽样调查,2023/10/31,课件,39,第四节 总体参数估计,三、抽样估计的置信度,抽样估计时总体参数落在某个区间的概率保证程度称为抽样估计的置信度。,抽样估计的置信度(confidence interval)和抽样极限误差有着密切联系。当抽样极限误差范围增大时,抽样估计的置信度也随之有规律地增大,抽样估计的精确程度则随之有规律地降低,反之亦然。,第七章 抽样调查,2023/10/31,课件,40,第四节 总体参数估计,四、点估计与区间估计,点估计也

18、称定值估计,它是以样本指标的计算结果作为总体参数估计的结果,即用样本指标值直接作为全及总体指标的代表值。,(一)点估计,用于点估计的估计量一般应满足优良估计量三个标准。,第七章 抽样调查,2023/10/31,课件,41,第四节 总体参数估计,(二)区间估计,区间估计就是根据样本估计量以一定可靠程度推断总体参数所在的区间范围。,区间估计有三项基本要素:估计值,主要是样本的平均数、比率和方差;估计值的可能误差范围(或说允许误差范围),即抽样极限误差 和;与误差范围相对应的概率保证程度参数估计的置信度。,第七章 抽样调查,2023/10/31,课件,42,第四节 总体参数估计,(二)区间估计,这三

19、个要素之间的关系可表示如下:,第七章 抽样调查,2023/10/31,课件,43,第四节 总体参数估计,五、总体平均数估计,(一)大样本的总体平均数估计,第七章 抽样调查,表达式,其中,为极限误差,2023/10/31,课件,44,步骤,计算样本平均数;,搜集总体方差的经验数据;或计算样本标准差,即,第七章 抽样调查,2023/10/31,课件,45,计算抽样平均误差:,重复抽样时:,不重复抽样时:,计算抽样极限误差:,确定总体平均数的置信区间:,2023/10/31,课件,46,第四节 总体参数估计,五、总体平均数估计,(一)大样本的总体平均数估计,例:某企业生产A产品的工人有1000人,某

20、日采用不重复抽样从中随机抽取100人调查他们的当日产量,样本人均产量为35件,产量的样本标准差为4.5件。请以95.45%的置信度估计该日人均产量的置信区间。,第七章 抽样调查,2023/10/31,课件,47,第四节 总体参数估计,解:计算抽样平均误差,计算抽样极限误差,由,查正态概率表得,第七章 抽样调查,2023/10/31,课件,48,第四节 总体参数估计,确定置信区间,估计区间上限:(件),估计区间下限:(件),第七章 抽样调查,故,可以95.45%的置信度断言,该日人均产量在34.1535.85件之间。,2023/10/31,课件,49,【例A】某企业生产某种产品的工人有1000人

21、,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,要求在95的概率保证程度下,估计该厂全部工人的日平均产量和日总产量。,第七章 抽样调查,2023/10/31,课件,50,100名工人的日产量分组资料,2023/10/31,课件,51,解:,第七章 抽样调查,2023/10/31,课件,52,则该企业工人人均产量 及日总产量 的置信区间为:,即该企业工人人均产量在124.797至127.203件之间,其日总产量在124797至127303件之间,估计的可靠程度为95。,第七章 抽样调查,2023/10/31,课件,53,【例B】某乡水稻总面积20000亩,以不重置抽样方法从中随机抽取

22、400亩实割实测求得样本平均亩产645公斤,标准差72.6公斤。要求极限误差不超过7.2公斤,试对该乡水稻的亩产和总产量作估计。,第七章 抽样调查,2023/10/31,课件,54,第一步:计算抽样平均误差,第二步:计算平均亩产和总产量的上下限,亩产下限=645-7.2=637.8(公斤),亩产上限=645+7.2=652.2(公斤),第七章 抽样调查,2023/10/31,课件,55,第三步:计算概率度,总产量下限=20000637.8=1275.6(公斤),总产量上限=20000652.2=1304.4(公斤),以95.45%保证该乡水稻平均亩产在637.8至652.2公斤之间,总产量在1

23、275.6至1304.4万公斤之间。,第七章 抽样调查,2023/10/31,课件,56,第四节 总体参数估计,(二)小样本的总体平均数估计,第七章 抽样调查,例:某商场从一批袋装食品中随机抽取10袋,测得每袋重量(单位:克)分别为789、780、794、762、802、813、770、785、810、806,要求以95%的把握程度,估计这批食品平均每袋重量的区间范围。,若,当方差 未知,时,简单随机样本的平均数 服从自由度为 的 分布,即,2023/10/31,课件,57,第四节 总体参数估计,第七章 抽样调查,解:计算样本指标,计算抽样平均误差,2023/10/31,课件,58,第四节 总

24、体参数估计,第七章 抽样调查,计算抽样极限误差,由,查t分布表得,,确定置信区间,估计区间上限:(克),估计区间下限:(克),故,在95%的置信度下,这批食品平均每袋重量的置信区间是778.8803.4克。,2023/10/31,课件,59,第四节 总体参数估计,第七章 抽样调查,六、总体比率估计,总体比率P是总体是非标志的的平均数,前面讲的平均数估计理论都适用于总体比率P的估计,只是估计量的形式略有不同。,表达式,其中,为极限误差,2023/10/31,课件,60,第七章 抽样调查,步骤,计算样本成数;,搜集总体方差的经验数据;,计算抽样平均误差:,重复抽样条件下,不重复抽样条件下,2023

25、/10/31,课件,61,计算抽样极限误差:,确定总体成数的置信区间:,第七章 抽样调查,2023/10/31,课件,62,【例B】若例A中工人日产量在118件以上者为完成生产定额任务,要求在95的概率保证程度下,估计该厂全部工人中完成定额的工人比重及完成定额的工人总数。,第七章 抽样调查,2023/10/31,课件,63,第七章 抽样调查,100名工人的日产量分组资料,完成定额的人数,幻灯片 47,2023/10/31,课件,64,解:,第七章 抽样调查,2023/10/31,课件,65,第七章 抽样调查,则该企业全部工人中完成定额的工人比重 及完成定额的工人总数 的置信区间为:,即该企业工

26、人中完成定额的工人比重在0.8432至0.9568之间,完成定额的工人总数在843.2至956.8人之间,估计的可靠程度为95。,2023/10/31,课件,66,第四节 总体参数估计,第七章 抽样调查,例:某厂对一批产品的质量进行抽样检验,随机抽取样品 100只,调查得样本优质品率为80%,试计算当把握程度为90%时该批产品优质品率的区间范围。,解:计算抽样平均误差,2023/10/31,课件,67,第四节 总体参数估计,计算抽样极限误差,第七章 抽样调查,由,查正态概率表得,确定置信区间,估计区间上限:,估计区间下限:,即,该批产品优质品率在73.42%-86.58%之间,其把握程度为90

27、%。,2023/10/31,课件,68,第四节 总体参数估计,第七章 抽样调查,七、总体方差估计,在总体平均数的区间估计中,需要抽样平均误差 的数据,在计算抽样平均误差时,需要总体方差的数据,然而总体方差 是未知的,通常要以样本数据来估计。,总体方差的估计量-样本方差的计算:,2023/10/31,课件,69,第五节 抽样设计,第七章 抽样调查,一、抽样设计的原则,1、保证实现抽取样本时遵守随机原则。,2)保证实现最大的抽样效果原则。,二、抽样组织设计,(一)简单随机抽样,简单随机抽样(simple random sampling),也称纯随机抽样,它是按照随机原则直接从全及总体N个单位中抽取

28、容量为n个单位的样本。,2023/10/31,课件,70,第七章 抽样调查,1.纯随机抽样的取样方法,直接抽取法,抽签法,随机数表法,第五节 抽样设计,2023/10/31,课件,71,第七章 抽样调查,.纯随机抽样的样本容量确定,1)估计平均数的必要抽样数目,重复抽样时,由 整理得:,不重复抽样时,由 整理得:,第五节 抽样设计,当N很大时:,2023/10/31,课件,72,【例A】某食品厂要检验本月生产的10000袋某产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。要求在95.45的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?,第七章 抽样调查,202

29、3/10/31,课件,73,解:,第七章 抽样调查,2023/10/31,课件,74,第七章 抽样调查,第五节 抽样设计,2)估计比率的必要抽样数目,当估计总体比率时,确定必要抽样数目公式中的方差 应换成,于是得:,当N很大时,,2023/10/31,课件,75,第七章 抽样调查,第五节 抽样设计,例:某批产品的历史数据显示,平均重量为65.85千克,合格率为98%,方差为5.456,现准备对这批产品进行简单随机抽样检查,要求可靠程度达到99.73%,误差范围不超过0.9千克。试问检查平均重量与合格率各需要抽多少样本单位?,2023/10/31,课件,76,第七章 抽样调查,第五节 抽样设计,

30、解:在区间估计中,由可知,则,即检查平均重量至少应该抽取61个样品;检查合格率至少应该抽取71个样品。,2023/10/31,课件,77,第七章 抽样调查,第五节 抽样设计,例:某企业对一批产品进行质量检验,这批产品的总数为5000件,过去几次同类调查所得的产品合格率分别为93%、95%和96%,要求在99.73的概率保证程度下,合格率的误差范围不超过3%,应抽查多少件产品?,【分析】因为共有三个过去的合格率的资料,为保证推断的把握程度,应选其中方差最大者,即P=93。,2023/10/31,课件,78,第七章 抽样调查,2023/10/31,课件,79,第七章 抽样调查,第五节 抽样设计,注

31、:1)对同一总体既需要进行平均数推断,又需要进行比 率推断时,按各自要求可能确定二个必要抽样数目,为了兼顾二者的共同要求,通常采用其中较大的n值作为统一的抽样单位数。,2)在抽样推断的实际操作中,一般按重复抽样的公式确定必要抽样数目,按不重复抽样的方法来具体抽选调查单位,最后又按重复抽样的平均误差公式来计算抽样平均误差进行推断。以便使推断的把握程度更大。,2023/10/31,课件,80,第七章 抽样调查,第五节 抽样设计,3)总体方差近似值的取值方法:,根据以往调查的经验数据(取较大者)。,采用试点调查以样本方差来代替。,根据总体的分布及其数学性质加以推算。,比率的方差可以用最大值来代替。,

32、2023/10/31,课件,81,第七章 抽样调查,第五节 抽样设计,(二)分层抽样,1.分层抽样及其组织,分层抽样又叫分类抽样(stratified sampling)或类型抽样。它是按与调查目的有关的某个主要标志将总体划分为若干层(或类),然后从各层中按随机原则分别抽取一定数目的单位构成样本。,确定各类型组抽样单位数的方法,一般有两种:,1)类型适宜抽样,2)等比例分层抽样,2023/10/31,课件,82,第七章 抽样调查,第五节 抽样设计,2.分层抽样的抽样平均误差,分层抽样组织的重复抽样平均误差为:,对于等比例分层抽样,其重复抽样平均误差为:,或 称为层(组)内方差平均数,计算式如下

33、:,2023/10/31,课件,83,第七章 抽样调查,第五节 抽样设计,在不重复抽样条件下,,由抽样平均误差公式和上式可知,对于给定的总体,方差(即总方差)是一定的,划分层时应尽量增大层间差异,缩小层内差异。,2023/10/31,课件,84,第七章 抽样调查,第五节 抽样设计,例:某农场在甲、乙、丙三种类型土地上种植某种农作物1200亩,临近收割时,按5%比例抽取60亩进行调查,得有关数据如下表所示,试以95.45%的置信度估计该种农作物的平均亩产量。,某农场某种农作物平均亩产量抽样调查表,2023/10/31,课件,85,第七章 抽样调查,第五节 抽样设计,解:计算样本指标,计算抽样平均

34、误差:,2023/10/31,课件,86,第七章 抽样调查,第五节 抽样设计,计算抽样极限误差,由,知,确定置信区间,估计区间上限:(公斤),估计区间下限:(公斤),即,该种农作物的平均亩产量在511.6-524.4公斤之间,置信度为95.45%。,2023/10/31,课件,87,第七章 抽样调查,第五节 抽样设计,3.分层抽样的必要抽样数目,确定分层抽样的必要抽样数目,与确定纯随机抽样必要抽样数目的思路相同,只是公式中的方差应使用层内方差平均数。,估计平均数时:,2023/10/31,课件,88,第七章 抽样调查,第五节 抽样设计,估计比率时,2023/10/31,课件,89,第七章 抽样

35、调查,第五节 抽样设计,(三)等距抽样,等距抽样又叫机械抽样或系统抽样。它是先将总体单位按某一标志排队,然后按固定的顺序和间隔来抽取样本单位。,等距抽样按照排队时所依据的标志不同,可分为按无关标志排队和按有关标志排队。,按无关标志排队,其抽样效果相当于简单随机抽样;按有关标志排队,其抽样效果相当于类型抽样。,等距抽样的优点是:抽取方式简单,容易实施,2023/10/31,课件,90,第七章 抽样调查,第五节 抽样设计,等距抽样通常是按自然位置排队,其调查效果应该是介于分层抽样与简单随机抽样之间,为使抽样估计结果更加可靠,常采用简单随机抽样的估计方法计算等距抽样的抽样平均误差及相应的各项估计值。

36、,例:为调查某市居民人均可支配收入情况,对该市30万户居民采用按街区每隔1000户抽取1户的等距抽样方法进行抽样,共调查了300户,有关数据下表所示。试估计置信度为95%的居民家庭人均可支配收入的置信区间。,2023/10/31,课件,91,第七章 抽样调查,第五节 抽样设计,某市居民人均可支配收入调查表,2023/10/31,课件,92,第七章 抽样调查,第五节 抽样设计,解:计算样本指标,计算抽样平均误差:,2023/10/31,课件,93,第七章 抽样调查,第五节 抽样设计,计算抽样极限误差,由,知,确定置信区间,估计区间上限:,估计区间下限:,即,该市居民家庭人均可支配收入在11.09

37、11.67千元之间,置信度为95%。,2023/10/31,课件,94,第七章 抽样调查,第五节 抽样设计,(四)整群抽样,1.整群抽样的概念,整群抽样也叫集团抽样。它是将研究对象的总体划分为若干群(或称为组),然后按随机原则从中成群(成组)地抽取样本单位,对抽中的群(组)进行全面调查的一种抽样方法。,简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差。,2023/10/31,课件,95,第七章 抽样调查,第五节 抽样设计,2.整群抽样的估计量及其抽样平均误差,设总体的全部 单位划分为 群,每群包含 单位。现在从总体 群中随机抽取 群组成样本,并分别对中选 群的所有 单位进行调查

38、。样本的第 群第 单位的标志值为,第 群的样本平均数为:,样本平均数为:,2023/10/31,课件,96,第七章 抽样调查,第五节 抽样设计,整群抽样可以看作是以群代替总体单位,以群平均数 代替总体单位标志值之后的简单随机不重复抽样。因此整群抽样的抽样平均误差 的计算公式为:,式中 代表群间方差,计算式如下:,2023/10/31,课件,97,第七章 抽样调查,第五节 抽样设计,例:某工厂生产某种电灯泡,在连续生产720小时中,每隔24小时抽取1小时的全部产品加以检查,根据抽样资料计算结果,灯泡的平均寿命为1200小时,群间方差为60。试计算样本平均数的抽样平均误差,并以95%的可靠程度推断

39、该批灯泡的平均使用寿命。,解:,2023/10/31,课件,98,第七章 抽样调查,第五节 抽样设计,由,知,估计区间上限:,估计区间下限:,即,该批灯泡的平均寿命在1197.281200.72小时之间,置信度为95%。,2023/10/31,课件,99,第七章 抽样调查,第五节 抽样设计,常用抽样组织形式基本特点一览表,2023/10/31,课件,100,第七章 抽样调查,第五节 抽样设计,(五)多阶段抽样,抽样方法是把抽取样本单位的过程分为若干个阶段进行,即先从总体中抽取若干一级单位,再从抽中的每个一级单位中抽取若干二级单位,接着从抽中的二级单位里抽三级单位,依此类推,一直到最后才抽取样本

40、基本单位。,多阶段抽样估计量的方差,取决于各阶段的群间方差和最后抽中各群的群内方差,下面以两阶段抽样为例说明该种抽样估计量的抽样平均误差。,2023/10/31,课件,101,例:在某省100多万农户抽取1000户调查农户生产性投资情况。,第七章 抽样调查,第五节 抽样设计,(五)多阶段抽样,2023/10/31,课件,102,第七章 抽样调查,第五节 抽样设计,首先将总体划分为R组,每组包含Mi个单位。抽样第一阶段从R组中随机抽取r组,第二阶段再从中选的r组中分别从各组Mi单位随机抽取mi个单位,构成一个样本,这种抽样就是两阶段抽样。各组的单位数可以是相等的也可以是不等的。各组抽取的单位数可

41、以是相等的,也可以是不等的。为了简化起见,假定总体R组中每组的单位都等于M,则有NMR,而且从各组抽取的单位数也相等产,都为m,则有n=mr。,两阶段抽样可以看作是整群抽样和类型抽样的结合。即整群样抽第一阶段从总体的全部组中,随机抽取部分的组,和类型抽样第二阶段从中选组中抽选部分单位两个程序的结合。,2023/10/31,课件,103,第七章 抽样调查,第五节 抽样设计,从总体R组中随机抽取r组,并从r组中,每组M个单位中抽m 个单位构成样本。样本平均数可以这样计算:先计算第i组的样本平均数:,再计算样本的平均数:,2023/10/31,课件,104,第七章 抽样调查,第五节 抽样设计,第二阶

42、段抽样平均数的方差为:,式中 是各抽样群群内方差的平均数,即,2023/10/31,课件,105,第七章 抽样调查,第五节 抽样设计,则,以上两阶段抽样样本平均数的抽样方差为:,在不重复抽样情况下,两阶段抽样的抽样平均误差为:,两阶段抽样的第一阶段抽样一定是不重复抽样,如果第二阶段采用重复抽样,则抽样平均误差为:,2023/10/31,课件,106,第七章 抽样调查,第五节 抽样设计,例:对某林区的木材积蓄量进行抽样调查,将总体相等面积的 块地段划分为10群,每群包括5个地段,现在用两阶段抽样方法,从10群中抽选50%(5群),并从抽中的群中抽取60%地段(3个地段)组成样本,样本的各项资料如

43、下页表中所示。试以90%的可靠程度推断该林区木材积蓄量。,解:,样本平均数:,样本各群内方差:,2023/10/31,课件,107,第七章 抽样调查,某林区的木材积蓄量抽样调查表,2023/10/31,课件,108,第七章 抽样调查,第五节 抽样设计,各群内方差平均数:,群间方差:,抽样平均误差为:,2023/10/31,课件,109,第七章 抽样调查,第五节 抽样设计,由,知,估计区间上限:,估计区间下限:,即,该批该林区木材积蓄量在15532687立方米之间,置信度为90%。,2023/10/31,课件,110,第七章 抽样调查,第五节 抽样设计,三、抽样方案的检查,1、准确性检查 是以抽

44、样方案要求的允许误差为标准,用已掌握的资料检查其在一定概率保证程度下,实际的极限误差是否超过了允许误差的要求,即要求极限误差小于或等于允许误差。,2、代表性检查 是将抽样方案中的样本指标,与过去已掌握的总体相应指标 进行对比,视其比率是否合乎要求。,2023/10/31,课件,111,第七章 抽样调查,第六节 统计假设检验,一、统计假设检验的概念和类型,(一)假设检验的概念,统计假设检验,就是事先对总体参数或总体分布形式做出一个假设,然后利用样本信息来判断这一假设是否合理,即判断样本统计量的具体数值与原假设是否有显著差异。从而决定拒绝或接受原假设。,假设检验的特点:,第一,采用反证法。,第二,

45、依据“小概率事件在一次试验中不能发生”的原理。,2023/10/31,课件,112,第七章 抽样调查,第六节 统计假设检验,(二)假设检验的两类错误,1.第一类错误,第一类错误,亦称拒真(弃真)错误。是指当原假设为真时,但由于样本的随机性使样本统计量的具体值落入了拒绝区域,这时所作的判断是拒绝原假设。,犯第一类错误的概率亦称拒真概率,它实质上就是前面提到的显著性水平,即,2023/10/31,课件,113,第七章 抽样调查,第六节 统计假设检验,2.第二类错误,第二类错误,亦称取伪错误。当原假设不真时,但由于样本的随机性使样本统计量的具体值落入了接受区域,这时所作的判断是接受原假设。,犯第二类

46、错误的概率亦称取伪概率,用 表示,即,2023/10/31,课件,114,H0:无罪,假设检验中的两类错误(决策结果),假设检验就好像一场审判过程,统计检验过程,2023/10/31,课件,115,第七章 抽样调查,第六节 统计假设检验,(三)假设检验与区间估计的关系,1.假设检验与区间估计的区别,1)目标不同:假设检验要验证原假设在一定显著性水平()下是否成立;区间估计要估计出总体参数的在一定置信度()下的置信区间。,2)立足点不同:假设检验立足于小概率,通常是给定很小的显著性水平()作为拒绝原假设可能犯“弃真”错误的风险;区间估计立足于大概率,通常是以较大的置信度()去估计参数的置信区间。

47、,3)思路不同:假设检验根据样本统计值与原假设参数值差异的大小来决定拒绝或接受原假设;区间估计则根据样本估计值和给定的置信度来确定总体参数的置信区间。,2023/10/31,课件,116,第七章 抽样调查,第六节 统计假设检验,2.假设检验与区间估计的联系,1)依据相同:二者都是依据样本信息对总体参数进行推断。,2)理论基础相同:二者都是以抽样分布为理论基础,都是建立在概率基础上的推断,推断结果都有一定的置信度和风险。,3)研究实际问题时,二者可以相互转换:针对同一问题的参数进行推断,使用同一样本、同一统计量和同一分布,此时假设检验问题可以转换为区间估计,区间估计问题也可以转换为假设检验。,2

48、023/10/31,课件,117,第七章 抽样调查,第六节 统计假设检验,(四)统计假设检验的类型,1.双侧检验,当要检验的是样本统计值与总体参数有没有显著性差异,而不问差异的方向是正差还是负差时,这时的检验称为双侧检验,又称双尾检验。,2023/10/31,课件,118,第七章 抽样调查,第六节 统计假设检验,双侧检验的决策临界值及接受区域和拒绝区域,2023/10/31,课件,119,第七章 抽样调查,第六节 统计假设检验,由样本信息计算出的检验统计量数值 与事先给定的临界值比较,如果,则接受原假设;如果,或 则拒绝原假设,接受备择假设。,2023/10/31,课件,120,第七章 抽样调

49、查,第六节 统计假设检验,2.单侧检验,不仅检验样本统计值与总体参数有没有显著性差异,而且追究是否发生预先指定方向的差异,就应采用单侧检验,分为左侧检验和右侧检验。,右侧检验也叫右单尾检验,主要用于检验样本统计值是否出现了增长方向的变动。假设设立为:,或:,2023/10/31,课件,121,第七章 抽样调查,右侧检验的决策临界值及接受区域和拒绝区域,由样本信息计算出的检验统计量数值 与事先给定的临界值比较,如果,则接受原假设;如果 则拒绝原假设,接受备择假设。,2023/10/31,课件,122,第七章 抽样调查,第六节 统计假设检验,左侧检验也叫左单尾检验,主要用于检验样本统计值是否出现了

50、减少或降低方向的变动。假设设立为:,或:,2023/10/31,课件,123,第七章 抽样调查,第六节 统计假设检验,左侧检验的决策临界值及接受区域和拒绝区域,由样本信息计算出的检验统计量数值 与事先给定的临界值比较,如果,则接受原假设;如果 则拒绝原假设,接受备择假设。,2023/10/31,课件,124,第七章 抽样调查,第六节 统计假设检验,二、统计假设检验的一般步骤,2.选择检验用统计量,并确定其分布形式,3.选择显著性水平,确定决策临界值,4.根据检验统计量的具体数值,做出决策,1.提出原假设()和备择假设(),2023/10/31,课件,125,第七章 抽样调查,第六节 统计假设检

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号