统计学原理第六章抽样调查ppt课件.ppt

上传人:小飞机 文档编号:1359054 上传时间:2022-11-13 格式:PPT 页数:112 大小:894.50KB
返回 下载 相关 举报
统计学原理第六章抽样调查ppt课件.ppt_第1页
第1页 / 共112页
统计学原理第六章抽样调查ppt课件.ppt_第2页
第2页 / 共112页
统计学原理第六章抽样调查ppt课件.ppt_第3页
第3页 / 共112页
统计学原理第六章抽样调查ppt课件.ppt_第4页
第4页 / 共112页
统计学原理第六章抽样调查ppt课件.ppt_第5页
第5页 / 共112页
点击查看更多>>
资源描述

《统计学原理第六章抽样调查ppt课件.ppt》由会员分享,可在线阅读,更多相关《统计学原理第六章抽样调查ppt课件.ppt(112页珍藏版)》请在三一办公上搜索。

1、第六章 抽样调查,第一节 抽样调查的意义,一、抽样调查的概念,一般所讲的抽样调查,即指狭义的抽样调查(随机抽样):按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。,二、抽样调查的特点,(一)抽样调查的目的是由部分来推断整体。,(二)抽选部分单位时要遵循随机原则,(三)抽样调查会产生抽样误差,抽样误差可以计算,并且可以加以控制。,三、抽样调查的适用范围,抽样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用面广等优点。,(一)实际工作不可能进行全面调查观察,而又需要了解

2、其全面资料的事物;,(二)虽可进行全面调查观察,但比较困难或并不必要;,(五)对普查或全面调查统计资料的质量进行检查和修正;,(四)在有些情况下,抽样调查的结果比全面调查要准确。,(七)利用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍。,一般适用于以下范围:,(三)和全面调查相比较,抽样调查能节省人力、费用和时间,而且比较灵活,(六)抽样调查方法可以用于工业生产过程中的质量控制。,一、全及总体和抽样总体,(一) 全及总体,简称总体,全及总体:所要认识对象的全体。 总体单位数用N表示。,全 及总体按其单位标志性质不同分为:变量总体和属性总体。 变量总体可以用数量

3、标示加以计量。 属性总体用文字描写属性特征。如:完好、非完好。,第二节 抽样调查的基本概念及理论依据,一、全及总体和抽样总体,(二) 抽样总体,简称样本,第二节 抽样调查的基本概念及理论依据,抽样总体:抽取出来调查观察的单位。 抽样总体的单位数用n表示。 n 30 大样本 n 30 小样本,二、 全及指标和抽样指标(总体指标和样本指标),全及指标:全及总体的那些指标。,(一)全及指标,(二)抽样指标,抽样指标:抽样总体的那些指标。,(三)统计抽样过程(图6-1,p255),三、抽样方法和样本可能数目,根据取样的方式不同,抽样方式分为:重复抽样和不重复抽样。,根据对样本的要求不同,抽样方式分为:

4、考虑顺序抽样和不考虑顺序抽样。,抽样方法,样本可能数目(p256-257,了解),1. 如果是重复抽样:,2. 如果是不重复抽样:,考虑顺序的不重复抽样:,不考虑顺序的不重复抽样:,四、抽样调查的理论依据(p257-259,了解),(1)独立同分布大数定律,(2)贝努大数定律,1.大数定律,2.中心极限定理(p256-257,了解),(1)独立同分布中心极限定理,(2)德莫佛-拉普拉斯中心极限定理,第三节 抽样平均误差,一、抽样误差的概念,在统计调查中,调查资料与实际情况不一致,两者的偏离称为统计误差。,抽样误差即指随机误差,这种误差是抽样调查固有的误差,是无法避免的。,二、影响抽样平均误差的

5、因素,(一) 全及总体标志变异程度。正比关系(二)抽样单位数目的多少。反比关系(三)抽样的组织方式。,三、抽样平均误差的意义,1. 在于说明样本指标的代表性大小。 误差大,则样本指标代表性低; 误差小,则样本指标代表性高; 误差等于0,则样本指标和总体指标一样大。,2. 说明样本指标和总体指标相差的一般范围。,3. 确定抽样单位数多少的计算依据。,四、抽样平均误差的计算,抽样平均误差实际上是样本指标的标准差。通常用表示。,(一)抽样平均数的抽样平均误差,1. 重复抽样条件下抽样平均数的抽样平均误差,2. 不重复抽样条件下抽样平均数的抽样平均误差,四、抽样平均误差的计算,(二)抽样成数的抽样平均

6、误差,重复抽样条件下抽样成数的抽样平均误差,不重复抽样条件下抽样成数的抽样平均误差,四、抽样平均误差的计算,1.用过去调查所得的资料。,3.用小规模调查资料。,2.用样本方差的资料代替总体方差。,4.用估计的材料。,(三)抽样平均误差计算实例(p270-271),以上资料编成次数分配表如下:,抽样误差是所有可能出现的样本指标的标准差。它是由于抽样的随机性而产生的样本指标与总体指标之间的平均离差。,上例五户中抽取二户调查,如采取不考虑顺序的不重复抽样方法,则:,第四节 全及指标的推断,一、抽样推断要求,抽样推断就是按照已经抽定的样本指标来估计总体指标,或其所在的区间范围。,只要在样本代表性大,且

7、对全及指标精确性要求不高的情况下,满足下列三个准则:,无偏性,一致性,有效性,就会得到合理的估计。,抽样指标估计总体指标有三个要求:(p272),(一)点估计,二、抽样推断的方法,1.直接换算法,抽样平均数(成数)总体单位数=总体标志总量,1.如果采用点估计方法:上例1中:40010000=400(万千克) 如果用区间估计方法:上例1中该农场小麦总产量的范围为: t=2: (397.62 402.38)10000=397.62 402.38(万千克) t=3: (396.43 403.57)10000=396.43 403.57(万千克),2.上例2中,全部一级品数量的范围为: (92.82%

8、 97.18%)8000=7425.6 7774.4(件),2. 修正分数法,就是用抽样所得的调查结果同有关资料对比的系数来修正全面统计资料时采用的一种方法。,某村6000农户,2005年年末统计养猪头数,从下往上报的是9000头,现抽10(600户)的农户再复查一下,发现有漏报,也有重报。按600户,原来数字是890头,实际复查为935头,故总的来说,是少报。,某市房地局,年报工资总额3218.1万元。现抽查14个单位: 年报:415.03万元 多报:0.44万元 少报:1.47万元抵冲后 1.47-0.44=1.03(万元),(二)区间估计,根据样本指标和抽样误差去推断全及指标的可能范围,

9、它能说清楚估计的准确程度和把握程度。,1.区间估计的意义,抽样极限误差又叫抽样误差范围,也称置信区间,是变动的抽样指标与确定的全及指标之间的离差的可能范围。,2.抽样极限误差,抽样误差范围的实际意义是要求被估计的全及指标 或P落在抽样指标一定范围内,即落在,或,的范围内。,3.可信程度,抽样极限误差=t,(t为概率度),可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。,P(277),某农场进行小麦产量的抽样调查,该农场小麦播种面积为10000亩,采用不重复的简单随机抽样从中选100亩作为样本,进行实割实测,得到样本的平均亩产量为400千克,样本标准差为12千克。则:,某机械厂日产某种产品

10、8000件,现采用纯随机不重复抽样方式(按重复抽样公式计算),从中抽取400件进行观察,其中有380件为一级品,试以概率95.45%的可靠程度推断全部产品的一级品率及一级品数量的范围。则:抽样一级品率:,第五节 抽样方案设计,搞好抽样设计必须掌握两个基本原则:(一)保证实现抽样随机性的原则(二)保证实现最大的抽样效果的原则 在一定的误差和可靠性的要求下选择费用最少的样本设计。,一、抽样方案设计的基本原则,二、简单随机抽样(纯随机抽样),即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。,随机抽选可有各种不同的具体做法,如:(一)直接抽选法;(二)抽签法;(三)随机数码表法;,纯随机抽样

11、的抽样平均误差,(一) 平均数的抽样平均误差,1.重复抽样,取得的途径有:(了解),用过去全面调查或抽样调查的资料,若同时有n个的资料,应选用数值较大的那个;2. 用样本标准差S代替全及标准差;3. 在大规模调查前,先搞个小规模的试验性的调查来确定S,代替;4. 用估计的方法。,某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时(一般为重复抽样),根据以往资料:=20小时,,根据以往资料,产品质量不太稳定,若=200小时,,2.不重复抽样:,(二) 成数的抽样平均误差,已证明得:成数的方差为p(1-p),某玻璃器皿厂某日生产15000只印花玻璃杯,现按重

12、复抽样方式从中抽取150只进行质量检验,结果有147只合格,其余3只为不合格品,试求这批印花玻璃杯合格率(成数)的抽样平均误差。,三、类型抽样(分类抽样),先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原则抽取样本,组成一个总的样本。,类型抽样的作用:,1.利用已知的信息提高抽样的效率。2.抽样的组织工作比较方便。3.掌握总体中各个子总体的情况。,两种类型抽样方法:,1.等比例类型抽样(类型比例抽样);,2.不等比例类型抽样(类型适宜抽样)。,(一)类型比例抽样方法的单位数的确定,(二)类型适宜抽样方法单位数的确定,对于标志变动程度大的组,抽取样本单位数的比例相应要大些;反

13、之,对于标志变动程度小的组,抽取样本的单位数的比例相应地可小些。,(三)类型抽样之抽样误差的计算,在重复抽样情况下:,某农场种小麦12000公顷,其中平原3600公顷,丘陵6000公顷,山地2400公顷,现用类型抽样法调查1200公顷,以各种麦田占全农场面积的比重分配抽样面积数量。 麦田类型抽样的平均误差计算表,高产麦田比重的平均误差计算表,四、机械抽样(等距抽样),(一)机械抽样的概念和作用概念:先将全及总体的所有单位按某一标志顺序排队,然后按相等的距离抽取样本单位。作用:1.简单易行。2.机械抽样的误差大小与总体单位的顺序有关。,1. 选择标志与抽样调查所研究内容无关, 称无关标志排队。,

14、2. 选择标志与抽样调查所研究的内容有关, 称有关标志排队。,(二)机械抽样按排队所依据的标志不同,分为无关标志排队法和有关标志排队法。,1.随机起点等距抽样,(三)机械抽样按样本单位抽选的方法不同,分为随机起点等距抽样、半距起点等距抽样和对称等距抽样。,2.半距起点等距抽样,k k k,k,(k为抽取间隔),示意图:,3.对称等距抽样,示意图:,k k k,2k-a 2k+a 4k-a 4k+a,a,k,(k为抽取间隔),机械抽样,实际上是一种特殊的类型抽样。因为,如果在类型抽样中,把总体划分为若干相等部分,每个部分只抽一个样本,在这种情况下,则类型抽样就成了机械抽样。,1.若按无关标志排队

15、,公式用以上纯随机抽样的公式,一般采用不重复抽样公式:,(四)机械抽样(等距抽样)的抽样平均误差,2. 若按有关标志排队,公式用类型抽样的公式:,五、整群抽样,整群抽样即从全及总体中成群地抽取样本单位,对抽中的群内的所有单位都进行观察。,整群抽样的作用:1.当总体缺乏包括全部总体单位的抽样框,无法进行抽选时须采用整群抽样。2.比较方便和节约费用。,整群抽样的抽样误差受三个因素影响:,1.抽出的群数(r)多少 (反比关系),2.群间方差( ) (正比关系),3.抽样方法,群间方差的计算方法如下:(p294),抽样方法,假如某一机器大量生产某一种零件,现每隔一小时抽取5分钟产品进行检验,用以检查产

16、品的合格率,检查结果如下:,六、多阶段抽样,多阶段抽样:即把抽样本单位的过程分为两个或几个阶段来进行。(如果一次就直接抽选出具体样本单位,这叫单阶段抽样)具体讲: 先抽大单位(可以用类型抽样或机械抽样), 再在大单位中抽小单位(可用整群抽样或简单随机抽样),小单位中再抽更小的单位;而不是一次就直接抽取基层的调查单位。,(一)多阶段抽样基本理论和方法,六、多阶段抽样,多阶段抽样的作用:(1)当抽样调查的面很广,没有一个包括所有总体单位的抽样框,或者总体范围太大而无法直接抽取样本时,须采用多阶段抽样。(2)可以相对地节约人力与物力。(3)可以利用现成的行政区划、组织系统作为划分各阶段的依据,为组织

17、抽样调查提供方便。,(一)多阶段抽样基本理论和方法,六、多阶段抽样,多阶段抽样的作用:(1)当抽样调查的面很广,没有一个包括所有总体单位的抽样框,或者总体范围太大而无法直接抽取样本时,须采用多阶段抽样。(2)可以相对地节约人力与物力。(3)可以利用现成的行政区划、组织系统作为划分各阶段的依据,为组织抽样调查提供方便。,(一)多阶段抽样基本理论和方法,(二)多阶段抽样的实际应用城市住户抽样调查方案实施(p301-307),多阶段抽样的抽样平均误差,以两阶段抽样为例,设总体分R组,每组包含 个单位,若各组 相等,则,则:在重复抽样下,在不重复抽样下,设某大学在学期初对学生进行体重抽样调查,先从全校

18、80个班以不重复抽样方法随机抽取8个班,然后再从抽取的班中再分别抽取10个人作为第二阶段抽样单位。计算所得的抽样平均体重为60.5千克,抽样各班内方差平均数 为50,各班之间体重方差 为22。,假设全校各班均为40人。试以94.45%(t=2)的概率,推断该校学生平均体重的范围。,已知:,解:,以上抽样平均误差的公式归纳如下:,第六节 必要抽样单位数的确定,一、确定抽样单位数的意义和原则,意义:在抽样调查时,认真研究和确定一个必要的抽样单位数,对于省时、省力又能保证较好的抽样调查效果,无疑是具有重要意义的。,原则:在保证抽样推断能达到预期的可靠程度和精确程度的要求下,确定一个恰当的抽取样本单位

19、的数目。,二、确定抽样单位数的依据,1.决定于调查者对一项抽样推断的可靠程度和精确程度的要求。2.抽样单位数决定于总体标志的变异程度。(正比)3.抽样单位数决定于不同的抽样组织方法。4.结合调查的人力、物力和财力的许可情况加以适当调整,然后作出最后的确定。,二、确定抽样单位数的依据,(一) 简单随机抽样,三、确定抽样单位数的计算公式,(二) 类型抽样,重复抽样:,不重复抽样:,(三) 机械抽样,在有总体差异程度和比重的全面资料时,可采用类型抽样的公式; 没有总体的全面资料时,可采用简单随机抽样的公式。,(四) 整群抽样(一般为不重复抽样),建筑工地打土方工人4000人,需测定平均每人工作量,要

20、求误差范围不超过0.2M3,并需有99.73%保证程度。根据过去资料=1.5,求样本数应是多少?,某金笔厂月产10000支金笔,以前多次抽样调查一等品率为90%,现在要求误差范围在2%之内,可靠程度达95.45%,问必须抽取多少单位数?,某鞋厂对某种类型的鞋子进行耐穿时间的抽样检验,经过二次小型抽样检验,结果知道标准差是18天与20天,试问在抽样误差不超过1天(概率为0.9011)的要求下,至少应抽查多少双鞋子?,第七节 假设检验,一、假设检验的概念,所谓假设检验,就是对某一总体参数先作出假设的数值;然后搜集样本资料,用这些样本资料确定假设数值与样本数值之间的差异;最后,进一步判断两者差异是否

21、显著,若两者差异很小,则假设的参数是可信的,作出“接受”的结论,若两者的差异很大,则假设的参数准确的可能性很小,作出“拒绝”的结论。,某厂生产一批产品,必须检验合格才能出厂,规定合格率为95%,现从中抽取100件进行质量检查,发现合格率为93%,假设检验就是利用样本指标p=93%的合格率,来判断原来假设P=95%合格率是否成立。如假设成立,产品就能出厂,如假设不成立,这批产品便不能出厂。,某地区去年职工家庭年收入为72000元,本年抽样调查结果表明,职工家庭年收入为71000元,这是否意味着职工生活水平下降呢?我们还不能下这个结论,最好通过假设检验,检验这两年职工家庭收入是否存在显著性统计差异

22、,才能判断该地区今年职工家庭年收入是否低于去年水平。,二、假设检验的步骤和特点,(一)假设检验的一般步骤如下:第一步:设立假设。,原假设是所要检验的假设,记作H0;备选假设是当原假设被否定时的另一种可成立的假设,记作H1;H0与H1两者是对立的,如H0真实,则H1不真实;如H0不真实,则H1为真实。 H0和H1在统计学中称为统计假设。,关于总体平均数的假设有三种情况: (1) H0: =0; H1: 0 (2) H0: 0; H1: 0,以上三种类型,对第一种类型的检验,称双边检验,因为0,包含0和0。而对第二、三种类型的检验,称单边检验。,第二步:确定检验统计量。,第三步:规定显著性水平 。

23、,若原假设H0为真时,却被当成错误而被拒绝,统计上把犯这种错误的概率称为显著性水平。用表示。,在假设检验中,要分析样本数值与参数假设值之间的差异,若两者差异越小,假设值真实的可能性则越大;反之,假设值真实的可能性越小。因此,要分析两者差异是否显著,如两者差异是显著的,就要否定原假设,因此,假设检验又称显著性检验。,第四步:确定临界值。,按照规定的显著性水平和样本统计量的分布性质,确定否定域和接受域的临界值。,第五步:计算检验统计量的值。,根据样本数据计算检验统计量的值。,第六步:根据检验统计量的值与临界值进行比较,做出判断。,如果检验统计量的数值落在否定域内(包括临界值),就说明原假设H0与样

24、本描述的情况有显著差异,应该否定原假设;如果该数值落在接受域内,就说明原假设H0与样本描述的情况无显著差异,则应接受原假设。,三、假设检验的两类错误,四、统计参数的假设检验方法 (介绍方差已知的总体平均数的假设检验),(一) 双边检验H0:=0;H1:0,某种产品的直径为6cm时,产品为合格,现随机抽取100件作为样本进行检查,得知样本平均值为6.1cm,现假设标准差为0.2cm,令=0.05,检验这批产品是否合格。,(二) 单边检验,根据过去学校的记录,学生的统计学考试的平均分数为65分,标准差为16分。现在学校改革了教学方法,经抽取64名学生作调查,得平均分数为69分,问平均分数有无显著提高?(=0.05),某工厂生产瓶装1千克的某饮料,标准差为0.02千克,现随机抽取36瓶进行检验,得平均重量为0.9962千克,问能否相信该厂生产的饮料每瓶重量为1千克。(=0.05),End of Chapter 6,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号