《抽样调查概述》PPT课件.ppt

上传人:小飞机 文档编号:5515596 上传时间:2023-07-15 格式:PPT 页数:104 大小:2.29MB
返回 下载 相关 举报
《抽样调查概述》PPT课件.ppt_第1页
第1页 / 共104页
《抽样调查概述》PPT课件.ppt_第2页
第2页 / 共104页
《抽样调查概述》PPT课件.ppt_第3页
第3页 / 共104页
《抽样调查概述》PPT课件.ppt_第4页
第4页 / 共104页
《抽样调查概述》PPT课件.ppt_第5页
第5页 / 共104页
点击查看更多>>
资源描述

《《抽样调查概述》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《抽样调查概述》PPT课件.ppt(104页珍藏版)》请在三一办公上搜索。

1、 第五章 抽样调查概述(重难点章),第一节 抽样调查概念 第二节 抽样误差 第三节 参数估计 第四节 EXCEL的应用,“对社会经济现象进行抽样调查和推断”任务书(五)一、任务题目:自选某一社会经济现象,对该现象进行抽样调查,并对调查结果进行分析推断。二、主要内容:了解抽样调查的意义及特点;学习掌握抽样误差、参数估计等指标的意义及计算方法;自选某一社会经济现象进行抽样调查,并对调查结果进行分析、推断。三、基本要求:1.所选社会经济现象可是工商企业的生产经营资料或学校的人财物结构分布等。2.抽样调查收集资料采用实地调查方法;3.每人用EXCEL制作一张调查数据表;运用统计函数计算出抽样误差、参数

2、估 计值,对该现象的特征及趋势进行分析。4.将所作的分析存入一个文件夹,拷贝到自己的U盘备查。四、成绩评定:1评分标准。基础分:数据分析方法和结果正确。8分;加分:按时提交作业,独立完成。2分。2.成绩占学期总成绩10%。任务下达日期:2012年 月 日 任务完成日期:2012年 月 日 指导教师签字:,任务书,学习内容及要求,学习内容:理解抽样调查的含义、作用;熟悉抽样误差的计算方法及其影响因素;掌握在各种抽样组织形式下总体均值和成数的区间 估计的技能方法;掌握确定样本容量的计算方法及其影响因素。带着问题学:1、抽样调查的概念、特点、作用有哪些?2、抽样误差可以避免吗?按样本平均数(成数)计

3、算抽样平均 误差的方法及过程、结果是什么?3、影响抽样误差大小的因素有哪些?4、区间估计的计算方法和过程是什么?5、影响抽样数目的因素有哪些?,本章在统计原理中的地位,抽样调查和推断是理论教学和实际工作中最常用、最重要的统计方法之一。它利用抽样调查所获得的样本信息,根据概率论所揭示的随机变量的一般规律性,对总体的一些数量特征进行估计。本章内容也是假设检验、相关回归分析的重要基础。,第一节 抽样调查概念(基础、重点),重点:抽样调查的基本概念及其作用带着问题学:1、抽样调查的概念及其特点有哪些?2、抽样调查的作用有哪些?,第一节 抽样调查概念(基础、重点),一、抽样调查的含义 抽样调查是按照随机

4、原则从总体中抽取一部分单位进行调查,并以样本观测结果对未知的总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法。(全及总体)、(样本总体)、样本指标)、(总体参数)二、抽样调查的特点:(三点)三、抽样调查的作用:(四个)要学懂抽样推断,首先要明确总体分布、样本分布与抽样分布三者的关系。总体分布:可以是正态分布、偏态分布等;未知;唯一。样本分布:可以是正态(偏态)分布等;取样后便知;有若干个样本且形态不一。抽样分布:面宽、多样;越接近中心点,分布越密集。,75,总体分布:未知;唯一的,抽样分布:两端少(概率小),中心多(概率大),补充:概率与分布的相关知识 1、总体分布及其

5、特征 总体分布就是总体中所有个体关于某个变量(标志)的取值所形成的分布。变量分布的形态很多,例如J型分布、U型分布和钟型分布等,不同的分布会有不同的特征,认识总体分布特征是统计研究的任务之一。反映总体分布特征的指标叫总体参数,一般用 表示。常用的总体参数有两个:一是总体均值(包括是非变量的均值);二是总体方差或标准差(包括是非变量的方差或标准差)。,2、样本分布及其特征 样本分布就是样本中所有个体关于某个变量(标志)的取值所形成的分布。由于样本来自于总体,包含了一部分关于总体的信息。当样本容量很大(或是逐渐增大)时,样本分布会接近总体分布。如果样本容量很小,那么样本分布就有可能与总体分布相差很

6、大,抽样估计的结果就会很差。反映样本分特征的指标叫样本统计量,通常用 来表示。常见的样本统计量也有两个:样本均值和样本方差,即:,3、抽样分布及其特征 抽样分布的概念及影响因素 一般意义上说,抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率所组成。实际的抽样分布形成取决于以下五个因素:总体分布。总体分布越分散则抽样分布也越分散 样本容量。样本容量越小则抽样分布越分散 抽样方法。一般情况下,重复抽样比不重复抽样的抽样分布分散 抽样组织形式。简单抽样比分层抽样的抽样分布分散 估计量构造。估计量构造不同,抽样分布也不同,抽样分布形式 在抽样估计中,最基本的抽样分布是样本

7、均值的抽样分布和样本成数的抽样分布,以此得到抽样分布的形式。抽样分布特征 任一抽样分布都有自己的特征,这个特征就是样本统计量的数学期望和方差。其中,样本统计量的数学期望就是所有样本统计值的平均数,样本统计量的方差就是所有样本统计值关于数学期望的方差。当估计量就是样本统计量时,数学期望与方差分别表示 为 和。,(三)抽样分布及其特征1.抽样分布的概念及影响因素 一般意义上说,抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率所组成。如果说样本分布是关于样本观测值的分布,那么抽样分布则是关于样本统计值的分布,而样本统计值是由样本观测值计算而来的。实际的抽样分布形成取决于

8、以下五个因素:总体分布。总体分布越分散则抽样分布也越分散 样本容量。样本容量越小则抽样分布越分散 抽样方法。一般情况下,重复抽样比不重复抽样的抽样分布分散 抽样组织形式。简单抽样比分层抽样的抽样分布分散 估计量构造。估计量构造不同,抽样分布也不同,补充:举简例说明抽样分布及概率,有4名工人(N=4),日产量分别为22、24、26、28件(用A、B、C、D代表),总体均值为25件,方差为5件,标准差为2.236件。现从中随机抽出2件检验(n=2),采用重复抽样方法,共产生16个可能样本:即“AA、AB、AC、AD、BA、BB、DA、AB、DC、DD”等共16组。所有可能样本平均数的均值=总体平均

9、数 即:E(x)=X 样本均值的抽样分布如下表所示:,例:4名工人日产量抽样分布(考虑顺序)(重复抽样,4抽2),例:4名工人日产量抽样分布(考虑顺序)(不重复抽样,4抽2),!,!,样本均值的抽样分布定理 中心极限定理 对于任一具有平均数 和方差 的有限总体,当样本 容量n足够大时(例如 或),样本均值 的分布也趋于服从正态分布,此即为中心极限定理。分布定理 当正态总体的方差未知且n较小,或任一方差为 的总体但n较小,则样本均值的分布服从自由度为n-1的 t 分布。分布曲线与正态分布相近,其中数学期望相同。,补充:常用的抽样分布定理,总体分布(未知),样本分布1(n小,误差大),样本分布3(

10、n渐大,误差渐小),样本分布2(n渐大,误差渐小),四、抽样调查中的几个基本概念(一)总体(全及总体)与样本(抽样总体)研究对象全体;抽取的样本构成的总体。(样本可有多个,样本容量可大可小,n50为大样本,n30为小样本)(二)总体参数和样本统计量(样本指标)常用:总体平均数、成数、方差等,(客观存在、唯一但未知,需推算);样本平均数、成数、方差等,(是据样本数据计算出的实际数,用以 推断总体指标)。,(四)抽样方法和样本数目 1.重复抽样,也叫重置抽样,是指从总体的个单位中抽取一个容量为n的样本,每次抽出一个单位后,再将其放回总体中参加下一次抽取,这样连续抽n次即得到一个样本。同一总体单位有

11、可能被重复抽中;每次都是从个总体单位中抽取.(每个单位被抽中的概率没变)2.不重复抽样,也叫不重置抽样,是指抽中单位不再放回总体中,下一个样本单位只能从余下的总体单位中抽取。同一总体单位不会被重复抽中;每次抽取是在不同数目的总体单位中进行的。(每个单位被抽中的概率改变),x1,x2,x3,xn,重复抽样:每次每个单位被抽中的概率相同,1/20、1/20、。某个单位有可能被多次抽中,不重复抽样:每次每个单位被抽中的概率不同,1/20、1/19、1/18、。每个单位只可能被抽中一次。,x1,x2,x3,xn,抽样组织形式,基本的抽样组织方式有五种:纯随机抽样(简单随机抽样)等距抽样(机械抽样)类型

12、抽样(分层抽样)整群抽样(集团抽样)阶段抽样,第二节 抽样误差(重难点节),重点:按抽样平均数和抽样成数计算抽样误差 的方法带着问题学:1、抽样误差可以避免吗?可以事先计算和调控吗?2、按样本平均数计算抽样平均误差的方法及过程、结果是什么?3、按样本成数计算抽样平均误差的方法及过程、结果是什么?4、用(不)重复抽样方法计算抽样误差的区别 是什么?5、影响抽样误差大小的因素有哪些?,第二节 抽样误差,返回,一、抽取样本单位的方式和抽样误差 非抽样误差(系统偏差)。如:抽样框不准确;有些观测单位数据无法取得;已取得的数据不真实等原因所致。抽样误差(代表性误差)由于抽样的非全面性和随机性引起的偶然性

13、误差。即抽样估计值随样本不同而产生的误差。其特点是:样本容量增大而趋向于零(样本均值与总体均值之差为零)。抽样调查中的抽样误差一般是指随机误差。(如:产品质量抽查中,用抽取的50件电子产品的平均耐用时数和合格率去推断生产的全部1000件产品的耐用时数和合格率。),误差-45,误差15,(一)抽样误差类型,1、抽样实际误差样本估计值与总体参数值之间的离差。记为.(每一次抽样的实际误差是不可知的,因为 总体参数是未知的)。2、抽样平均误差抽样平均数或抽样成数的标准差。是衡量抽样误差大小的核心指标。(抽样平均误差越小,抽样分布越集中。反之,则越离散。)(三)抽样极限误差(亦称允许误差范围)估计量所允

14、许的最大(小)值与总体参数值之间的绝对离差,通常用 表示,即。抽样极限误差取决于两个因素:1、抽样标准误。抽样标准误越大,抽样极限误差就越大;2、抽样估计概率保证程度。概率保证程度越高,抽样极限误差就越大。,优良估计量的评价标准 估计量用以估计总体参数的量,一般指样本统计量。优良估计量的标准:1、无偏性以样本估计总体,所有可能的估计值与总体参数值离差的均值为零。样本均值、成数、方差是总体均值、成数、方差的无偏估计量。2、一致性以样本估计总体,样本容量充分大时,样本指标也充分靠近总体参数。样本均值、成数、方差是总体均值、成数、方差的一致性估计量。3、有效性以样本估计总体,要求优良估计量的方差比其

15、它估计量的方差小。样本均值、成数、方差是总体均值、成数、方差的有效估计量。4、充分性以样本估计总体,要求优良估计量的构造应能尽量减少有用信息损失。样本均值、成数、方差是总体均值、成数、方差的充分估计量。,(二)抽样平均误差的计算,影响抽样标准误大小的因素:,(1)总体标准差(总体各单位标志值的离散程度)。其它条件不变的情况下,总体单位的离散程度大,抽样标准误大。(2)样本容量。其它条件不变的条件下,样本容量大,抽样标准误小。(3)抽样方法。相同条件下,重复抽样的抽样标准误比不重复抽样的抽样标准误大。(4)抽样组织方式。由于不同抽样组织方式有不同的抽样误差,所以,在抽样误差要求相同的情况下,不同

16、抽样组织方式所必需的抽样数目也不同。,补充:样本容量与抽样误差之间的数量变动关系(在其他条件不变的情况下),1.当样本容量n扩大(或缩小)为原来的k倍时,则抽样平均误差 缩小(或扩大)为原来的K倍倒数的平方根。证明1:设:=2,n=4 则:,证明2:设:=2,n=4 则:,2.当抽样平均误差 扩大(或缩小)为原来的k倍时,则样本容量n 缩小(或扩大)为原来的K倍倒数的平方。证明3:设:=2,n=4 则:,证明4:设:=2,n=4 则:,第三节参数估计(重点节),重点:总体参数的区间估计带着问题学:1、参数估计的理论基础是什么?2、抽样极限误差如何计算?3、区间估计的计算方法和过程是什么?4、影

17、响抽样数目的因素有哪些?,第三节参数估计(重点节),一、参数估计的理论基础:大数定律和中心极限定理 抽样估计按随机原则从总体中抽取部分单位(样本)调查,用调查结果(样本指标)对总体参数做出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法。例:从1000只灯管中随机抽出50只检验,进行抽样估计和推断。(总体)1000 50(样本)总体平均数 样本平均数 总体成 数 样本成 数 总体方 差 样本方 差,特点:1、遵循随机原则抽样。2、用样本指标值估计总体指标值。3、以概率论和数理统计为理论基础,推断的结果有 一定的可靠程度,抽样误差可以事先计算和控制。,推断,抽取,二、抽样极限误差,样本均

18、值的:样本成数的:*注意:因为总体均值和总体成数是未知的,所以需要通过概率估算法去推算。概率估算涉及概率与概率保证程度 的概念与关系等知识。,概率与概率保证程度的函数对应关系,标准正态分布临界值与置信度图示,三、总体参数的估计 对不可能、不必要进行全面调查的社会现象的调查,需要用抽样调查;如:产品质量检验;职工家计(生活)调查 对全面调查结果复核或修正,需要用抽样调查。如:人口普查资料的复核,抽样估计的一般步骤:1.设计抽样方案(调查目的、时间、单位、组织方式方法等)。2.随机抽取样本(从总体随机抽取部分单位,构成样本)。3.搜集、整理样本资料(对抽出的样本单位进行登记、审查、分组、汇总、计算

19、样本指标的有关数值,即计算估计量的具体数值)。4.推断总体参数(即估计总体均值、成数、标准 差)。,估计量的评价标准 估计量用以估计总体参数的量,一般指样本统计量。优良估计量的标准:1、无偏性以样本估计总体,所有可能的估计值与总体参数值离差的均值为零。样本均值、成数、方差是总体均值、成数、方差的无偏估计量。2、一致性以样本估计总体,样本容量充分大时,样本指标也充分靠近总体参数。样本均值、成数、方差是总体均值、成数、方差的一致性估计量。3、有效性以样本估计总体,要求优良估计量的方差比其它估计量的方差小。样本均值、成数、方差是总体均值、成数、方差的有效估计量。4、充分性以样本估计总体,要求优良估计

20、量的构造应能尽量减少有用信息损失。样本均值、成数、方差是总体均值、成数、方差的充分估计量。,(一)点估计 概念:以一个样本的具体统计值去估计总体 的未知参数。优点:简便、明确、易行。缺点:无法说明(客观存在的)抽样 误差范围的大小及估计结果有 多大的把握程度。,误差-45,误差15,点估计:不考虑抽样误差。(事实上,抽样误差客观存在,且随影响因素的不同而不同。)所以,为了抽样推断准确,需要做区间估计。,(二)、区间估计 区间估计就是根据样本估计量和抽样分布,用一个具有一定可靠程度的区间范围来估计总体参数(包含平均数、成数、方差)。并使 处于区间 内的概率为。,你估计明天上海股市涨多少点?,我有

21、95%的把握,估计明天上海股市要涨30点?,1、总体平均数的区间估计,在一定概率 下,样本指标 会落入以 为中心,以 为半径的对称区间.换言之,样本指标 的取值在 范围内的概率为,即:所以,给定概率,则总体均值的估计区间为:,2、总体成数及其相应总量指标的区间估计,在一定概率 下,样本指标 p 会落入以 P 为中心,以 为半径的对称区间.换言之,样本指标 p 的取值在 范围内的概率为,即:所以,给定概率 则总体均值的估计区间为:,例5.7 总体平均数的区间估计:(不)重复抽样方法例5.8 总体成数的区间估计:重复抽样,总体参数估计的计算关系和方法示意图,课堂练习一:某商场从一批袋装食品中随机抽

22、取10袋,测得每袋重量(单位:克)分别为789、780、794、762、802、813、770、785、810、806,要求以95的把握程度估计这批食品的平均每袋重量的极限误差及其区间范围。,解题步骤:1、求样本均值(每袋平均重量)2、求样本方差3、求抽样标准误4、求极限误差5、求总体均值的估计区间,课堂练习二:某企业对本月生产的5,000件产品按1%比例随机抽样进行质量检验,样本合格率为93。在95.45的置信度下合格率的允许误差不超过3,请估计该批产品的合格率区间?解题步骤:,四、样本容量的确定,确定样本容量的意义 为使抽样误差在一定概率置信度下不超过允许范围所必须的抽样数目。大样本 n

23、30;小样本 n 30 对经济现象抽样调查常采用大样本。样本容量的确定的计算公式 一般由抽样极限误差(即允许误差)的计算公式推导而得。,该抽取几个猴才合适?,样本容量的计算分为:样本均值和样本成数两个系列;重复抽样和不重复抽样两种方法。若某次抽样既要估计总体均值,又要估计总体成数,则其样本容量计算结果应在两者中取最大的值。,(一)样本容量的影响因素 1、总体方差的大小(标志变异程度大小)其它条件不变的条件下,总体单位 差异程度大,则应多抽,反之可少抽一些。2、抽样极限误差(允许误差范围)允许误差增大,意味着推断的精度要求降低,在其他条件不变的情况下,必要的抽样数目可减少。反之,缩小允许误差,就

24、要增加必要的抽样数目。,3、概率保证程度(保证程度、置信度)因置信度与置信区间是同方向变化的,所以在其它条件不变的情况下,要提高推断的置信程度,就必须增加抽样数目。4、抽样方法 相同条件下,采用重复抽样应比不重复抽样多抽一些样本单位。不过,总体单位数很大时,二者差异很小。所以为简便起见,实际中当总体单位数很大时,一般都按重复抽样公式计算必要的抽样数目。,5、抽样组织方式 由于不同抽样组织方式有不同的抽样误差,所 以,在误差要求相同的情况下,不同抽样组织方式 所必需的抽样数目也不同。上述公式是简单随机抽样下确定必要抽样数目的公式。其它抽样组织方式下必要抽样数目的计算也可根据相应的误差公式来推导。

25、,课堂练习 某食品厂要检验本月生产的10,000袋某产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。要求在95.45的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?解:已知:10,000,S25克,克,95.45 即 2,,五、抽样调查的组织形式 及抽样方法,(一)纯随机抽样 简单随机抽样_是按随机的原则直接从总体中抽取容量为n的样本,每一个总体单位都有相等的被抽中机会。取样的方法有:1.直接抽选法。2.抽签法 3.随机数表取数法.根据样本提供的信息对总体的某些数字特征(总体参数)进行估计或推测.参数估计分为点估计和区间估计两类.,纯随机抽样(不重复抽样)(无

26、放回抽样),x1,x2,x3,xn,1、总体平均数 的估计 例:(大样本,采用不重复抽样方法)N=14500,n=100,2、总体成数P的估计 例(大样本,不重复抽样)N=50000,n=500,ni=60,p=ni/n=60/500=12%,补充:小样本条件下总体平均数的估计 若总体服从正态分布,则样本均值也服从正态分布,总体标准差通常未知,需用样本标准差S代替,.统计量t服从自由度为(-1)的t分布.若给定(1-a),查得对应的临界值,那么其在区间(,)内的概率为(1-a).,(二)等距抽样(机械抽样 或系统抽样),概念:将总体单位按某一标志排队,计算抽样间隔距离:在第一个抽样距离内确定抽

27、样起点 r,依次按固定的间隔和顺序抽取样本单位(或样本点)构成样本。(可以采用半距起点等距抽样或对称等距 抽样方法抽取样本单位。),1、按无关标志排队等距抽样,(如:职工工资按住户的门牌号数排列)排队标志(门牌号数)X:X1到Xn由小到大排列,调查标志(工资收入)Y:Y1到Yn呈现为随机排列。故抽样起点可随机确定,完全遵循了随机原则,不会产生系统偏差 抽样误差的计算:通常是按简单随机抽样的抽样误差公式 近似计算的。即抽样效果近似简单随机 抽样。,等距抽样(按无关标志排序),x1,x2,x3,xn,2、按有关标志排队等距抽样 将总体单位按某一有关标志排队。(如:职工工资按高低顺序排列)排队标志(

28、工资额)X:X1Xn由小(大)到大(小)排列。调查标志(工资收入)Y:Y1Yn也大体上呈现为 由小(大)到大(小)有序排列。,2、按有关标志排队等距抽样 将总体单位按某一有关标志排队。(如:职工工资按高低顺序排列)排队标志(工资额)X:X1Xn由小(大)到大(小)排列。调查标志(工资收入)Y:Y1Yn也大体上呈现为 由小(大)到大(小)有序排列。,等距抽样(按有关标志排序),x1,x2,x3,xn,*抽样误差的计算,概念:按某一个标志将总体单位划分成若干层;然在 各层按随机抽样方法分别抽出各层的样本单位组成样本。特点:(类型抽样与简单随机抽样比较):抽样误差较小,样本具有很好的代表性;不仅能够

29、满足推断总体的需要,也能够满足推断各子总体的需要(满足分层次管理需要)。分层抽样的抽样标准误与组间方差无关,仅取决于组内方差的平均水平。,(三)类型抽样(分层抽样),分层(类)抽样 1、将总体按某标志分类。(如:职工工资分为低、中、高三类。)2、按比例在各类中随机抽样。(如:按50%比例抽样,共抽6人组成样本。工人组:随机抽样抽3人;白领组:随机抽样抽2人;老板组:随机抽样抽1人.(注意:与按有关标志等距抽样区别。),类型抽样(不重复抽样),x1,x2,x3,xn,(一)总体平均数的估计 例:(大样本,采用不重复抽样方法)N=250,n=50,n1=5,n2=15,n3=30,f1=f2=f3

30、=n/N=0.2,(二)各层样本容量的确定,*从抽样误差公式来认识类型抽样的优越性 与简单随机抽样相比,二者的抽样误差 公式只相差一个因素方差:分层抽样的 抽样误差取决于各层方差的平均数,而简单 随机抽样的抽样误差取决于总方差。在分组条件下,总方差=各组方差平均数+组间方差 所以,总方差总是大于组间方差的,从而 分层抽样的抽样误差总是小于简单随机抽样的 抽样误差。,(四)整群抽样(集团抽样),概念:首先将总体划分为若干部分(R群);然后按随机的原则不重复地抽出其中一部分(r 群),对中选群的所有单位进行全面调查。特点:简化了抽样组织工作(调查较方便,省力)缺点:样本单位过于集中,抽样误差大,代

31、表性低。,4、整群抽样(不重复抽样),一、先分群。.二、各群不需按标志顺序排列;抽中的群内是普查。,设总体的N个个体形成R群,每群M个个体。从R群中随机抽取r群(一般采用不重复抽样方法),共rM=n个个体构成样本。若以 表示第i群第j个体的变量值,那么群平均数 为:总体均值的估计量为:与该估计量相对应的抽样标准误为:其中 为群抽样比,为总体群间方差。未知 时要以样本群间方差 来估计。,1、总体平均数 的估计,例,2、总体成数 p 的估计 设 为第i群某类变量值的个数,那么群成数 为:总体成数的估计量为:与该估计量相对应的抽样标准误为:其中 为群抽样比,为总体群间方差。未知时要以样本群间方差 来

32、估计。,例,类型抽样与整群抽样的区别:,多阶段抽样(农产品产量调查),全国四川绵阳江油.某块田地样本框等距抽样,四川省,绵阳市,江油市,某块田地,样本框庄稼,(五)阶段抽样1、总体平均数 的估计 设总体的N个个体形成R个群,每群M个个体。从R群中随机不重复抽取r群,抽中的群再从M个个体中随机不重复抽取m个个体。若以 表示第i群第j个个体的变量值,那么群均值 的估计量为:总体平均数 的估计量为:与该估计量相对应的抽样平均误差为:其中 为第一阶段抽样比,为第二阶段抽样比;的含义与整群抽样相同。为各群方差的平均数,未知时要以各样本群的样本方差的平均数 来估计。,例,2、总体成数p的估计 设 为第i群

33、某类变量值的个数,为第i群样本中某类变量值的个数,那么群成数 的估计量为:总体成数的估计量为:与该估计量相对应的抽样平均误差为:其中 为各群方差的平均数,未知时要以各样本 群的样本方差的平均数 来估计。其他符号的含义与前面相同。,例,回顾各种抽样方式,注意对比!纯随机抽样(不重复抽样),x1,x2,x3,xn,等距抽样(按无关标志排序),x1,x2,x3,xn,等距抽样(按有关标志排序),x1,x2,x3,xn,先将原数列(杂乱)按某一标志顺序排列(整理);形成一组新数列(大小有序、整齐);,类型抽样(不重复抽样),x1,x2,x3,xn,先分类;(类似于按有关标志等距抽样)各类排列顺序不受限

34、;各类按比例抽样,不是按等距抽样。(有别于按有关标志等距抽样),想想:这种抽样方式与按有关标志等距抽样有何异同?,4、整群抽样(不重复抽样),x1,x2,x3,xn,先分类群;(相似于类型抽样)各群不需按标志顺序排列;抽中的群内是普查。(有别于类型抽样的各组按比例抽样),想想:这种抽样方式与类型抽样有何异同?,多阶段抽样(农产品产量调查),全国四川绵阳江油.某块田地样本框等距抽样,四川省,绵阳市,江油市,某块田地,样本框庄稼,第四节 EXCEL 的应用,一、总体平均数区间估计:操作注意事项:求标准差、求极限误差要使用统计函数或用公式形式。求标准差用公式:“=SQRT(45568)”;求极限误差

35、:用统计函数“CONFIDENCE”;或公式“=CONFIDENCE(c6,c5,c3)”。其余可用计算公式处理。,总体成数区间估计,操作注意事项:求标准差、求极限误差要使用统计函数或用公式形式。求标准差用:“=SQRT(c5*1-c5*c5)”;求极限误差:用统计函数“CONFIDENCE”;或公式“=CONFIDENCE(c7,c6,c4)”。其余可用计算公式处理。,本章小结,抽样估计是用样本指标推断总体参数。抽样时应遵循随机原则,可以采用重复或不重复抽样方法。运用概率估计法推断总体参数时会产生代表性误差(即抽样误差)。抽样估计的步骤是:计算样本指标计算抽样误差(抽样平均误差、抽样极限误差)(点)区间估计。抽样估计一般包含两个系列:用抽样平均数对总体平均数进行区间估计;用抽样成数对总体成数进行区间估计。影响抽样平均误差的因素有:标准差、抽样单位数、抽样方法和组织方式(简单随机抽样、分层抽样等)四种。影响抽样单位数的因素有标准差、抽样误差、概率度、抽样方法和组织方式等五种。,作业 P148-149,一、思考题 第3、4、5题二、技能题 第2题三、根据同学们自作的统计调查作业(可以视为样本容量为50的抽样数据),运用统计函数,以95%的概率保证总体均值的估计区间。(本章布置的项目任务),返回,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号