商务与经济统计――抽样与抽样分布.ppt

上传人:牧羊曲112 文档编号:5946718 上传时间:2023-09-07 格式:PPT 页数:56 大小:1.95MB
返回 下载 相关 举报
商务与经济统计――抽样与抽样分布.ppt_第1页
第1页 / 共56页
商务与经济统计――抽样与抽样分布.ppt_第2页
第2页 / 共56页
商务与经济统计――抽样与抽样分布.ppt_第3页
第3页 / 共56页
商务与经济统计――抽样与抽样分布.ppt_第4页
第4页 / 共56页
商务与经济统计――抽样与抽样分布.ppt_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《商务与经济统计――抽样与抽样分布.ppt》由会员分享,可在线阅读,更多相关《商务与经济统计――抽样与抽样分布.ppt(56页珍藏版)》请在三一办公上搜索。

1、第六章 抽样和抽样分布,统计实例(Statistics in Practice)位于广东省顺德市内的美的家用电器公司是我国空调最大的生产厂家之一,其空调年销售已达到700万台,销售额为120亿元。这家低调、在外界看来有些神秘的顺德民营企业,尽管不作声张,极少炒作,甚至喊出“不想做行业老大”的话,近几年来却成长势头迅猛,增长率一直40%以上,赢利率极高。这背后的原因在于美的较早就开始了提升企业竞争能力。为了避免当今家用电器行业低价利薄的局面,实现多条腿走路,以在新一轮竞争中保持优势,美的家用电器集团总裁何享健又提出了进军汽车行业的战略目标。为此他要求公司营销部对国际国内各大汽车生产厂家的生产能力

2、、销售额、营利能力、市场占有率等方面作调查分析。作为美的公司营销部部长方洪波来说,他必须思考怎样去采集汽车生产厂家的这些经济机密数据?获得这些数据后,应采用什么方法作数据分析与推断。这必然会用到统计推断的知识。,第六章 抽样和抽样分布,从这一章开始便进入推断统计学的学习内容,它会节省人们的时间和财物来达到认识对象的最佳限度。现实世界包含的素材集合非常庞大,从中提取需要的信息非常困难。如:选民人数:每个候选人的支持率是多少?产品:不合格率是多少?环境:污染程度如何?市场:品种、价格、质量状况、购买力等情况的了解。在这一章里,你将会了解到样本是怎样抽取的,样本统计量是怎样分布的,如何根据样本统计量

3、对总体参数做估计。,第六章 抽样和抽样分布,STAT,本章重点1、简单随机抽样;2、的抽样分布;3、的抽样分布;4、其他组织形式的抽样。本章难点1、抽样分布原理。参考书目1、李心愉:应用经济统计学,北京大学出版社;2、David S.Moore:统计学的世界,中信出版社;3、袁 卫:新编统计学教程,经济科学出版社;4、统计网站:UNSD、OECD、中国国家统计局。,第六章 抽样和抽样分布,STAT,第一节 抽样的一般问题例 其养猪厂共有存栏肉猪10000头,现欲了解这批肉猪平均每头毛重,如果将每头肉猪过称去获取数据将是不合算的。我们可以按照“等机会原则”从中抽出100头称重量,计算这100头的

4、平均每头毛重,以达到我们期望的目的。本例中存栏肉猪10000头组成的总体,则称为全及总体,它是指在统计抽样中所要了解的研究对象整体,又称为母体,当我确定了研究目标时,它具有惟一性。一般全及总体的单位总数用N表示,称作总体容量。,第六章 抽样和抽样分布,STAT,本例中所抽出的100头肉猪组成的总体,则称为样本总体,它是指在统计抽样中按照“等机会原则”从全及总体的N(10000)中抽出的部分单位(每个单位称作样本单位)所组成的整体,简称样本,又称子样。一般样本总体的单位总数用n(100)表示,称作样本容量。样本总体则不具惟一性,它的可能个数与N、n及抽样方法有关。通常n30称为大样本,在抽样调查

5、中取大或小样本会直接影响到抽样分布的特征。,例 其养猪厂共有存栏肉猪10000头,现欲了解这批肉猪平均每头毛重(设为,)如果将每头肉猪过称去获取数据将是不合算的。我们可以按照“等机会原则”从中抽出100头称重量,计算这100头的平均每头毛重(95.5kg),以达到我们期望的目的。,一、统计抽样的几个基本概念1、全及总体和样本 全及总体:研究对象全体,又称母体。容量用N表示。具备惟一性。样本总体:按随机原则从总体中抽出的部分单位的全体,简 称样本,被抽出的每个单位称样本单位。容量用n表示。样本不具惟一性。,第六章 抽样和抽样分布,第六章 抽样和抽样分布,STAT,2、总体参数和样本统计量根据全及

6、总体各单位变量值计算的反映全及总体某数量特征的综合指标,由于全及总体唯一确定,故称总体参数。如上例中的根据样本总体各单位变量值计算的反映样本总体某数量特征的综合指标,由于样本总体不具惟一性,故称为样本统计量,它是一个随机变量。如上例中的100头的平均每头毛重(95.5kg),第六章 抽样和抽样分布,3、放回抽样与不放回抽样从全及总体中抽取样本有两种方法:放回抽样和不放回抽样。,放回抽样,抽样安排-对每次被抽到的单位经登记后再放回总体,重新参与下一次抽选的抽样方法。在每次的抽取中样本单位被抽中的概率都等于统计中称这样的抽样为相互独立的试验。,不放回抽样,抽样安排-对被抽到的单位登记后不再放回总体

7、的抽样方法。不放回抽样与放回抽样比较,每次抽样的条件是不同的,前一次的抽取结果会对后一次的抽取产生影响,统计中称这样的抽样为相互不独立的试验。注意:二种方法都遵循了“等机会原则”,第六章 抽样和抽样分布,二、简单随机抽样,简单随机抽样也称为纯随机抽样。它是对总体单位不做任何分类或排队,直接从总体中按“随机原则”抽取样本单位的调查方式。,其样本抽取过程按总体为有限和无限的不同加以区别1、有限总体抽样从容量为N的有限总体中进行抽样,如果容量为n的每个可能样本被抽到的可能性相等,则称被抽的样本为简单随机样本。,第六章 抽样和抽样分布,为了便于抽取样本单位,一般在明确抽样框的条件下,对总体的每个单位都

8、要编号,然后用抽签式或利用随机数字表进行抽取。,例如:N=500 n=10 编码从1-500号在随机数表中随意点二个数字,得到54-50=4行,34列。则选取的号码从这个被选中的数开始,由于500是个三位数,则小于500的连续三位数即为中选号码。见表中所示。,第六章 抽样和抽样分布,第六章 抽样和抽样分布,2、无限总体抽样 在实际应用中,若总体单位数很多,要逐一编号是难以办到的,特别是有些现象,事前也不可能编号(如一些连续大量正在生产的产品)因此我们定义:被研究的总体中所涉及某一正在进行的过程使得不可能列出总体中的所有元素,则可视为无限总体。无限总体抽样条件:同一总体 相互独立,第六章 抽样和

9、抽样分布,三、点估计点估计就是用样本估计量的一个具体观测值直接作为总体的未知参数的估计值的方法。如上例中随机抽取的100头的平均每头毛重(95.5kg)可作为10000头平均每头毛重 的点估计值 常用的估计量有:(1)样本平均数 为总体平均数 的估计量;(2)样本方差 为总体方差 的估计量;(3)样本成数 为总体成数 P 估计量。,第六章 抽样和抽样分布,在对总体特征做出估计时,并非所有估计量都是优良的,从而产生了评价估计量是否优良的标准。作为优良的估计量应该符合如下三个标准:,第六章 抽样和抽样分布,1,无偏性 如果样本某统计量的数学期望值等于其所估计的总体参数真值,则这个估计统计量就叫做该

10、总体参数的无偏估计量。如样本平均数的数学期望是总体平均数,则样本均值是总体均值的无偏估计量。这里无偏估计量是指没有系统偏差(非随机偏差)的平均意义上的量,即如果说一个估计量是无偏性的,并不是保证用于单独一次估计中没有随机性误差,只是没有系统性偏差而已。这是一个优良估计量的重要条件。若以 代表被估计的总体参数,代表 的无偏估计量则有:,第六章 抽样和抽样分布,B,一致性 若估计量随样本容量n的增大而越来越接近总体参数值时,则称该估计量为被估计参数的一致性估计量。估计量的一致性是从极限意义上讲的,它适用于大样本的情况。如果一个估计量是一致性估计量,那么采用大样本就更加可靠。当然,样本容量n增大时,

11、估计量的一致性会增强,但调查所需的人、财、物力也相应增加。例如,以样本平均数估计总体平均数,符合一致性的要求,即存在如下关系:式中 为任意正数。,第六章 抽样和抽样分布,C有效性 有效性是指无偏估计量中方差最小的估计量。无偏估计量只考虑估计值的平均结果是否等于待估计参数的真值,而不考虑估计的每个可能值及其次数分布与待估计参数真值之间离差大小的离散程度。我们在解决实际问题时,不仅希望估计值是无偏的,更希望这些估计值的离差尽可能地小,即要求比较各无偏估计量中与被估计参数的离差较小的为有效估计量。如样本平均数与中位数都是总体均值的无偏估计量,但在同样的样本容量下,样本平均数是有效的估计量。,第六章

12、抽样和抽样分布,第二节 抽样分布,从一个总体中随机抽出容量相同的各种样本,再从这些样本计算出的某统计量所有可能值的概率分布,称为这个统计量的抽样分布。,在抽样推断中,无论是总体,还是样本,都可以用平均数、比率(或成数)、标准差和方差等指标来描述它们的特征。当它们用来描述样本的特征时,称为样本统计量;当它们用来描述总体特征时,称为总体参数。构造抽样分布包括以下几个步骤:(1)从容量为N的有限总体中随机抽出容量为n的所有可能样本;(2)算出每个样本的统计量数值;(3)算出每个样本统计量数值相对应的概率,例:在一箱(550200=50000 支)卷烟中随机抽出40支测量烟丝重量X,然后对这箱卷烟的烟

13、丝重量进行分析。,样本,样本指标,N=50000,n=40,放回抽样,不放回抽样,X1、X2、XN,第六章 抽样和抽样分布,如果将 整理成分布数列,得到以下形式:,形成了抽样分布表,下面再以一个简单实例来说明抽样分布的形成,第六章 抽样和抽样分布,考察一个N=6的总体(6点的骰子),其原始分布属于均匀分布:,从这个总体中有放回地抽取n=2的样本(二个骰子同时抛点数),所有可能的样本总数为 Nn=36,假定要通过样本估计总体的均值,则所有36个可能结果为:,第六章 抽样和抽样分布,第六章 抽样和抽样分布,样本均值的分布整理成:,用图示反映其分布状况如:,第六章 抽样和抽样分布,第六章 抽样和抽样

14、分布,如果我们将抽取简单随机样本的过程看成是一个试验,那么,样本均值 就是该试验结果的数量描述。因而,样本均值 就是个随机变量。因此,与其他随机变量一样,具有平均数、期望值、方差和概率分布。因为 的各种可能取值是不同简单随机抽样的结果,所以 的概率分布称为 的抽样分布。对于这个抽样分布及其特征的了解,可以使我们能够对样本均值 与总体均值 的接近程度进行概率描述。,实践中,我们只从总体中抽取一个简单随机样本,抽样分布是理论分布,重要的是我们必须掌握它的特征。,第六章 抽样和抽样分布,第三节 的抽样分布,如前所述,样本均值 所有可能取值的概率分布,一、的期望值和标准差1、期望,第六章 抽样和抽样分

15、布,例总体A、B、C三人年龄为:1,2,3,N=3 n=2。=2岁,结论是:,第六章 抽样和抽样分布,2.样本标准误差()定义:所有样本统计量抽样误差的平均数,(采用标准的计算形式)。A:抽样统计量 的抽样标准误差,B:抽样成数P的抽样标准误差,第六章 抽样和抽样分布,抽样平均误差的计算(1)抽样平均数度 的抽样平均误差A、重复抽样,第六章 抽样和抽样分布,B、不重复抽样,第六章 抽样和抽样分布,有限总体中,为校正因子,一般可简写为,一般当抽样比小于等于5时,校正因子可忽略不计。,第六章 抽样和抽样分布,二、中心极限定理(总体分布未知),当样本容量n30,则不论是否已知总体分布状态,样本平均数

16、的分布趋近正态分布,而且其分布比总体分布更集中,即,其中 为样本平均数的方差,为总体方差,定理:设X是具有期望值为,方差为 的任意总体,则样本平均数的抽样分布,将随着n的增大而趋于正态分布,分布形式(参数)为 N()-中心极限定理,第六章 抽样和抽样分布,3、正态分布(P168),140 150 160 170 180 190,0.50.40.30.20.1,身高,(以已知总体为例),调整:“频率密度”(频率/组距)“频率”;直方或折线覆盖下的面积=1,140 150 160 170 180 190,身高,0.050.040.030.020.01,当组数n无穷大,折线曲线。,身高,140 15

17、0 160 170 180 190,0.050.040.030.020.01,注:参数、不同分布的形状与位置不同。,x1 x2,-Z 0 Z,容易证明得到,162 170 178,-z/2 0 z/2,第六章 抽样和抽样分布,第四节 的抽样分布样本比例 的所有可能取值的概率分布,一、的期望值和标准差,P-总体比例,1、期望,2、标准差,的标准差又称比例的标准误,计算式如下:,第六章 抽样和抽样分布,根据中心极限定理,当样本容量n很大时,可视 的分布为正态分布。条件:,第六章 抽样和抽样分布,定理:设p是具有期望值为P,方差为 P(1-P)的任意总体,则样本比例 的抽样分布,将随着n的增大而趋于

18、正态分布,分布形式(参数)为 N()-中心极限定理,注:研究样本比例的抽样分布时,可以把它作为平均数的特例来进行分析。,第六章 抽样和抽样分布,例:从一批产品中抽出200件,检验出10件不合格,问样本比例 在总体比例的 范围内的概率有多大?,例中n为200,且大样本下,当总体未知,可用样本估计值替代,查标准正态分布表,得概率为95.45,第六章 抽样和抽样分布,第五节 其他抽样方法,抽样组织方式是指在抽样时对总体的加工整理形式。根据对总体的加工整理形式不同,在抽样调查中抽样的组织方式很多,除简单随机抽样外,还有类型抽样、等距抽样、整群抽样、多阶段抽样、方便抽样和判断抽样等其他抽样方法。一、类型

19、抽样 类型抽样又称分层抽样或分类抽样。它是先将总体的全部单按照某个标志分成若干组,然后在各组中采用简单随机抽样方式或其他方式抽取样本单位的抽样组织方式。,例10人年龄资料如下。N=10 n=3,推断总体平均年龄。人:A B C D E F G H I J年龄:5 8 12 40 42 46 48 70 72 76简单随机抽样(B、H、I),(C、D、E),(F、G、I)结论:总体变异较大时类型抽样。类型抽样(B、E、I),(C、D、H),(A、G、J),第六章 抽样和抽样分布,类型抽样是应用于总体内各单位在被研究标志上有明显差别的抽样,如研究农作物产量时,耕地有平原、丘陵和山地等;研究职工的工

20、资水平时,各行业之间有明显的差别。类型抽样实质上是把统计分组和抽样原理有机结合的抽样组织方式。通过分组,可以使组中具有同质性,组间具有差异性,然后从各组中简单随机抽样。这样可以保证样本对总体具有更高的代表性,所以计算出的抽样误差就比较小。类型抽样应掌握的主要原则是:分组时应使组内差异尽可能小,使组间差异尽可能大。,第六章 抽样和抽样分布,设全及总体有N个单位,现在需要抽取一个容量为n的样本,可以将总体单位N按一定标志排队,然后将N划分为n个单位相等的部分,每一部分都包含K个单位,即N/n=K。,二、等距抽样 等距抽样又称为机械抽样或系统抽样。它是先将总体各单位按某一标志顺序排列,然后按照固定的

21、顺序和相同的间隔来抽取样本单位的抽样组织方式。,第六章 抽样和抽样分布,第六章 抽样和抽样分布,1、2、3、i、K,i+2K,i+(n-1)K,n,在第一部分K个单位中(顺序为1、2、3、i、K)随机抽取一个单位i,而在第二部分中抽取第i+K单位。第三部分中抽取第i+2K单位在第n部分抽取第i+(n-1)K单位,共n个单位组成一个样本,而且每个样本的间隔均为K,这种抽样方法称等距抽样。,等距抽样的随机性表现在抽取第一个样本单位上,当第一个单位确定后,其余各个单位的位置也就确定了。等距抽样可以分为无关标志排序抽样和有关标志排序抽样两类。无关标志排序抽样是指排序的标志与被研究的标志无关,如:观察学

22、生考试成绩用姓氏笔划;观察产品质量按生产的先后顺序等。无关标志排序可以保证抽样的随机性,它实质上相当于简单随机抽样。有关标志排序抽样是指排序的标志与被研究标志相关。在对总体各单位的变异情况有所了解的情况下,也可以采用有关标志进行总体单位排列,使各单位的排列顺序和它的变量数值大小保持密切的关系。,第六章 抽样和抽样分布,如:农产量抽样调查,可利用各县或各乡当年估计亩产或最近三年平均亩产标志排队,抽取调查单位;又如职工家计调查,可按职工平均工资排队,抽取调查企业或调查户。由此可见,按有关标志排序实质上是运用类型抽样的一些特点,有利于提高样本的代表性。但也必须注意到,等距抽样在排序时,第一个样本单位

23、的位置确定后,其余单位也随之确定,因此要避免抽样间隔和现象本身的周期性节奏相重合,引起系统性的影响。,第六章 抽样和抽样分布,三、整群抽样 整群抽样又称为分群抽样或集团抽样。它是将总体划分为若干群,然后以群为单位从中按简单随机抽样方式或等距抽样方式抽取部分群,对中选群中的所有单位一一进行调查的抽样组织方式。,第六章 抽样和抽样分布,A,B,C,D,E,F,G,H,I,J,K,L,N,O,P,L,H,P,D,1、按某种标志或要求将总体区分为若干群(R),群内单位数(M)相等;2、采取不重复抽样方式从R群随机抽出r群,尔后对样本群进行全面调查以推断总体。,总体群数R,样本群数r,在大规模的抽样调查

24、中,如果总体单位多且分布区域广,缺少进行抽样的抽样框,或者在按经济效益原则不宜编制这种抽样框的情况下,宜采用整群抽样方式。整群抽样中的群主要是自然形成的,如按行政区域、地理区域划分群。整群抽样和其他抽样组织方式比较,在相同的条件下,抽样误差较大,代表性较低。在统计工作实践中采用整群抽样时,一般都要比其他抽样方式抽样更多的单位,借以降低抽样误差,提高抽样结果的准确程度。,第六章 抽样和抽样分布,第六章 抽样和抽样分布,四、多阶段抽样 多阶段抽样又称多级抽样。它是将抽取样本单位的过程划分为几个阶段,然后逐阶段抽取样本单位的抽样组织方式。如果先将总体进行分组,从中随机抽出一些组,然后再从中选的组中随

25、机抽取总体单位,称为二阶段抽样,如整群抽样随机抽出群,再从群中随机抽出样本单位就是二阶段抽样。,第六章 抽样和抽样分布,如果将总体进行多层次分组,然后依次在各层中随机抽取,直到抽到总体单位,就称为多阶段抽样,如我国农产量调查就是采用多阶段抽样调查,即先从省中抽县,然后从中选县抽乡,乡中抽村,再由中选村中抽地块,最后从中选的地块中抽取小面积的样本单位。,当总体单位很多且分布广泛,几乎不可能从总体中直接抽取总体单位时,常采用多阶段抽样。其优点在于:首先,便于组织抽样。它可以按现有的行政区划或地理区域划分各阶段的抽样单元,从而简化抽样框的编制。,第六章 抽样和抽样分布,其次,可以获得各阶段单元的调查资料,即根据最初级资料可进行逐级抽样推断,得到各级的调查资料。如农产量调查,可根据样本推断地块资料,根据地块资料可推断村的资料,然后依次推断乡、县等。第三,多阶段抽样的方式比较灵活,各阶段抽样的组织方式可以前述四种为依据进行选择。一般在初级阶段抽样时多用类型抽样和等距抽样,在次级阶段抽样时多用等距抽样和简单随机抽样。同时,还可以根据各阶段的不同特点,采用不同的抽样比。如方差大的阶段,抽样比大一些;方差小的阶段,抽样比小一些。而且多阶段抽样在简化抽样工作的同时,抽样单位的分布较广,具有较强的代表性,第六章 抽样和抽样分布,五、非概率抽样,方便抽样判断抽样,第六章 抽样和抽样分布,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号