《经济统计学第八章.ppt》由会员分享,可在线阅读,更多相关《经济统计学第八章.ppt(33页珍藏版)》请在三一办公上搜索。
1、经济统计学第八章 抽样推断,本章重点,第一节 抽样推断概述第二节 抽样误差和抽样估计第三节 抽样的组织方式第四节 样本容量的确定和总量指标的推算,第一节 抽样推断概述一、抽样推断的意义 抽样推断是在抽样调查的基础上,运用数理统计方法,根据样本的实际资料对总体作出具有一定可靠程度推断的一种统计方法。特点:1由样本的已知资料去估计未知的总体数量特征。2选取样本必须遵循随机原则。3抽样推断中产生的误差可以事先控制。,二、抽样推断的作用对不可能进行全面调查的现象总体进行推断。对于某些不必要进行全面调查的总体进行推断。可以对全面调查的数据进行补充或修正。可以用于大批量生产过程中产品的质量检验和控制。可以
2、对于某种总体的假设进行检验,来判断这种假设的真伪,以决定取舍。,三、抽样推断中的几个基本概念(一)全及总体和抽样总体1全及总体是指所要研究对象的全部单位构成的整体,简称总体。单位数通常用N表示。2抽样总体是指从全及总体中按照随机原则抽取的那部分单位组成的整体,简称样本。样本单位数也叫样本容量,用n表示。全及总体是唯一确定的,而抽样总体是随机的。从一个全及总体中可以抽取一个样本,也可以抽取多个样本。,(二)全及指标和抽样指标1全及指标。全及指标是根据全及总体各单位标志值计算的综合指标,又称总体指标。常用的全及指标:(1)全及平均数:全及总体各单位标志值的平均数。,(2)全及成数:全及总体中具有某
3、一相同标志表现的单位数占全及总体单位数的比重,用P或者Q表示。若以N1代表具有某种相同标志表现的单位数,N0代表不具有某种相同标志表现的单位数,N=N1+N0,则总体成数为:成数是是非标志的平均数。所谓是非标志就是指只能取两种标志表现的标志。假定具有某种相同标志表现的变量值记为1,不具备该种标志表现的变量值记为0,那么成数 可以看作是这两个变量的加权算术平均数,即 是是非标志的平均数:,(3)总体数量标志标准差。总体数量标志标准差是指全及总体中根据各单位标志值计算的标准差。总体标准差的平方叫做总体方差,记作。(4)总体是非标志标准差。总体是非标志标准差是指全及总体中根据是非标志计算的标准差。总
4、体是非标志的标准差为,方差为。,2抽样指标。抽样指标是根据抽样总体各单位标志值计算的综合指标,也称样本指标。抽样指标是一个随机变量。常用的抽样指标:(1)抽样平均数。抽样平均数是抽样总体各单位标志值的平均数。,(2)抽样成数。抽样成数是样本中具有某一相同标志表现的单位数占样本单位数的比重,用p表示或者q表示。若以n1代表具有某种相同标志表现的单位数,n0代表不具有某种相同标志表现的单位数,n=n1+n0,则抽样成数为:同理可知,p是样本是非标志的平均数。,(3)样本数量标志标准差。样本数量标志标准差是指样本中根据各单位标志值计算的标准差,记作S。样本标准差的平方叫做样本方差,记作S2。(4)样
5、本是非标志标准差。样本是非标志标准差是指样本中根据是非标志计算的标准差。样本是非标志的标准差为,方差为。在抽样估计中,样本指标又称为统计量,总体指标又称为参数。,(三)抽样框与抽样方法1抽样框 抽样之前,必须根据预定的要求将总体划分成一个个抽样单位,这些单位互不重叠,原来的总体单位只能属于某一个抽样单位。抽样单位可以是原来的总体单位,也可以不是原来的总体单位。全部抽样单位所构成的名单称为抽样框。抽样框的作用是:(1)易于贯彻随机原则和进行抽选工作,提高抽样效率。(2)确定了调查对象即全及总体的范围。,2抽样方法重复抽样:也称重置抽样或有放回抽样,是指从总体中随机抽选第一个样本单位后,将它的标志
6、记录下来后放回总体再次参加抽选,重复这个步骤,直到抽满n个样本单位为止。不重复抽样:也称不重置抽样或无放回抽样,是指从总体单位数为N的总体中随机抽选第一个样本单位后,将它的标志记录下来后不放回总体,再从N-1个单位中抽选第二个样本单位,将它的标志记录下来后也不放回总体,重复这个步骤,直到抽满n个样本单位为止。,第二节 抽样误差和抽样估计一、抽样误差的概念登记性误差是指在登记汇总过程中由于测量、记录、转抄、计算等错误而产生的误差。代表性误差是指排除登记性误差后,用样本指标推断总体指标时所产生的误差。由于没有遵循随机原则而产生的误差,称为偏差。在没有登记性误差的前提下,又遵循了随机原则,纯粹是由样
7、本指标推断总体指标时产生的误差,称为抽样误差。抽样实际误差是指样本指标与总体实际指标的差数。抽样平均误差是所有样本指标的标准差。,统计误差,抽样平均误差,抽样实际误差,抽样误差,偏差,代表性误差,登记性误差,二、抽样平均误差的计算(一)重复抽样的抽样平均误差1.抽样平均数的抽样平均误差 表示总体的标准差,n为样本容量。2.抽样成数的抽样平均误差P(1-P)表示总体是非标志的方差,n为样本容量。,(二)不重复抽样的抽样平均误差1.抽样平均数的抽样平均误差 表示总体的标准差,n为样本容量,N为总体单位数。2.抽样成数的抽样平均误差P(1-P)表示总体是非标志的方差,n为样本容量,N为总体单位数。,
8、三、抽样平均误差的影响因素(1)样本容量。样本容量越小,抽样平均误差越大;样本容量越大,抽样平均误差越小。(2)总体标志变异指标。总体标志变异指标越大,抽样平均误差越大;总体标志变异指标越小,抽样平均误差也越小。当总体标志变异程度为零时,说明总体各单位之间无差异,此时,抽样平均误差为零。(3)抽样的方式方法。在其他条件相同的条件下,重复抽样的抽样平均误差大于不重复抽样的抽样平均误差。,四、抽样估计 抽样估计就是利用所取得的样本资料,采用一定的估计方法,对总体进行估计和推断。(一)抽样估计的优良标准1无偏性。用样本指标估计总体指标时,所有可能样本指标的平均数等于被估计的总体指标。2一致性。用样本
9、指标估计总体指标时,若样本容量充分的大,则样本指标充分靠近总体指标,即随着样本容量的无限增大。3有效性。有效性要求样本指标估计总体指标时,作为无偏估计量的方差比其他估计量的方差小。(二)抽样估计的方法1点估计。点估计就是用实际样本指标数值代替总体指标数值的一种估计方法。2区间估计。区间估计就是根据样本指标和抽样平均误差估计总体指标的可能范围,并同时给出总体指标落在该范围的可靠程度。,由于未知的全及指标是一个确定的量,而抽样指标则是围绕着全及指标出现的随机变量,它与全及指标可能产生正负离差,这种变动范围的最大绝对值就是抽样极限误差,也称为允许误差。用 和 分别表示平均数和成数的抽样极限误差,则有
10、:变换后,得:,抽样极限误差要用抽样平均误差为标准来衡量,把抽样极限误差除以抽样平均误差,表示抽样极限误差是抽样平均误差的倍数,它是测量抽样估计可靠程度的一个参数,称为概率度,通常用t表示。上述公式表明,在一定抽样平均误差的条件下,概率度越大,则抽样极限误差越大,总体指标落在误差范围内的概率越大,从而抽样估计的可靠程度也就越高;反之,概率度越小,则抽样极限误差越小,总体指标落在误差范围内的概率也越小,从而抽样估计的可靠程度也就越低。,那么如何衡量总体指标落在误差范围内的概率大小哪?数理统计证明,概率度和概率之间存在一定的函数关系,若用P表示概率,即表示抽样估计的可靠程度或者概率保证程度,则其函
11、数关系可表示为:P与t的值是一一对应的。常用的P与t的对应值如表8-1,其他概率与概率度的对应关系可查正态分布概率表。,例:某企业对某批电子元件寿命进行检验,随机抽取100只,测得平均耐用时间为1000小时,标准差为50小时,合格率为94%,试计算:以耐用时间的允许误差范围 小时,估计该批产品平均耐用时间的区间及其概率保证程度。解:下限:上限:由,查概率表得 答:估计该批产品的平均耐用时间在9901010小时之间,有95.45%的概率保证程度。,第三节 抽样的组织方式一、简单随机抽样1.概念:简单随机抽样也叫纯随机抽样,它是指在进行抽样时,对全及总体不经过任何形式的处理,不进行排队或分类,按照
12、随机原则从总体中抽取样本单位的抽样方式。2.取样方法 A 直接抽选法 B 抽签法 C 随机数表法 D 计算取随机数法3.抽样平均误差的计算估计总体平均数时 估计总体成数时重复抽样不重复抽样,二、类型抽样1.概念:类型抽样也叫分层抽样,它是运用统计分组法,把全及总体按主要标志划分为几个类型组,然后在各组中再按随机原则抽取样本单位的组织形式。2.分类 A 等比例类型抽样 B 不等比例类型抽样 3.抽样平均误差的计算重复抽样估计总体平均数时估计总体成数时不重复抽样估计总体平均数时估计总体成数时,例:某乡种小麦6000亩,其中平原3600亩,丘陵2400亩,现采用等比例类型抽样抽查了100亩,资料如表
13、,试在95.45%的概率保证程度下估计该乡粮食亩产量的范围。解:概率保证程度为95.45%时,对应的概率度t=1.64,则抽样极限误差为:总平均亩产的估计值为:即小麦亩产量的估计值在259.39公斤276.61公斤之间。,三、等距抽样1.概念:等距抽样又称机械抽样,它先将总体单位按一定标志排列起来,而后按固定顺序和一定距离来抽取样本单位的抽样方式。2.分类 A 根据排队依据的标志不同,分为无关标志排队和有关标志排队。B 按样本单位抽选的方法不同,分为随机起点等距抽样、半距起点等距抽样和对称等距抽样。3.抽样平均误差计算 如果总体是按无关标志排队,抽样平均误差可采用简单随机不重复抽样公式去近似计
14、算;如果总体是按有关标志排队,则可用等比例类型抽样的公式去近似计算。,四、整群抽样1.概念:整群抽样是将总体划分成由总体单位所组成的若干群,然后以群作为抽样单位,从中随机抽取一些群,对中选群内的所有单位进行全面调查的抽样方式。2.特点:组织工作比较方便,但抽样误差较大,代表性较低。3.抽样平均误差的计算整群抽样均采用不重复抽样抽样平均数的抽样误差:抽样成数的抽样误差:,第四节 样本容量的确定一、影响样本容量的因素1.总体标志的变异程度2.允许误差3.概率保证程度4.抽样的方法和方式二、简单随机抽样的样本公式 估计总体平均数时 估计总体成数时重复抽样不重复抽样,三、确定必要样本容量时应注意的问题
15、1在实际的抽样调查时,可先进行小规模的试验调查求得样本的方差和成数来代替总体的方差和成数,也可用历史的资料来代替2利用公式计算的样本容量不一定是整数,如果带有小数,则用“只入不舍”的原则。3如果进行抽样调查时,同时要对总体平均数和总体成数进行样本容量估计,选择较大者为样本容量。4在对总体成数进行推断前,如果计算样本容量时缺少成数的资料,则可以直接假定成数P为0.5,这样P(1-P)等于0.25为是非标志方差的最大值,这样可以保证抽样估计的精确度。5公式中的样本容量是最低的,也是最必要的样本容量。,四、总量指标的推算目的:用抽样指标去推断全及指标(一)直接推算法 直接换算法是用样本指标值或者总体
16、指标(总体平均数或者总体成数)的区间估计值乘以总体单位数来推算总量指标的方法。例:某地在10万户居民中随机抽选500户居民,经调查有90%的居民家中拥有两台以上的彩电。试以95.45%的概率保证程度推断,该地区有多少户居民拥有两台以上的彩电?解:已知,则由,可得 该地有两台以上彩电的用户数在87320户到92680户之间,(二)修正系数法 修正系数法是先将抽样调查资料与全面调查资料对比计算差错比率,即修正系数,然后用差错比率修正全面调查结果。步骤:1.计算差所比率 2.用差错比率修正全面调查结果,例8.10 某市人口普查结束后,过了一个月后又对某区进行抽样复测。已知,该市普查时的人口数为2005600人,所抽中的地区其普查时的人口数为120253人,一个月后抽样复测时,其人口数为120290人。如果在这一个月中,该区出生人数为68人,死亡人数为56人,试计算该市普查的人数。解:先把某区的人口数还原到普查时点的人数:120290-68+56=120278(人)修正后的该市人口数=2005600(1+0.02%)=2006001(人)所以,该市的普查人数为2006001人。,本章结束,