《05抽样分布与参数估计a.ppt》由会员分享,可在线阅读,更多相关《05抽样分布与参数估计a.ppt(46页珍藏版)》请在三一办公上搜索。
1、抽样分布与参数估计,第五章,-w y l-,内容:,第一节 抽样的基本概念第二节 抽样分布第三节 参数估计第四节 样本容量的确定,抽样的基本概念,第一节,一、抽样推断,(一)概念从被研究现象的总体中按照随机原则抽取一部分单位进行调查,并依据调查结果对全部研究对象的数量特征作出具有一定可靠程度的估计,以达到对全部研究对象认识的一种统计方法。,二、抽样推断的有关概念,(一)总体和样本1、总体(N)所要认识对象的全体。有限总体 和 无限总体 2、样本(n)所抽取的一部分单位。(1)大样本(n30)(2)小样本(n30),(二)样本容量与样本个数,1.样本容量是一个样本中所包含的单位数。2.样本个数即
2、样本可能数目。是指从一个总体中可能抽取多少个样本。与抽样方法有关。,(三)抽样方法,1、重复抽样从总体的N 个单位中要随机抽取一个容量为n的样本,每次从总体中抽出一个单位后,经过调查又把它放回到总体中,重新再参加下一次抽选。2、不重复抽样就是每抽出一个单位后,就不再放回总体中去参加以后的抽取。实际上不重复抽样就等于一次同时从总体中抽取n个单位。,(四)总体参数和样本统计量,1、总体参数:用来描述总体特征的指标2、样本统计量:描述样本特征的指标总体参数是一个常数,而样本统计量是一个随机变量3、参数估计概念,(五)抽样框,是有关总体全部单位的名录,是实施抽样的基础名称抽样框区域抽样框时间表抽样框,
3、理想抽样框应该与目标总体一致,包含全部总体单位。,二、抽样组织形式,随机抽样简单随机抽样类型抽样等距抽样整群抽样阶段抽样,非随机抽样任意抽样技术判断抽样技术配额抽样技术固定样本连续调查法,1.简单随机抽样,概念:又称纯随机抽样。它是不对总体作任何加工整理,直接从总体中随机抽取调查单位的抽样调查方法。简单随机抽样是最常用的纯随机抽样。方法:抽签法随机数表法,2、类型抽样(分层抽样、分类抽样),(1)概念:将总体全部单位按某个标志分成若干个类型组,然后从各类型组中采用简单随机抽样方式或其它方式抽取样本单位。(2)样本单位数在各类型组中的分配方式等额分配:在各类型组中分配同等单位数。等比例分配:按各
4、类型组在总体中所占比例分配样本单位数。即:最优分配:按各类型组的规模大小和差异程度,确定各类型组的样本单位数。,3、等距抽样(系统抽样、机械抽样),概念:将总体各单位标志值按某一标志顺序排队,然而按一定的间隔抽取样本单位。排队的方法:按无关标志 按有关标志抽取样本单位的方法按相等的距离取样 对称等距取样抽取第一个样本单位的方法随机抽取 居中抽取,4、整群抽样,概念:把总体分为若干群,从总体群中抽取若干样本群,对抽中的群进行全数登记调查。如:某水泥厂一昼夜的产量为14400袋,现每隔144分钟抽取1分钟的水泥(10袋)检查平均每袋重量和一级品率,5、阶段抽样,概念:抽样时,先抽总体中较大范围的单
5、位,再从中选的较大范围的单位中抽取较小范围的单位,依此类推,最后得到样本的基本单位。例:某地区有300户居民,分成10群,现从10群中抽6群,再从抽中的群中每群抽2户调查其平均收入,三、大数定理和中心极限定理,1.大数定理当n充分大时,样本平均与总体平均之间的误差可有很大的把握被控制在任意给定的范围内2.正态分布的再生定理、若变量服从正态分布(,),从中抽出容量为n的样本,则样本平均数也服从正态分布(,)。3、中心极限定理,第二节,抽样分布,一、三种分布含义,总体分布:样本分布抽样分布,总体中各单位取值形成的分布。往往未知样本各单位取值形成的分布。能反映总体分布,特别当n较大时,就接近总体分布
6、所有可能的样本,其样本统计量的具体数值表现出的分布。是进行参数估计的基础。,二、样本统计量的抽样分布,假设有一个由4位同学组成的总体,4位同学某次考试的成绩分别为60、70、80、90分,计算总体均值、方差或标准差。若从总体中随机抽取2位同学作为样本,计算所有可能样本的均值计算样本均值的数学期望、方差或标准差,(一)样本平均数的抽样分布1.样本平均数的期望值与方差重复抽样下:样本平均数的期望值:样本平均数的标准差:不重复抽样下:样本平均数的期望值:样本平均数的标准差:,2.样本平均数的分布规律(1)若总体服从正态分布,则无论样本容量如何,样本均值服从正态分布;(2)若总体为非正态分布,样本为大
7、样本(n30),样本均值近似服从正态分布,样本统计量的抽样分布,(二)样本比例的抽样分布当样本容量足够大时(np 5),样本比例近似服从正态分布,其数学期望为总体比例P(三)样本方差的抽样分布若总体为正态分布,则随机抽取的样本方差的比值服从自由度为n-1的卡方分布。,第三节,参数估计,一、估计量的优良标准,无偏性估计量的数学期望等于被估计的总体参数,则该估计量为无偏估计量。有效性估计量的方差越小,则估计越有效。一致性随样本容量的增大,估计量的值越来越接近被估计总体的参数。,参数估计,二、参数估计的方法(一)点估计(二)区间估计 1、平均数的区间估计 2、成数的区间估计,三、总体均值的区间估计,
8、(一)总体方差已知样本平均数服从正态分布。其标准化后的样本统计量 服从标准正态分布。则有:做不等式的等价变换后得:抽样极限误差,样本平均数服从正态分布,但要用样本方差代替总体方差。此时其标准化后的样本统计量 服从自由度为n-1的t分布(大样本时可以正态分布近似处理)。则有:做不等式的等价变换后得:,(二)总体方差未知,四、总体比率的区间估计,大样本条件下,样本比率分布服从正态分布。总体比率的区间估计为:,五、总体方差的区间估计,若总体为正态分布,则随机抽取的样本方差的比值服从自由度为n-1的卡方分布。则有,在1-下:,某制造厂质量管理部门希望估计本厂生产的5500包原材料的平均重量,抽出250
9、包,测得平均重量65千克。总体标准差15千克。总体为正态分布,在置信水平为95%的条件下建立这种原材料平均重量的置信区间。,5500包原材料的平均重量在63.1466.86之间。,例1,例2:,为了估计一分钟广告的平均费用,抽出15个电视台组成样本,得样本均值10000元,标准差2000元。总体近似服从正态分布,在置信水平为95%的条件下建立广告平均费用的置信区间。,电视台一分钟广告的平均费用在889411106之间。,某职业介绍所从申请某一职业的1000名申请者中采用不重复抽样方式随机抽取了200名,以此来估计1000名的平均成绩。200名的平均分为78,由以往经验知总体方差90,不知总体服
10、从何种分布。在置信水平为90%的条件下建立1000名申请者平均成绩的置信区间。,样本取自总体方差已知的非正态分布,1000名申请者平均成绩在7779之间。,例3:,某企业在一项关于职工流动原因的研究中,从原职工中随机抽取了200人访问,有140人离开的原因是工资太低。以95%的置信水平对总体这种原因离开的人员比例进行区间估计。,所以由于工资低离开的职工比例为63.6%与76.4%之间,例4,对一批灯泡抽取1%进行质量检验,结果为平均寿命1010小时,抽样平均误差5.6小时;合格率92%,抽样平均误差2.4%。要求在95%的可靠程度下,对该批灯泡的平均寿命和合格率进行区间估计。,解:,p=92%
11、,例5,某公司生产一种健康食品,要求每罐食品的重量符合规定,不能有过大差异。设每罐食品重量符合正态分布。现抽查了10个样本,求得样本方差为9.2,试对总体方差进行置信度为0.90的置信区间。查表:,总体指标区间估计的两种情况,1、根据给定的置信度,推算抽样极限误差,对总体指标做区间估计;2、根据给定的抽样误差范围,求出概率保证程度。,例:,某服装厂为研究某新款服装的销路,在市场上对900名成年人进行调查,结果有540人喜欢该时装。并知抽样极限误差为0.03,请估计该市成年人喜欢该时装的比率。,查概率表,F=0.9342有0.9342的概率说明此比率在0.5733-0.6267之间,影响抽样误差
12、的因素,样本容量,抽样方式,总体内部差异,(三)影响抽样误差的因素,抽样组织形式,第四节,样本容量的确定,一、抽样单位数目的计算,简单随机抽样(1)平均数(2)成数,例,某类产品根据以往资料的估计,总体方差5.456千克,该类产品的一等品率为90%,现对一批进行简单随机抽样以推断该批产品的平均重量和一等品率,要求可靠程度达到99.73%,平均重量的误差范围不超过0.9千克,一等品率的误差范围不超过5%,需要抽多少样本单位?,解:,平均数的必要抽样单位数:,成数的必要抽样单位数:,二、影响抽样单位数目的因素,(一)总体各单位的变异程度(二)抽样推断的准确程度(三)抽样推断的可靠程度(四)抽样的组织形式(五)抽样的方法,从某班学生中随机抽取10名同学,得到其统计学成绩,分别为:85 59 66 81 90 57 75 63 86 78要求:(1)以0.95的概率估计该班同学的统计学成绩.(2)以0.95的概率估计该班同学统计学成绩的方差.,作业:,从某厂生产的5000只灯泡中,随机不重复抽取100只,调查其使用寿命,结果如表。该厂规定使用寿命在3000小时以下为不合格品。,要求:以95%的把握估计该批灯泡的平均使用寿命和合格品率.,