《《抽样推断二》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《抽样推断二》PPT课件.ppt(45页珍藏版)》请在三一办公上搜索。
1、1,抽样推断(二),参数估计,2,学习要求,理解抽样误差的概念掌握抽样平均误差和抽样极限误差的含义并能运算可以进行参数估计(平均数、成数),3,抽样误差,一、抽样误差的概念二、抽样平均误差三、影响抽样平均误差的因素四、抽样极限误差,4,抽样误差的概念,抽样误差是样本指标和总体指标之间数量上的差别。以数学符号表示:,5,理解抽样误差可以从两方面着手:,抽样误差是指由于抽样的随机性而产生的那一部分代表性误差,不包括登记性误差。也不包括可能发生的偏差。,6,误差,登记性误差,代表性误差,在调查过程中由于主客观原因引起的登记、汇总或计算等方面的差错而造成的误差,由于样本结构和总体结构不同,样本总体不能
2、完全代表总体而产成的样本指标与总体指标的误差,偏差,随机误差,破坏了抽样的随机原则而产生的误差,实际误差,抽样平均误差,是样本指标与总体指标的差别,所有可能出现的样本指标的标准差,遵守随机原则但可能抽到各种不同的样本而产生的误差,7,主要样本统计量,平均数比率(成数)方差,8,抽样平均误差是反映抽样误差一般水平的指标,其实质是指抽样平均数的标准差,它反映了是指样本指标与总体指标的平均离差程度,也就是样本指标与总体指标的标准差,通常用 来表示。,抽样平均误差,9,可以作为衡量样本指标对于全及指标代表性程度的一个尺度。是计算样本指标与全及指标之间变异范围的一个根据。在组织抽样调查中,也是确定抽样单
3、位数多少的计算依据之一。,10,影响抽样平均误差的因素,1.总体各单位标志值的差异程度;2.样本的单位数;3.抽样的方法;4.抽样调查的组织形式。,差异越大,抽样误差越大,单位数越多,抽样误差越小,重复抽样的抽样误差比不重复抽样的大,11,1.重复抽样的条件下,式中,n为样本容量;为总体标准差。一般情况下是未知,可用样本标准差替代。,12,式中,n为样本容量;为总体成数标准差,一般情况下是未知,可用样本成数标准差替代。.,13,2.不重复抽样的条件下,式中,N为总体单位数;n为样本容量;X2 为总体方差。一般情况下是未知,可用样本方差替代x 2。,式中,N为总体单位数;n为样本容量;P2 为总
4、体成数的方差。一般情况下是未知,可用样本成数方差替代p2。,14,抽样平均数的平均误差例题:,某工厂有1500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其工资水平资料如下,计算样本平均数和抽样平均误差。,15,解:先列表,16,计算平均数即平均工资:,17,抽样成数的平均误差例题:,某钢铁厂生产某种钢管,现从该厂某月生产的500根产品中抽取一个容量为100根的样本。已知一级品率为60%,试求样本一级品率的抽样平均误差。,解:已知p=60%、n=100、N=500,18,练习:要估计某高校10000名在校生的近视率,现随机从中抽取400名,检查有近视眼的学生320名,试计算样本
5、近视率的抽样平均误差。解:根据已知条件:,1)在重复抽样条件下,样本近视率的抽样平均误差:,19,2)在不重复抽样条件下,样本近视率的抽样平均误差:,计算结果表明,用样本的近视率来估计总体的近视率其抽样平均误差为2左右(即用样本的近视率来估计总体的近视率其误差的绝对值平均说来在2左右)。,20,抽样极限误差,抽样极限误差是指用绝对值形式表示的样本指标与总体指标偏差可允许的最大范围。即:或,max,max,21,上面两式可改写成以下两个不等式,即:,为总体平均数的估计区间(置信区间),为总体成数的估计区间(置信区间),22,例:要估计某乡粮食亩产量和总产量,从该乡2万亩粮食作物中抽取400亩,求
6、得其平均亩产量为400公斤。如果确定抽样极限误差为5公斤,试估计该乡粮食亩产量和总产量所在的置信区间。,23,即该乡粮食亩产量的区间落在4005公斤的范围内,即在395405公斤之间。粮食总产量在20000(4005)公斤,即在790810万公斤之间,24,例:要估计某高校10000名在校生的近视率,现随机从中抽取400名,计算的近视率为80,如果确定允许误差范围为4,试估计该高校在校生近视率所在的置信区间。该校学生近视率的区间落在804的范围内,即在7684之间。,25,抽样误差的概率度,基于概率估计要求,抽样极限误差x或p 通常需要以抽样平均误差x或p为标准单位来衡量。把抽样极限误差x或p
7、分别除以x或p得相对数t,表示误差范围为抽样平均误差的t倍。t是测量抽样估计可靠程度的一个参数,称为抽样误差的概率度。,26,即,抽样极限误差是抽样平均误差的多少倍。我们把倍数t称为抽样误差的概率度,27,抽样估计的置信度,抽样估计的置信度就是表明样本指标与总体指标的误差不超过一定范围的概率保证程度,它一般用F(t)表示。又称抽样估计的概率保证程度。,28,置信度与概率度的之间关系:,可以通过正态分布概率表获得,29,1、总体平均数抽样估计的置信度,2、总体成数抽样估计的置信度,30,参数估计,一、总体参数的点估计二、总体参数的区间估计,31,总体参数的点估计,(一)参数点估计的基本特点(二)
8、抽样估计的优良标准,32,(一)参数点估计的基本特点,基本特点:根据总体指标的结构形式设计样本指标作为总体参数的估计量,并以样本指标的实际值直接作为相应总体参数的估计值。例如,样本平均值代表总体平均数;以抽样调查所获得的人口结构代表总体的人口结构等。,33,(二)抽样估计的优良标准,无偏性 作为总体参数估计量的样本统计量,要求其期望值(平均数)等于被估计的总体参数。这样的估计量称为无偏估计量。有效性 以抽样指标估计总体指标要求作为优良估计量的方差应比其它估计量的方差小。一致性 作为优良估计量的样本容量充分大时,抽样指标也应充分地靠近总体指标。,即方差越小的估计量就越有效,一般情况下均可满足,3
9、4,总体参数的区间估计,(一)区间估计的基本特点及要素(二)总体平均数(成数)的区间估计,35,(一)区间估计的基本特点及要素,区间估计的基本特点 根据给定的概率保证度,利用实际抽样资料,指出总体参数可能存在的区间范围。这个区间称为置信区间。区间估计必须具备的三个要素(1)估计值(2)抽样误差范围(3)概率保证程度,36,(二)总体平均数(成数)的区间估计,表达式,其中,为极限误差,成数,其中,为极限误差,37,(二)总体平均数(成数)的区间估计,1.计算抽样平均数和标准差:,或抽样成数平均数和成数标准差:,简单随机抽样下的一般步骤,2.计算平均误差:,5.结果,3.计算极限误差:,4.计算区
10、间的上下限:,如:可以在1-的概率保证程度下,估计*在*之间。,如果给定的是概率度,则可查正态分布概率表获得。,这是上面所计算的上下限,38,练习:某制造厂的产品重量服从正态分布,其总体标准差15千克,平均重量未知。现随机抽取一个n=250的样本,计算结果是 65千克。以95的置信度估计总体平均重量的置信区间。解:本题已知条件为:样本容量n=250,XN(65,15);置信水平为95;查正态概率双侧临界值表有:t=1.96,39,x=tx=1.960.9487=1.86则,651.86,65+1.86,即95%的估计区间为:63.14,66.86,计算结果说明,我们有95的把握程度认为总体平均
11、数介于63.14千克到66.86千克之间。,40,从某厂生产的5000只灯泡中,随机重复抽取100只,对其使用寿命进行调查,调查结果如表,41,又该厂质量规定使用寿命在3000小时以下为不合格品。(1)按重复抽样方法,以95.45%的概率保证程度估计该批灯泡的平均使用寿命;(2)按重复抽样方法,以68.27%的置信度估计该批灯泡的合格率。,42,练习2:对某批成品按重复抽样方法抽选200件检查,其中废品8件,以95的把握程度估计该批成品的废品率范围。,43,必要抽样数目的确定,确定适当样本容量的意义,1.在一定的误差允许下,样本容量太大,则会增大工作量,造成人力、财力和时间的浪费。,2.如查改变了对误差的要求,则可以通过增减样本容量来控制抽样误差的大小。,44,样本容量的确定,由于,45,判断,1.抽样误差的产生是由于破坏了随机原则所造成的。()2.在其他条件不变的情况下,抽样平均误差要减少为原来的1/3,则样本容量必须增大到9倍。()3.样本指标是一个客观存在的常数。()4.抽样平均误差就是总体指标的标准差。()5.同样条件下,重复抽样误差一定大于不重复抽样误差。(),