《人教版高中数学必修3 21随机抽样_图文.ppt》由会员分享,可在线阅读,更多相关《人教版高中数学必修3 21随机抽样_图文.ppt(108页珍藏版)》请在三一办公上搜索。
1、2.1 随机抽样,2.1.1 简单随机抽样,2.1.2 系统抽样,2.1.3 分层抽样,2.1 随机抽样,2.1.1 简单随机抽样,问题提出,生活中的很多问题,必须收集相关数据.你知道这些数据是怎么来的吗?,这些数据常常是通过调查而获得的.,首先,我们通常只考察总体中的一个样本,通过样本来了解总体的情况.,进一步,从节约费用的角度考虑,在保证样本估计总体达到一定精度的前提下,样本中包含的个体数越少越好.,所以,如何从总体中抽取具有代表性的样本,是我们需要研究的课题.,要解决的问题:,怎样从总体中抽取样本?,如何表示样本数据?,如何从样本数据中提取基本信息,推断总体的情况呢?,从节约费用等方面考
2、虑,一般是从总体中收集部分个体的数据来得出结论,就是要通过样本去推断总体.,首先,必须清楚知道要收集的数据是什么.,其次,收集的样本数据应该能够很好地反映总体.,再次,要知道如何才能收集到高质量的样本数据.,考虑:要判断一锅汤的味道需要把整锅汤都喝完吗?应该怎样判断?,将锅里的汤“搅拌均匀”,品尝一小勺就知道汤的味道,这是一个简单随机抽样问题,对这种抽样方法,我们从理论上作些分析.,总之,为了使样本具有好的代表性,设计抽样方法时,最重要的是要将总体“搅拌均匀”,使每个个体有同样的机会被抽中.,在1936年美国总统选举前,一份颇有名气的杂志的工作人员对兰顿和罗斯福两位候选人做了一次民意测验.调查
3、者通过电话簿和车辆登记簿上的名单给一大批人发了调查表.调查结果表明,兰顿当选的可能性大(57%),但实际选举结果正好相反,最后罗斯福当选(62%).你认为预测结果出错的原因是什么?,一个著名的案例,方便样本,问题:食品卫生工作人员,要对校园食品店的一批小包装饼干进行卫生达标检验,你准备怎样做?,从中抽取一定数量的饼干作为检验的样本.,其抽样方法是,将这批小包装饼干放在一个不透明的袋中搅拌均匀,然后逐个不放回抽取若干包.,这种抽样方法就是简单随机抽样.,简单随机抽样的含义如何?,一般地,设一个总体有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会
4、都相等,则这种抽样方法叫做简单随机抽样.,简单随机抽样的含义:,简单随机抽样,思考1:从6件产品中任意抽取一件,则每一件产品被抽到的概率是多少?一般地,从N个个体中任意抽取一个,则每一个个体被抽到的概率是多少?,思考2:从6件产品中随机抽取一个容量为3的样本,每次从中随机抽取一件,抽取的产品不放回,这叫做逐个不放回抽取.在这个抽样中,某一件产品被抽到的概率是多少?,思考3:一般地,从N个个体中随机抽取n个个体作为样本,则每一个个体被抽到的概率是多少?,问题:简单随机抽样有哪些主要特点?,(4)是一种不放回的抽样;,(3)随机样本是从总体中逐个抽取的;,(2)样本数n小于等于样本总体的个数N;,
5、(1)被抽取的样本的总体个数N是有限的;,简单随机抽样主要特点:,(5)每个个体被抽到的机会都相等,抽样具有公平性.,下列抽样的方式是否属于简单随机抽样?为什么?,(1)从无限多个个体中抽取50个个体作为样本.,(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子.,例1:假设要在我们班选派8个人去参加某项活动,为了体现选派的公平性,你有什么办法确定具体人选?,抽签法(抓阄法)是我们熟悉的方法,具体如何操作?,用小纸条把每个同学的学号写下来放在袋子里,并搅拌均匀,然后随机从中逐个抽出8个学号,被抽到学号的同学即为参加活动
6、的人选.,一般地,抽签法的操作步骤如何?,第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.,第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.,第二步,将号签放在一个容器中,并搅拌均匀.,总结抽签法的优点和缺点:,缺点:当总体个数较多时不方便,而且产生的样本代表性差的可能性很大.,优点:简单易行,个体有均等的机会被抽中,从而能保证样本的代表性.,从0,1,2,9十个数中每次随机抽取一个数,依次排列成一个数表称为随机数表(见教材P103-105页),每个数每次被抽取的概率是多少?,例2:假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋
7、牛奶中抽取60袋进行检验,可以怎样操作?,随机抽样中,另一个常被采用的方法是随机数法.即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.,随机数表由数字0,1,2,9组成,并且每个数字在表中各个位置出现的机会都是一样的.,第一步,将800袋牛奶编号为000,001,002,799.,第三步,从选定的数7开始依次向右读(读数的方向也可以是向左、向上、向下等),将编号范围内的数取出,编号范围外的数去掉,直到取满60个号码为止,就得到一个容量为60的样本.,第二步,在随机数表中任选一个数作为起始数(例如选出第8行第7列的数7).,练习1:如果从100个个体中抽取一个容量为10的样本,对这100
8、个个体进行编号.,练习2:一般地,利用随机数表法从含有N个个体的总体中抽取一个容量为n的样本,其抽样步骤如何?,第一步,将总体中的所有个体编号.,第二步,在随机数表中任选一个数作为起始数.,第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.,练习3:为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,试利用简单随机抽样法抽取样本,并简述其抽样过程.,方法一:抽签法;,方法二:随机数表法.,练习4:利用随机数表法从450名学生中抽出50人参加活动.(1)这450名学生可以怎样编号?(2)如果从
9、随机数表第10行第8列的数开始往左读数,则最先抽取的5人的编号依次是什么?,1、简单随机抽样包括抽签法和随机数表法,它们都是等概率抽样,从而保证了抽样的公平性.,2、简单随机抽样有操作简便易行的优点,在总体个数较小的情况下是行之有效的抽样方法.,小结,3、简单随机抽样每个个体入样的可能性都相等,均为n/N,但是这里一定要将每个个体入样的可能性、第n次每个个体入样的可能性、特定的个体在第n次被抽到的可能性这三种情况区分开来,避免在解题中出现错误.,布置作业:P57练习:1,3,4.,2.1.2 系统抽样,复习,1、简单随机抽样有哪些常用方法?,2、它们的操作步骤分别如何?,抽签法,随机数法,第二
10、步,将号签放在一个容器中,并搅拌均匀.,抽签法:,第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.,第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.,第一步,将总体中的所有个体编号.,第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.,第二步,在随机数表中任选一个数作为起始数.,随机数表法:,探究:某中学为了了解高一年级学生对教师教学的意见,教务处打算从高一年级500名学生中抽取50名进行问卷调查,请你设计抽取样本的方法,具体如何操作?,你还能设计其它的抽样方
11、法吗?具体如何操作?,第二步,将总体平均分成50部分,每一部分含10个个体.,第四步,从该号码起,每隔10个号码取一个号码,就得到一个容量为50的样本.(如8,18,28,498),第三步,在第1部分中用简单随机抽样抽取一个号码(如8号).,第一步,将这500名学生编号为1,2,3,500.,上述抽样方法称为系统抽样.,将总体分成均衡的n个部分,再按照预先定出的规则,从每一部分中抽取1个个体,即得到容量为n的样本.,怎样理解系统抽样的含义?,用系统抽样从含有N个个体的总体中抽取一个容量为n的样本的操作步骤:,第四步,按照一定的规则抽取样本.,第一步,将总体的N个个体编号.有时可以直接利用个体自
12、身所带的号码,如学号等.,第三步,在第1段用简单随机抽样确定起始个体编号l.,第二步,确定分段间隔k,对编号进行分段.当N/n是整数时,取k=N/n.,探究:如果用系统抽样从605件产品中抽取60件进行质量检查,由于605件产品不能均衡分成60部分,对此应如何处理?,先从总体中随机剔除5个个体,再均衡分成60部分.,推广:如果N不能被n整除怎么办?,从总体中随机剔除N除以n的余数个个体后再分段.,探究:用系统抽样从含有N个个体的总体中抽取一个容量为n的样本,要平均分成多少段,每段各有多少个号码?,将含有N个个体的总体平均分成n段,每段的号码个数称为分段间隔.,用简单随机抽样抽取第1段的个体编号
13、.以后各段的个体编号,通常是将第1段抽取的号码依次累加间隔k.,探究:用系统抽样抽取样本时,每段各取一个号码,其中第1段的个体编号怎样抽取?以后各段的个体编号怎样抽取?,讨论:系统抽样适合在哪种情况下使用?与简单随机抽样比较,哪种抽样方法使样本更具有代表性?,总体中个体数比较多;系统抽样更使样本具有代表性.,练习1:某校共有118名老师,为了支持西部的教育事业,现要从中随机抽取16名老师到西部任教,用系统抽样选取支援西部的教师团合适吗?应该怎样抽样?,“现代研究证明,99%以上的人皮肤感染有螨虫.”,“某化妆品,可以彻底清除脸部皱纹,只需10天,就能让你的肌肤得到改善.”,“某减肥药真的灵,其
14、减肥的有效率为75%.”,练习2:在数字化时代,各种各样的统计数字和图表充斥着媒体,由于数字给人的印象直观、具体,所以让数据说话是许多广告的常用手法.下列广告中的数据可靠吗?,练习3:某中学有高一学生323名,为了了解学生的身体状况,要抽取一个容量为40的样本,用系统抽样法如何抽样?,第一步,随机剔除3名学生,把余下的320名学生编号为1,2,3,320.,第四步,从该号码起,每间隔8个号码抽取1个号码,就可得到一个容量为40的样本.,第三步,在第1部分用抽签法确定起始编号.,第二步,把总体分成40个部分,每个部分有8个个体.,练习4:一个总体中有100个个体,随机编号为0,1,2,99,依编
15、号顺序平均分成10组,组号依次为1,2,3,10,现用系统抽样抽取一个容量为10的样本,并规定:如果在第一组随机抽取的号码为m,那么在第k(k=2,3,10)组中抽取的号码的个位数字与m+k的个位数字相同.若m=6,求该样本的全部号码.,6,18,29,30,41,52,63,74,85,96.,2、系统抽样适合于总体的个体数较多的情形.,小结,1、系统抽样也是等概率抽样,即每个个体被抽到的概率是相等的,从而保证了抽样的公平性.,3、系统抽样的步骤为:,(1)采用随机的方法将总体中个体编号;,(2)将整体编号进行分段,确定分段间隔k(kN);,(3)在第一段内采用简单随机抽样的方法确定起始个体
16、编号L;,(4)按照事先预定的规则抽取样本.,4、在确定分段间隔k时应注意:分段间隔k为整数,当 不是整数时,应采用等可能剔除的方法剔除部分个体,以获得整数间隔k.,布置作业P59练习:1,2,3.P64习题2.1A组:3.,2.1.3 分层抽样,复习,1、我们学了哪些常用的收集相关数据的方法?,抽签法,随机数法,2、简单随机抽样有哪些常用方法?,简单随机抽样,系统抽样,3、系统抽样的基本含义如何?,将总体分成均衡的n个部分,再按照预先定出的规则,从每一部分中抽取1个个体,即得到容量为n的样本.,第二步,确定分段间隔k,对编号进行分段.,第四步,按照一定的规则抽取样本.,第三步,在第1段用简单
17、随机抽样确定起始个体编号l.,第一步,将总体的所有个体编号.,4、系统抽样的操作步骤是什么?,探究:某地区有高中生2400人,初中生10900人,小学生11000人.当地教育部门为了了解本地区中小学生的近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?,设计科学、合理的抽样方法,其核心问题是保证抽样公平,并且样本具有好的代表性.影响学生视力的因素是很复杂的,例如,不同年龄段的学生的近视情况可能存在明显差异.故用简单随机抽样或系统抽样,都可能使样本不具有好的代表性.对于此类抽样问题,我们需要一个更好的抽样方法来解决.,探究:某地区有高中生2400人,初中
18、生10900人,小学生11000人.当地教育部门为了了解本地区中小学生的近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?,样本容量与总体个数的比例为1:100,则,高中应抽取人数为2400*1/100=24人,初中应抽取人数为10900*1/100=109人,,小学应抽取人数为11000*1/100=110人.,问题2:具体在三类学生中抽取样本时(如在10800名初中生中抽取108人),可以用哪种抽样方法进行抽样?,问题3:在上述抽样过程中,每个学生被抽到的概率相等吗?,问题1:在此,总体的个体数为24300,抽取1%的学生,样本容量为243,具体每
19、个层次抽取的个体数是如何计算的?,上述抽样方法从学生人数这个角度来看,获得的样本结构与这一地区全体中小学生的结构是基本相同的.不仅保证了抽样的公平性,而且抽取的样本具有较好的代表性,从而是一种科学、合理的抽样方法,这种抽样方法称为分层抽样.,一般地,若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本,这种抽样的方法是一种分层抽样.,高中生8人,初中生36人,小学生37人.,练习:某地区有高中生2400人,初中生10900人,小学生11000人.若用分层抽样从该地区抽取81名学生调查身体发育状况,
20、那么高中生、初中生和小学生应分别抽取多少人?,练习:某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本.,思考1:该项调查应采用哪种抽样方法进行?,思考3:在各血型具体如何抽样?,思考2:按比例,各血型分别抽取多少人?,讨论:一般地,分层抽样的操作步骤如何?,第一步,计算样本容量与总体的个体数之比.,第四步,将各层抽取的个体合在一起,就得到所取样本.,第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体.,第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数.,调节样本容量
21、,剔除个体.,讨论:样本容量与总体的个体数之比是分层抽样的比例常数,按这个比例可以确定各层应抽取的个体数,如果各层应抽取的个体数不都是整数该如何处理?,讨论:简单随机抽样、系统抽样和分层抽样既有其共性,又有其个性,请你对三种抽样方法作一个比较.,共同特点:抽样过程中每个个体被抽取的概率相等.,将总体分成均衡几部分,按规则关联抽取,将总体分成几层,按比例分层抽取.,用简单随机抽样抽取起始号码,总体中的个体数较少,总体中的个体数较多,总体由差异明显的几部分组成.,从总体中逐个不放回抽取,用简单随机抽样或系统抽样对各层抽样.,简单随机抽样:,系统抽样:,分层抽样:,请根据上述基本数据,设计一个样本容
22、量为总体中个体数量的千分之一的抽样方案.,探究:某地区中小学生人数的分布情况如下表所示(单位:人):,探究:某地区中小学生人数的分布情况如下表所示(单位:人):,提醒:由于总体的复杂性,在实际抽样中,为了使样本具有代表性,通常要同时使用几种抽样方法.,1、可以先用分层抽样法确定此地区城市、县镇、农村的被抽个体数.,2、再用分层抽样法将城市的被抽个体数分配到小学、初中、高中等不同阶层中去,县镇、农村的被抽个体数的分配法也一样.,3、接着将城市划分为学生数大致相当的小区,用简单随机抽样法选取一些小区,再用简单随机抽样法确定每一小区中的各类学校.,4、在选中的学校中用系统抽样法或简单随机抽样选取学生
23、进行调查.,练习:分小组设计一个你想了解的问题,交换讨论收集数据的方案.,小结,2、分层抽样是按比例分别对各层进行抽样,再将各个子样本合并在一起构成所需样本.,1、分层抽样利用了调查者对调查对象(总体)事先掌握的各种信息,考虑了保持样本结构与总体结构的一致性,提高样本的代表性,在实际中广泛应用.,3、简单随机抽样是基础,系统抽样与分层抽样是补充和发展,很多时候要同时采用这几种抽样方法.,布置作业P64习题2.1A组:5,6.,第二章 统计,怎样调查?是对考察对象进行全面调查吗?,产品的合格率、农作物的产量、商品的销售量、当地的气温、自然资源、就业状况、电视台的收视率,你知道这些数据是怎么来的呢
24、?,调查,考察若带有破坏性呢?,考察总体中的一个样本,通过样本来了解总体情况。,从节约费用的角度考虑在保证样本达到一定精度的前提下,样本中包含的个体数越少越好。,如何设计抽样方法,使之能够真正代表总体,是关键问题,否则,对总体的判断就会出现错误。,食品、饮料中的细菌是否超标?,每天,城市里的垃圾有多少被回收了?,影响学生视力状况的主要原因有哪些?,同学们的作息时间是如何安排的?,电视台的某个栏目的收视率是多少?,某厂产品的合格率是多少?,以某批袋装牛奶为实例,思考:哪些量可以用来刻画此批牛奶的质量是否合格?,下面的变量都可以作为衡量产品质量是否合格的指标:袋装牛奶的细菌含量;袋装牛奶的重量;袋
25、装牛奶的蛋白质含量;袋装牛奶的脂肪含量;袋装牛奶的钙含量,要了解“一批袋装牛奶的细菌含量”,可以对牛奶进行普查或抽样调查,采用哪种方式更合理?,普查方法的优点:,在普查过程中不出错的情况下,可以得到这批牛奶的真实细菌含量。,我们的目的是想要判断这批牛奶是否可以出售,而普查使得这批袋装牛奶都被开封,不能再出售了,失出了调查的意义。,普查方法的缺点:,费时费力,劳民伤材。,普查的工作量大,操作的过程中发生失误的可能性就大大增加,因此不一定能保证结论的准确性。,例如:在食品质量检验中,为了了解某批袋装牛奶(总体)的细菌超标情况,从中随机地抽取了n袋,并测出了每一袋的细菌含量ai(i=1,2,n)。这
26、里ai(i=1,2,n)就是我们要收集的数据。,在这一问题中,个体是什么?总体又是什么?,个体是:一袋袋装牛奶的细菌含量,总体是:整批袋装牛奶的细菌含量,统计问题而解决它的关键是要首先要明确问题中的总体。,采用抽样调查的方法来判断整批牛奶的质量,就能省时,省力,且容易操作;缺点是估计结果存在误差,但是我们可以通过科学的方法使得误差尽可能小。,用样本估计总体的必要性。,为什么说一个好的抽样调查胜过一次憋脚的普查?,如何通过一小勺汤来正确判断一锅汤的味道?,搅拌均匀后的汤,任取一勺都具有代表性。,要收集到高质量的样本数据,就要求样本有代表性,最重要的就是把总体搅拌均匀,使得每个个体都有相同的机会被
27、抽到。,如何设计抽样方法,使之能够真正代表总体,是关键问题,否则,对总体的判断就会出现错误。,一个著名的案例,在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意测验。调查兰顿(当时任堪萨斯州州长)和罗斯福(当时的总统)中谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(注意1936年电话中汽车只有少数富人拥有)。通过分析收回的调查表,显示兰顿非常受欢迎,于是此杂志预测兰顿将在选举中获胜。,你认为预测结果出错的原因是什么?,失败的原因:抽样方法不正确。样本不是从总休(全体美国公民)中随机地抽取。1963年,美国有私人电话和汽车的家庭
28、,都是比较富裕的家庭,19291933年的世界经济危机,使美国经济遭到沉重打击,“罗斯福新政”动用行政手段干预市场经济,损害了部分富人的利益,“喝了富人的血”,但广大的美国人民从中得到了好处,所以,从这部分人中抽取的样本严重偏离了总体,导致样本不具有代表性。,简单随机抽样,统 计,调 查,普 查,抽样调查,抽样的重要性和用样本估计总体的必要性,假设你作为一名食品卫生工作人员,要对某食品店里的一批小包饼干进行卫生达标检验。你准备怎样做?,是否可以采用普查的方法来回答食品卫生是否达标?,检查的目的是决定能否让这批小包装饼干出售,而普查的结果却使所有袋装饼干开封,从而不能出售,这与检查的目的相违背.
29、,总结:一般地,如果检验对个体具有破坏性,则需要通过抽样来推断总体的特性,而有很多检验是具有破坏性的,如产品的寿命、合格率等问题的检查。由此可见抽样的重要性和用样本估计总体的必要性。,显然,你只能从中抽取一定数量的饼干作为检验的样本。,针对具体问题,应当如何获取样本?.,设计抽样方法时,应在考虑样本代表性的前提下,努力抽样过程简便易行。.,将这批小包装饼干放入一个不透明的袋子里,搅拌均匀,然后不放回地摸取这样可以保证每一袋饼干被抽中的机会相等,这样我们就可以得到一个简单随机样本,相应的抽样方法就是简单随机抽样。,搅拌均匀,不放回一个个摸取,注意:抽样时不能只图个方便,选取“方便样本”(又如要判
30、断一袋米中的含沙量等)。得出与事实不相符的结论的可能性就会大大增加。,什么是简单随机抽样?,一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。,我们常用的(抽签法)抓阄法是不是简单随机抽样方法?为什么?,例如:班里要选派5名同学去参加一个座谈会,每名同学的机会都均等。具体如何操作?,准备60个号签分别标上学号,将号签放在一个容器中,搅拌均匀后,每次抽取一个号签,不放回地连续取5次。从而得到5个学号决定这些同学去参加。,一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放
31、在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。,一般地,抽签法细化为以下三步:(1)把总体中的N个个体编号。(2)把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,不放回连续抽取n次。(3)将取出n个的号签上的号码所对应的n个个体作为样本。,你认为抽签法有什么优点和缺点?当总体中的个体数很多时,用抽签法方便吗?,优点:抽签法简单易行,当总体中人个数不多时,抽签法能够保证每个个体入选样本的机会相等(得到的样本是简单随机抽样)。,缺点:(1)当总体中的个体较多时制作号签的成本将会增加,使得抽签法成本高(费时,费力)。(2)号签很多时
32、,把它们“搅拌均匀”就比较困难,结果很难保证每个个体入选样本的可能性相等,从而使产生坏样本(代表性差的样本)的可能性增加。,练习1:请你把抽样调查和普查做一个比较,并说一说抽样调查的好处和可能出现的问题。,抽样调查的好处是可以节省人力、物力和财力。可能出现的问题是推断的结果与实际情况之间有误差。如抽取的部分个体一能很好地代表总体,那么我们分析出的结果就会有偏差。,练习2.假设要从高一年级全体同学(450人)中随机抽出50人参加一项活动,请分别用抽签法和随机数表法抽出人选,写出抽取过程。,(1)抽签法:对高一年级全体学生450人进行编号,将学生的名字和对应的编号分别写在卡片上,并把450张卡片放
33、入一个容器中,搅拌均匀后,每次一放回地从中抽取一张卡片,连续抽取50次,就得到参加这项活动的50名学生的编号。,抽签法能够保证总体中任何个体都以相同的概率被选到样本之中,因此保证了样本的代表性。,练习3:你认为抽签法是如何保证样本的代表性的?,简单随机抽样,统 计,调 查,普 查,抽样调查,抽样的重要性和用样本估计总体的必要性,什么是简单随机抽样?,一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。,一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌
34、均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。,一般地,抽签法细化为以下三步:(1)把总体中的N个个体编号。(2)把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,不放回连续抽取n次。(3)将取出n个的号签上的号码所对应的n个个体作为样本。,(2)随机数法。,利用随机数表、随机表骰子或计算机产生的随机数进行抽样。,随机数表由数字0,1,2,9组成,并且每个数字在表中各个位置出现的机会都是一样的。,怎样利用随机数表产生样本呢?下面通过例子来说明。,例:假设我们要考察某公司生产的500克袋装牛奶的质量是否达标时,现从800袋牛奶抽取60袋进行检验。利
35、用随机数表抽取样本时,可以按照下面的步骤进行。,第一步,先将800袋牛奶编号,可以编为000,001,799。,第二步,在随机数表中任选一个数,例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行)。,16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50
36、71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 5457 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28,第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数789,由于789799,将它去掉,按照这种方法继续向右读,又取出567,199,507,依次下去,直到样本的60个号码全部取出,这样我们就得到一
37、个容量为60的样本。,当N=100时,分别以0,3,6,为起点对总体编号,再利用随机数表抽取10个号码。你能说出从0开始对总体编号的好处吗?,如果从0开始编号,那么用两位数字就可以了,因此可以节省从随机数表中查取随机数的时间。,?,练习2.假设要从高一年级全体同学(450人)中随机抽出50人参加一项活动,请分别用抽签法和随机数表法抽出人选,写出抽取过程。,(1)抽签法:对高一年级全体学生450人进行编号,将学生的名字和对应的编号分别写在卡片上,并把450张卡片放入一个容器中,搅拌均匀后,每次一放回地从中抽取一张卡片,连续抽取50次,就得到参加这项活动的50名学生的编号。,练习2.假设要从高一年
38、级全体同学(450人)中随机抽出50人参加一项活动,请分别用抽签法和随机数表法抽出人选,写出抽取过程。,(2)随机数表法:第一步,先将帅50名学生编号,可以编为000,001,449。每二步,在随机数表中任选一个数,例如选出第7行第5列的数1(为了便于说明,下面摘取了附表1的第610行),16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 6
39、3 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 5457 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28,第三步,从选定的数1开始向右读,得到一个三位数175,由于175450,将它去掉,按照这种方法继续向右读,依次下去,直到样本的50个号码全部取出,这样我们就得到一个容量
40、为50的样本。,4.你认为用随机数表法抽取样本有什么优点和缺点?,?,答:与抽签法相比,随机数表法抽取样本的主要优点是节省人力、物力、财力和时间,缺点是所产生的样本不是真正的简单样本。,简单随机抽样有操作简便易行的优点,在总体个数不多的情况下是行之有效的。但是,如果总体个数很多时,对个体编号的工作量太大,即使用随机表法操作也并不方便快捷。另外,要想“搅拌均匀”也非常困难,这就容易导致样本的代表性差。因此,为了操作上方便快捷,在不降低样本的代表性的前提下,可以采取下面的抽样方法。,系统抽样,方法:首先将这500名学生从1开始编号,然后按号码顺序以一定的间隔进行抽取。由于500/50=10,这个间
41、隔可以定为10,即从号码110的第一个间隔中随机地抽取一个号码,假如抽到的是6号,然后从第6号开始,每隔10个号码抽取一个,得到 6,16,26,496.这样我们就得到一个容量为50的样本,这种抽样方法是一种系统抽样。,某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查。除了用简单随机抽样获取样本外,你能否设计其他抽取样本的方法?,探究,请将这种抽样方法与简单随机抽样做一个比较,你认为这种抽样方法能提高样本的代表性吗?为什么?,(1)系统抽样比简单随机抽样更容易实施,可节约成本。,(2)系统抽样所得到的样本的代表性和具体的编号有关;而简单随机抽样所得样本
42、代表性与个体的编号无关。如果编号的个体特征随编号的变化呈现一定的周期性,可能会使系统抽样的代表性差。,(3)系统抽样比随机抽样应用的范围更广。,一般地,假设要从容量为N的总体中抽取容量为n的样本,我们可以按下列步骤进行系统抽样:,(1)先将总体中的N个个体编号,有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;,(2)确定分段间隔k,对编号进行分段,当N/n(n是样本容量)是整数时,取k=N/n;,(3)在第1段用简单随机抽样确定第一个个体编号l(lk);,(4)按照一定的规则抽取样本,通常将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次下去,
43、直到获取整个样本。,如果遇到N/n不是整数的情况,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除。,(1)简便易行;,(2)当对总体结构有一定了解时,充分利用已有信息对总体中的个体进行排对后再抽样,可提高抽样效率;,(3)当总体中的个体存在一促自然编号(如生产线上产品的质量控制)时,便于施行系统抽样法。,系统抽样的缺点是在不了解样本总体的情况下,所抽出的样本可能有一定的偏差。,1.你认为系统抽样有哪些优点和缺点?,(1)对这118名教师进行编号;,(2)计算间隔k=118/16=7.375,由于k不是一个整数,我们随机剔除了3,46,59,57,112,93,这6名教
44、师,再对剩余的确良12位教师进行编号,计算间隔k=7;,(3)在1 7之间随机选取一个数字,例如选5,将5加上间隔7得到第2个个体编号12,再加上7得到第3个个体编号19,依次进行下去,直到获取整个样本。,2.设某校共有118名教师,为了支援西部的教育事业,现要从中随机抽出16名教师组成暑期西部讲师团,请用系统抽样法选出讲师团成员。,答:由于身份证(18位)的倒数第二位表示性别,后三位是632的观众全部是男性,所以调查结果不能代表女性观众的意见,因此缺乏代表性。,3.有人说,我可以借用居民身份证(18位)来进行中央春节联欢晚会的收视率调查:在1999中抽取一个随机数,比如这个数是632,那么身份证后三位数是632的观众就是我要调查的对象,请问,这样所获得的样本有代表性吗?为什么?,P53习题2.1 A组第1题,在抽样过程中,如果总体中的每个个体都有相等的机会被抽中,那么我们就称这样产生的样本为随机样本。举例说明产生随机样本的困难。,(1)很难确定总体中所有个体的数目,例如调查对象是生产线上生产的产品。,(2)成本高,要产生真正的简单随机样本,需要利用类似于抽签法中的抽签试验来产生非负整数值随机数。,(3)耗时多,产生非负整数值随机数和从总体中挑选出随机数所对应的个体都需要时间。,