《《随机抽样课时》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《随机抽样课时》PPT课件.ppt(48页珍藏版)》请在三一办公上搜索。
1、电视台的收视率,为了回答我们碰到的许多问题,必须收集相关数据.如食品、饮料中的细菌是否超标,农作物的产量这些问题都需要通过收集数据作出回答.,统计学:,研究客观事物的数量特征和数量关系,它是关于数据的搜集、整理、归纳和分析方法的科学。,统计的基本思想:,用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况。,统计学中的几个概念,所要考察对象的全体,总体中的每一个对象,从总体中抽取的一个部分,样本中个体的个数,总体,个体,样本,样本容量,这里面总体、个体、样本、样本容量分别是什么?,为了了解高一(4)班53名同学的视力情况,从中抽取10名同学进
2、行检查。,问题1:为了了解全国高中生的视力情况,需要将全中国所有高中生逐一进行检查吗?,问题2:要检查某超市销售的牛奶含菌量是否合格,需要将该超市的所有牛奶的包装袋都打开逐一检查吗?,容量大!,有破坏性!,1、如何设计抽样方法,使抽取的样本能真正代表总体?,如怎么判断一锅汤的味道如何?,高质量的数据来自“搅拌均匀”的总体,使每个个体有同样的机会被抽中。,在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意调查。调查兰顿(当时任堪萨斯州州长)和罗斯福(当时的总统)中谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(注意在年电话和汽车只
3、有少数富人拥有)。通过分析收回的调查表,显示兰顿非常受欢迎,于是杂志预测兰顿将在选举中获胜。实际上选举结果正好相反,最后罗斯福在选举中获胜,其数据如下:,?,思考,问题:你认为预期结果出错的原因是什么?,原因是:用于统计推断的样本来自少数富人,只能代表富人的观点,不能代表全体选民的观点(样本不具有代表性)。,2.1.1 简单随机抽样,问题3:假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎么做?,将这批小包装饼干放入一个不透明的袋子中,搅拌均匀,然后不放回的摸取(这样可以保证每一袋饼干被抽取的机会相等),这样我们就可以得到一个简单随机样本,相应的抽样方法
4、就是简单随机抽样,一般地,设一个总体的个体数为N,从中逐个不放回地抽取n个个体作为一个样本,如果每次抽取时总体内的各个个体被抽到的机会相等,就称这样的抽样为简单随机抽样。,简单随机抽样,说明:,(1)被抽取样本的总体的个体数有限;,(2)从总体中逐个进行抽取;,(3)一种不放回抽样;,(4)每个个体能被选入样本的可能性是相同的。,简单随机抽样,简单随机抽样是在特定总体中抽取样本,总体中每一个体被抽取的可能性是等同的,而且任何个体之间彼此被抽取的机会是独立的。,判断:下列抽取样本的方式是否属于简单随机抽样?,(1)从无限多个个体中抽取100个个体作为样本(2)盒子里共有80个零件,从中选出5个零
5、件进行质量检验,在抽取操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里。(3)从20件玩具中一次性抽取3件进行质量检验。,1.抽签法(抓阄法),把总体中的N个个体编号,并把号码写在形状、大小相同的号签上,将号签放在同一个容器里,搅拌均匀后,每次从中抽出1 个号签,连续抽取n次,得到一个容量为n的样本。,简单随机抽样,抽签法,开始,53名同学从1到53编号,制作1到53个号签,将53个号签搅拌均匀,随机从中抽出10个签,对号码一致的学生检查,结束,例1.为了了解高一(4)班53名同学的视力情况,从中抽取10名同学进行检查。,53名同学从1到53编号,将53个号签搅拌均匀,对号码一致的学
6、生检查,抽签法的一般步骤:,(1)将总体中的N个个体编号(号码从1到N);,(2)将这N个号码写在形状、大小相同的号签上;,(3)将号签放在同一箱中,并搅拌均匀;,(4)从箱中每次抽出1个号签,并记录其编号,连续抽出n次;,(5)将总体中与抽到的号签编号一致的n个个体取出。,(总体个数N,样本容量n),抽签法的一般步骤:,(1)将总体中的N个个体编号(号码从1到N);,(2)将这N个号码写在形状、大小相同的号签上;,(3)将号签放在同一箱中,并搅拌均匀;,(4)从箱中每次抽出1个号签,并记录其编号,连续抽出n次;,(5)将总体中与抽到的号签编号一致的n个个体取出。,(总体个数N,样本容量n),
7、开始,编号,制签,搅匀,抽签,取出个体,结束,思考:,你认为抽签法有什么优点和缺点?,优点:抽签法能够保证每个个体入选样本的机会都相等,缺点:(1)当总体的个数较多时,制作号签的成本将会增加(2)号签很多时,“搅拌均匀”比较困难,结果很难保证每个个体入选样本的可能性相同,用随机数表法抽取样本的步骤:,将总体中的所有个体编号(每个号码位数一致);,在随机数表中选定开始的数字(确定行数列数);,从选定的数开始按一定方向读数,若得到的号码大于总体编号或与前面所取出的号码重复的去掉,如此进行下去,直到取满为止;,根据选定的号码抽取样本。,简单随机抽样,2.随机数法,随机数表、随机数骰子、计算机产生的随
8、机数,例2:假设我们要考察某公司生产的袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,可以按照下面的步骤进行:,先将800袋牛奶编号,可以编为000,001,799;在随机数表中任选一个数;从选定的数开始向右(读数的方向可以是向左,向上,向下等),得到满足的数将它取出,继续向右读,直到样本的60个号码全部取出。,例3 利用随机数表法从500件产品中抽取40件进行质检.(1)这500件产品可以怎样编号?(2)如果从随机数表第10行第8列的数开始往左读数,则最先抽取的5件产品的编号依次是什么?,随机数表法,1、随机数表是统计工作者用计算机生成的随机数,并保证表
9、中的每个位置上的数字是等可能出现的。,2、用随机数表抽取样本,可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。因此并不是唯一的.,3、由于随机数表是等可能的,因此利用随机数表抽取样本保证了被抽取个体的可能性是相等的。,巩固练习,1、对于简单随机抽样,个体被抽到的机会(),A.相等 B.不相等 C.与抽取的次数有关 D.不确定,3、高一(1)班有49名学生,学号从01到49,数学老师在上统计课的时候,运用随机数表法选6名同学,老师首先选定随机数表法从第21行第29列开始,依次向右读取,这5位同学的号码依次为_,A,26、04、33、46、09、07,2.1.2 系统抽样,
10、问题:某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查。除了用简单随机抽样获取样本外,你能否设计其他抽取样本的方法?,简单随机抽样适用于个体数不太多的总体。那么当总体个体数较多时,宜采用什么抽样方法呢?,分析:我们按这样的方法来抽样:首先将这名学生从开始进行编号,然后按号码顺序以一定的间隔进行抽取。由于,这个间隔可以定为,即从号码为的第一个间隔中随机地抽取一个号码,假如抽到的是号,然后从第号开始,每隔个号码抽取一个,得到,。这样就得到一个容量为的样本,这种抽取方法是系统抽样。,系统抽样,现将总体中的个体逐一编号,然后按号码顺序以一定的间隔k进行抽取,先
11、从第一个间隔中随机地抽取一个号码,然后逐个抽取的号码依次增加间隔数即得到所求样本。,例2 某中学有高一学生322名,为了了解学生的身体状况,要抽取一个容量为40的样本,用系统抽样法如何抽样?,先用简单随机抽样的方法,剔除其中2名学生,第二步,随机剔除2名学生,再把余下的320名学生随机编号为1,2,3,320.,第五步,从该号码起,每间隔8个号码抽取1个号码,就可得到一个容量为40的样本.,第四步,在第1部分用抽签法确定起始编号.,第三步,把总体分成40个部分,每个部分有8个个体.,第一步,采用随机的方式给个体编号,1,2,322,系统抽样的特点:,(1)用系统抽样抽取样本时,每个个体被抽到
12、的可能性是相等的,(2)系统抽样适用于总体中个体数较多,抽取样本容量也较大时;,(3)系统抽样是不放回抽样。,用简单随机抽样抽取第1段的个体编号.在抽取第1段的号码之前,自定义规则确定以后各段的个体编号,通常是将第1段抽取的号码依次累加间隔k.,思考6:用系统抽样抽取样本时,每段各取一个号码,其中第1段的个体编号怎样抽取?以后各段的个体编号怎样抽取?,一般地,用系统抽样从含有N个个体的总体中抽取一个容量为n的样本,其操作步骤如何?,系统抽样的步骤:,(1)采用随机的方式将总体中的个体编号;(2)将整个的编号按一定的间隔(设为K)分段,当(N为总体中的个体数,n为样本容量)是整数时,;当不是整数
13、时,从总体中剔除一些个体,使剩下的总体中个体的个数 能被n整除,这时,,并将剩下的总体重新编号;(3)在第一段中用简单随机抽样确定起始的个体编号;(4)将编号为的个体抽出。,简记为:编号;分段;在第一段确定起始号;加间隔获取样本。,例1.从编号为150的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是 A.5,10,15,20,25 B.3,13,23,33,43C.1,2,3,4,5 D.2,4,6,16,32,B,两种抽样方法比较,思考:系统抽样与简单随机抽样比较,有何优、缺点?点评:(1)系统抽样比简单
14、随机抽样更容易实施,可节约抽样成本。(2)系统抽样的效果会受个体编号的影响,而简单随机抽样的效果不受个体编号的影响;系统抽样所得样本的代表性和具体的编号有关,而简单随机抽样所得样本的代表性与个体的编号无关.(3)系统抽样比简单随机抽样的应用范围更广.,2.1.3 分层抽样,例3:某班有男生36人,女生24人,从全班抽取一个容量为10的样本,分析某种身体素质指标,已知这种身体素质指标与性别有关.问应采取什么样抽样方法?并写出抽样过程.,解:因为这种身体素质指标与性别有关,所以男生,女生身体素质指标差异明显,因而采用分层抽样的方法.具体过程如下:(1)将60人分为2层,其中男,女生各为一层.(2)
15、确定抽样比为10/(36+24)=1/6(3)按照样本容量的比例随机抽取各层应抽取的样本.361/6=6(人),241/6=4(人)因此男,女生各抽取人数分别为6人和4人.(4)利用简单随机抽样方法分别在36名男生中抽取6人,24名女生中抽取4人.(5)将这10人组到一起,即得到一个样本.,分层抽样的抽取步骤:,(1)分层:按某种特征将总体分为若干部分。(注:一般不写。),(2)确定抽样比例。抽样比=样本容量/总体容量,(3)按比例确定每层抽取个体的个数。(注:各层的抽取数之和应等于样本容量)。,(4)各层分别按简单随机抽样或系统抽样的方法抽取。,(5)综合每层抽样,组成样本。,注意:,1、分
16、层抽样适用于总体由差异明显的几部分组成的情况,每一部分称为层,在每一层中实行简单随机抽样。,2、分层抽样中分多少层,要视具体情况而定。总的原则是:层内样本的差异要小,而层与层之间的差异尽可能地大,否则将失去分层的意义。,强调两点:,(1)分层抽样是等概率抽样,它也是公平的。用分层抽样从个体为N的总体中抽取一个容量为n的样本时,在整个抽样过程中每个个体被抽到的概率相等 为n/N。,(2)、分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因此它获取的样本更具代表性,在实用中更为广泛。,问题5:假设某地区有高中生2400人,初中生10900人,小学生11000人.此地区教
17、育部门为了了解本地区中小学生的近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查.你认为应当怎样抽取样本?,解:(1)确定样本容量与总体的个体数之比1%。,(3)利用简单随机抽样或系统抽样的方法,从各年龄段分别抽取24,109,110人,然后合在一起,就是所抽取的样本。,(2)利用抽样比确定各年龄段应抽取的个体数,依次为,即24,109,110。,(1)某校有1000名学生,其中O型血的有400人,A型血的人有250人,B型血的有250人,AB型血的有100人,为了研究血型与色弱的关系,要从中抽取一个40人的样本,按分层抽样,O型血应抽取的人数为_人,A型血应抽取的人数为_人,
18、B型血应抽取的人数为_人,AB型血应抽取的人数为_人。,目标检测,简单随机抽样、系统抽样、分层抽样的比较,(2)某单位有老年人27人,中年人55人,青年人81人,为了调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的抽取方法是(),A简单随机抽样 B系统抽样C分层抽样 D先从中年人中剔除1人,然后再分层抽样,例4、选择合适的抽样方法进行抽样,(1)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个。(2)有30个篮球,其中甲厂生产的有21个,乙场生产的有9个,从中抽取10个(3)有甲厂生产的300个篮球,抽取10个。(4)有甲厂生产的300个篮球从中抽取100个。,简单随机抽样,分层抽样,简单随机抽样,系统抽样,本节课学习了关于统计的哪些内容?,