(选修)第一章概率与统计抽样方法与总体分布的估计.docx

上传人:小飞机 文档编号:1686233 上传时间:2022-12-14 格式:DOCX 页数:9 大小:118.99KB
返回 下载 相关 举报
(选修)第一章概率与统计抽样方法与总体分布的估计.docx_第1页
第1页 / 共9页
(选修)第一章概率与统计抽样方法与总体分布的估计.docx_第2页
第2页 / 共9页
(选修)第一章概率与统计抽样方法与总体分布的估计.docx_第3页
第3页 / 共9页
(选修)第一章概率与统计抽样方法与总体分布的估计.docx_第4页
第4页 / 共9页
(选修)第一章概率与统计抽样方法与总体分布的估计.docx_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《(选修)第一章概率与统计抽样方法与总体分布的估计.docx》由会员分享,可在线阅读,更多相关《(选修)第一章概率与统计抽样方法与总体分布的估计.docx(9页珍藏版)》请在三一办公上搜索。

1、高中数学复习教(学)案资兴市第一高级中学 代晓忠题目 (选修)第一章概率与统计抽样方法与总体分布的估计第 课(章、节) 第 课时 课型 编写时间:200 年 月 日 执行日期: 月 日 总序号 高考要求 1.会用随机抽样、系统抽样、分层抽样等常用的抽样方法从总体中抽取样本 2.会用样本频率分布去估计总体分布 知识点归纳 1.简单随机抽样:设一个总体的个体数为N如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样 用简单随机抽样从含有N个个体的总体中抽取一个容量为的样本时,每次抽取一个个体时任一个体被抽到的概率为;在整个抽样过程中各个个体被抽

2、到的概率为; 简单随机抽样的特点是,逐个抽取,且各个个体被抽到的概率相等,是不放回抽样.简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础2.抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本 适用范围:总体的个体数不多时 优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法 3.随机数表法: 随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步

3、,获取样本号码 4.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样系统抽样的步骤:采用随机的方式将总体中的个体编号为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等 为将整个的编号分段(即分成几个部分),要确定分段的间隔k当(N为总体中的个体的个数,n为样本容量)是整数时,k=;当不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数能被n整除,这时k=.在第一段用简单随机抽样确定起始的个体编号 按照事先确定的规则抽取样本(通常是将加上间隔k,得到第2个编

4、号+k,第3个编号+2k,这样继续下去,直到获取整个样本) 系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除在进行系统抽样 5.分层抽样: 当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样

5、,所分成的部分叫做层 6.常用的抽样方法及它们之间的联系和区别:类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率是相同的从总体中逐个抽取总体中的个数比较少系统抽样将总体均匀分成几个部分,按照事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个数比较多分层抽样将总体分成几层,分层进行抽取各层抽样时采用简单抽样或者相同抽样总体由差异明显的几部分组成7.不放回抽样和放回抽样:在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样随机抽样、系统抽样、分层抽样都是不放回抽样8.总体:在数

6、理统计中,通常把被研究的对象的全体叫做总体.9.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.10.总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n的样本,就是进行了n次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.11.总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率设想样本容量无限增大,分组的组距无限缩

7、小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线它反映了总体在各个范围内取值的概率根据这条曲线,可求出总体在区间(a,b)内取值的概率等于该区间上总体密度曲线与x轴、直线x=a、x=b所围成曲边梯形的面积。9.总体分布密度密度曲线函数y=f(x)的两条基本性质:f(x) 0(xR);由曲线y=f(x)与x轴围成面积为1。题型讲解 例1 某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和

8、售后服务情况,记这项调查为.则完成、这两项调查宜采用的抽样方法依次是A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法分析:此题为抽样方法的选取问题.当总体中个体较多时宜采用系统抽样;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.解:依据题意,第项调查应采用分层抽样法、第项调查应采用简单随机抽样法.故选B.答案:B点评:采用什么样的抽样方法要依据研究的总体中的个体情况来定.例2 一个总体中有100个个体,随机编号为0,1,2,99,依编号顺序平均分成10个小组,组号依次为1,2,3,10.现用系统抽样

9、方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k小组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是_.分析:此问题总体中个体的个数较多,因此采用系统抽样.按题目中要求的规则抽取即可.解:m=6,k=7,m+k=13,在第7小组中抽取的号码是63.答案:63点评:当总体中个体个数较多而差异又不大时可采用系统抽样.采用系统抽样在每小组内抽取时应按规则进行.例3 把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,则剩下三组中频数最高的一组的频数为_.分析:已知

10、前七组的累积频率为0.79,而要研究后三组的问题,因此应先求出后三组的频率之和为10.79=0.21,进而求出后三组的共有频数,或者先求前七组共有频数后,再计算后三组的共有频数.解:由已知知前七组的累积频数为0.79100=79,故后三组共有的频数为21,依题意=21,a1(1+q+q2)=21(整解方程)q2, 1+q+q27.a1=1,q=4.后三组频数最高的一组的频数为16.答案:16点评:此题分析只按第二种思路给出了解答。例4 对某电子元件进行寿命追踪调查,情况如下:寿命(h)100200200300300400400500500600个 数2030804030(1)列出频率分布表;(

11、2)画出频率分布直方图和累积频率分布图;(3)估计电子元件寿命在100400 h以内的概率;(4)估计电子元件寿命在400 h以上的概率.分析:通过本题可掌握总体分布估计的各种方法和步骤.解:(1)频率分布表如下:寿命(h)频 数频 率累积频率100200200.100.10200300300.150.25300400800.400.65400500400.200.85500600300.151合 计2001(2)频率分布直方图如下:(3)由累积频率分布图可以看出,寿命在100400 h内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100400 h内的概率为0.65.(4)由频率

12、分布表可知,寿命在400 h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h以上的概率为0.35.点评:画频率分布条形图、直方图时要注意纵、横坐标轴的意义.例5 某批零件共160个,其中,一级品48个,二级品64个,三级品32个,等外品16个.从中抽取一个容量为20的样本.请说明分别用简单随机抽样、系统抽样和分层抽样法抽取时总体中的每个个体被取到的概率均相同.分析:要说明每个个体被取到的概率相同,只需计算出用三种抽样方法抽取个体时,每个个体被取到的概率.解:(1)简单随机抽样法:可采取抽签法,将160个零件按1160编号,相应地制作1160号的160个

13、签,从中随机抽20个.显然每个个体被抽到的概率为=.(2)系统抽样法:将160个零件从1至160编上号,按编号顺序分成20组,每组8个.然后在第1组用抽签法随机抽取一个号码,如它是第k号(1k8),则在其余组中分别抽取第k+8n(n=1,2,3,19)号,此时每个个体被抽到的概率为.(3)分层抽样法:按比例=,分别在一级品、二级品、三级品、等外品中抽取48=6个,64=8个,32=4个,16=2个,每个个体被抽到的概率分别为,即都是.综上可知,无论采取哪种抽样,总体的每个个体被抽到的概率都是.点评:三种抽样方法的共同点就是每个个体被抽到的概率相同,这样样本的抽取体现了公平性和客观性.小结:1.

14、简单随机抽样、系统抽样和分层抽样是三种常用的抽样方法,三种方法的共同特点是在抽样过程中每一个个体被抽取的概率相等,体现这些抽样方法的客观性和总体性。2.日常生活中的一些问题,我们可以转化为数学问题,借助于函数、方程、不等式、概率、统计等知识解决。同时,要提高分析问题和解决问题的能力,必须关注生产和生活。学生练习 1.为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是A.1000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本容量是100解析:这个问题我们研究的是运动员的年龄情况.因此应选D.答案:D2.一个总体

15、中共有10个个体,用简单随机抽样的方法从中抽取一个容量为3的样本,则某特定个体入样的概率是A.B.C. D.解析:用简单随机抽样法从中抽取,则每个个体被抽到的概率都相同为,所以选C.答案:C3.一个容量为n的样本,分成若干组,已知某数的频数和频率分别为40、0.125,则n的值为A.640 B.320 C.240 D.160解析:=0.125,n=320.故选B.答案:B4.一个单位有500名职工,其中不到35岁的有125人,3549岁的有280人,50岁以上的有95人,要从中抽取一个容量为100的样本,较为恰当的抽样方法是()A.简单随机抽样B.系统抽样 C.分层抽样D.以上三种均可答案:C

16、5.某学院有四个饲养房,分别养有18,24,54,48只白鼠供实验用,某项实验需抽取24只,你认为最合适的抽样方法为()A.在每个饲养房各抽取6只B.把所有白鼠都加上编有不同号码的项圈,用随机取样法确定24只C.在四个饲养房分别随手提出3,9,4,8只D.先确定这四个饲养房应分别抽取3,4,9,8样品,再由各饲养房自己加上号码项圈,用简单随机抽样法确定各自的捕捉对象答案:D6.将容量为100的样本数据,按由小到大排列分成8个小组,如表:组号12345678频率101314141513129第3组的频率和累积频率为()A、0.140.37B、C、0.030.06D、答案:A7.某校为了了解学生的

17、课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为A.0.6 h B.0.9 h C.1.0 h D.1.5 h解析:=0.9.答案:B8.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上的人,用分层抽样法从中抽取20人,各年龄段分别抽取的人数为A.7,5,8 B.9,5,6 C.6,5,9 D.8,5,7解析:45=45=9,25=5,30=6.答案:B9.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的健康状况,需从他们中抽取

18、一个容量为36的样本,在简单随机抽样、系统抽样、分层抽样这三种方法中较合适的抽样方法是_.解析:要研究的总体里各部分情况差异较大,因此用分层抽样.答案:分层抽样10.某班学生在一次数学考试中成绩分布如下表:分数段0,80)80,90)90,100)人数2)56分数段100,110)110,120 120,130)人数8126分数段130,140)140,150)人数42那么分数在100,110)中的频率和分数不满110分的累积频率分别是_、_(精确到0.01).解析:由频率计算方法知:总人数=45.分数在100,110)中的频率为 =0.1780.18.分数不满110分的累积频率为=0.47.

19、答案:0.18 0.4711.某单位共有N个职工,要从N个职工中采用分层抽样法抽取n个样本,已知该单位的某一部门有M个员工,那么从这一部门中抽取的职工数为_.答案:12.举例说明简单随机抽样和分层抽样两种抽样方法,无论使用哪一种抽样方法,总体中的每一个个体被抽到的概率都相等.解:袋中有160个小球,其中红球48个,蓝球64个,白球16个,黄球32个,从中抽取20个作为一个样本.(1)使用简单随机抽样:每个个体被抽到的概率为=.(2)使用分层抽样:四种球的个数比为3412.红球应抽20=6个;蓝球应抽20=8个;白球应抽20=2个;黄球应抽20=4个.由于=,所以,按颜色区分,每个球被抽到的概率

20、也都是.13.某工厂生产的产品,可分为一等品、二等品、三等品三类,根据抽样检验的记录有一等品54个、二等品140个、三等品6个.(1)估计三种产品的概率;(2)画出频率分布条形图.解:(1)0.27,0.7,0.03.(2)频率分布条形图如下14.某县政府机关在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级人事部门为了了解职工对机构改革的意见,要从中抽取一个容量为20的样本,试说明具体实施办法,并证明用这种抽样方法可使总体中每个个体被抽到的概率相等.解:因机构改革关系到所有人的利益,故采用分层抽样方法较宜.=,10=2,70=14,20=4.故从副处级以上干部中抽取

21、2人,从一般干部中抽取14人,从工人中抽取4人.副处级以上干部被抽到的概率为=,一般干部被抽到的概率为=,工人被抽到的概率为=,即每个个体被抽到的概率都是=.15.从一个养鱼池中捕得m条鱼,作上记号后再放入池中,数日后又捕得n条鱼,其中k条有记号,请估计池中有多少条鱼.解:设池中有N条鱼,第一次捕得m条作上记号后放入水池中,则池中有记号的鱼占;第二次捕得n条,则这n条鱼是一个样本,其中有记号的鱼占.我们用样本来估计总体分布,令=,N=.16.1936年,美国进行总统选举,竞选的是民主党的罗斯福和共和党的兰登罗斯福是在任的总统.美国权威的文学摘要杂志社,为了预测总统候选人谁能当选,采用了大规模的

22、模拟选举,他们以电话簿上的地址和俱乐部成员名单上的地址发出1000万封信,收到回信200万封,在调查史上,样本容量这么大是少见的,杂志社花费了大量的人力和物力,他们相信自己的调查统计结果,即兰登将以57%对43%的比例获胜,并大力进行宣传.最后选举结果却是罗斯福以62%对38%的巨大优势获胜,连任总统. 这个调查使文学摘要杂志社威信扫地,不久只得关门停刊. 试分析这次调查失败的原因.解:失败的原因:抽样方法不正确.样本不是从总体(全体美国公民)中随机地抽取,1936年,美国有私人电话和参加俱乐部的家庭,都是比较富裕的家庭.19291933年的世界经济危机,使美国经济遭到沉重打击,“罗斯福新政”动用行政手段干预市场经济,损害了部分富人的利益,但广大的美国人民却从中得到了好处.所以,从这部分富人中抽取的样本严重偏离了总体,导致样本不具有代表性.课前后备注 第9页 共9页

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号