《高二数学《用样本的频率分布估计总体分布》上课.ppt》由会员分享,可在线阅读,更多相关《高二数学《用样本的频率分布估计总体分布》上课.ppt(29页珍藏版)》请在三一办公上搜索。
1、用样本的频率分布估计总体分布(一),样本的频率分布表及频率分布直方图,(1)统计的核心问题:,如何根据样本的情况对总体的情况作出推断,复习引入:,简单随机抽样 系统抽样 分层抽样,(3)通过抽样方法收集数据的目的是什么?,从中寻找所包含的信息,用样本去估计总体,(2)随机抽样的几种常用方法:,如何是抽取的样本具有代表性,我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?,探究:
2、,你认为,为了较为合理地确定出这个标准,需要做哪些工作?,我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?,探究:,采用抽样调查的方式获得样本数据分析样本数据来估计全市居民用水量的分布情况,下表给出100位居民的月均用水量表,讨论:如何分析数据?,根据这些数据你能得出用水量其他信息吗?,为此我们要对这些数据进行整理与分析,一频率分布的概念:频率分布是指一个样本数据在各个小范围
3、内所占比例的大小。一般用频率分布直方图反映样本的频率分布,二画频率分布直方图其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图,第一步:求极差:(数据组中最大值与最小值的差距),最大值=4.3 最小值=0.2 所以极差=4.3-0.2=4.1,第二步:决定组距与组数:(强调取整),当样本容量不超过100时,按照数据的多少,常分成512组.为方便组距的选择应力求“取整”.本题如果组距为0.5(t).则,第三步:将数据分组:(给出组的界限),所以将数据分成9组较合适.,0,0.5),0.5,1),1,1.5),
4、4,4.5)共9组.,第四步:列频率分布表.,组距=0.5,0.04,0.08,0.08,0.16,0.3,0.15,0.44,0.22,0.25,0.5,1,2.00,0.02,0.04,0.04,0.08,0.1,0.3,0.15,0.05,第五步:画出频率分布直方图.,频率/组距,月均用水量/t,(组距=0.5),小长方形的面积=?,小长方形的面积总和=?,月均用水量最多的在哪个区间?,请大家阅读第68页,直方图有哪些优点和缺点?,频率分布直方图的特征:从频率分布直方图可以清楚的看出数据分布的总体趋势。从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉
5、了。,问题7 如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量标准提出建议吗?,问题9 你认为3吨这个标准一定能够保证85以上的居民用水不超标吗?如果不一定,那么哪些环节可能导致结论的差别?,3.将组距确定为1,作出教材P68页 居民月均用水量的频率分布直方图,4.谈谈两种组距下,你对图的印象?同一个样本数据,绘制出来的分布图是唯一的吗?,同样一组数据,如果组距不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,练 习:,1.有一个容量为50的样本数据的分组的频数如下:,12.5,15.5)3
6、,15.5,18.5)8,18.5,21.5)9,21.5,24.5)11,24.5,27.5)10,27.5,30.5)5,30.5,33.5)4,(1)列出样本的频率分布表;,(2)画出频率分布直方图;,(3)根据频率分布直方图估计,数据落在15.5,24.5)的百分比是多少?,解:组距为3,分组 频数 频率 频率/组距,12.5,15.5)3,15.5,18.5)8,18.5,21.5)9,21.5,24.5)11,24.5,27.5)10,27.5,30.5)5,30.5,33.5)4,0.060.160.180.220.200.100.08,0.0200.0530.0600.0730
7、.0670.0330.027,频率分布直方图如下:,0.010,0.020,0.030,0.040,0.050,12.5,15.5,0.060,0.070,3学校为了调查学生在课外读物方面的支出况,抽出了一个容量为n的样本,其频率分布直方图如右图所示,其中支出在 元的同学有30人,则n的值为,100,4统计某校1000名学生的数学水平测试成绩,得到样本频率分布直方图如图所示,若满分为100分,规定不低于60分为及格,则及格率是()A20%B25%C60%D80%,D,6.某高校在2010年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如右图所示.(1)请先求出
8、频率分布表中、位置相应的数据,再在答题纸上完成下列频率分布直方图;(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组中用分层抽样抽取6名学生进入第二轮面试,求第3、4、5组每组各抽取多少名学生进入第二轮面试?,小结:画频率分布直方图的步骤:第一步:求极差:(数据组中最大值与最小值的差距)第二步:决定组距与组数:(强调取整)第三步:将数据分组(给出组的界限)第四步:列频率分布表.(包括分组、频数、频率、频率/组距)第五步:画频率分布直方图(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率/组距.),组距:指每个小组的两个端点的距离,组距组数:将数据分组,当数据在10
9、0个以内时,按数据多少常分5-12组。,注意,(2)纵坐标为:,频率分布直方图如下:,连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图,利用样本频分布对总体分布进行相应估计,(3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线总体密度曲线.,(2)样本容量越大,这种估计越精确。,(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?,总体密度曲线,月均用水量/t,a,b,(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频
10、率分布折线图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。,总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.,总体密度曲线,茎叶图,某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:,(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39,(2)乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39,茎叶图,甲,乙,012345,2 55 41 6 1 6 7 94 9 0,84 6 36 83 8 9 1,叶就是从茎的旁边生长出来的数,表示得分的个位数.,茎是指中间的一列数,表示得分的十位数,从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中,说明乙运动员的发挥更稳定.,2绘制茎叶图的步骤(1)将数据分为“茎”、“叶”两部分;(2)将最大“茎”与最小“茎”之间的数字按大小顺序排成一列,茎相同者共用一个茎,再画上竖线作为分界线;(3)将各个数据的“叶”在分界线的一侧对应茎处同行列出,