《众数中位数和平均数.ppt》由会员分享,可在线阅读,更多相关《众数中位数和平均数.ppt(49页珍藏版)》请在三一办公上搜索。
1、第一课时 众数、中位数、平均数,问题提出,在前面几节课中,我们学习了用图、表来组织样本数据,用样本的分布情况估计总体的分布情况。为了从整体上更好地把握总体的规律,我们还应从哪些方面来对总体的数字特征进行研究?,一、用众数、中位数、平均数来反映总体的平均状况,二、用方差和标准差来反映总体的波动状况,目标导学,1、正确理解众数、中位数、平均数的概念,能够计算和估计样本的数字特征。2、通过对样本数据提取的基本数字特征进行合理的解释,进一步体会统计的思想,培养应用意识和能力。,一、了解众数、中位数、平均数的概念,众数:在一组数据中,出现次数最多的数据叫做这组数据的众数,众数、中位数、平均数都是描述一组
2、数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.,中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,练习1:在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:,分别求这些运动员成绩的众数、中位数与平均数。,二、学会求众数,中位数和平均数,解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;,这组数据的平均数是,答:17名运动员成绩的众数、中
3、位数、平均数依次是1.75(米)、1.70(米)、1.69(米).,练习2:在某赛季中,甲运动员在15场比赛的得分如下:12,15,24,25,31,31,31,36,37,44,49,50,53,53,62,分别求甲运动员成绩的众数,中位数与平均数。,问:如果上面的数据改为:12,15,24,25,31,31,31,36,37,44,49,50,53,53,102众数,中位数与平均数的结果有何改变?,练习3:已知100位居民月均用水量的频率分布表和频率分布直方图(课本67页),试求出该组数据的众数、中位数和平均数,下面,让我们看看从原始数据中得到的三个量的值分别是多少。,思考:你能解释为什么
4、结果不同吗?,归纳:众数、中位数、平均数与频率分布直方图的关系,1.众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),2.在样本中,有50的个体小于或等于中位数,也有50的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),3、平均数是频率分布直方图的“重心”.是直方图的平衡点。等于
5、频率分布直方图中每个小矩形的面积(即落在该组中的频率)乘以小矩形底边中点的横坐标(组中值)之和。,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),练习5.某校为了了解学生的课外阅读情况,随机抽查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用如图所示的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为()A.0.6h B.0.9h C.1.0h D.1.5h,B,练习6:”八.一”前夕,某中学举行国防知识竞赛:满分为100分,80分以上为优秀,现将高一的两个班参赛学生的成绩进行整理后分成五
6、组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、第二、第三、第四、第五小组的频率分别是0.3,0.4,0.15,0.1,0.05,求:(1)成绩的众数、中位数;(2)平均成绩,频率/组距,三 三种数字特征的优缺点,1.众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.如前面例中众数是2.25t,它告诉我们,月均用水量为2.25t的居民数比月均用水量为其它数值的居民数多,但它并没有告诉我们多多少.,2.中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水
7、量为10t,那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不能忽视的。,3.由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。,练习7 某工厂人员及工资构成如下:,(1)指出这个问题中周工资的众数、中位数、平均数,(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?,分析:众数为200,中位数为220,平均数为300。因平均数为300,由表格中所列出的数据
8、可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。,评注:平均数受数据中的极端值的影响较大,妨碍了对总体估计的可靠性,这时平均数反而不如众数、中位数更客观。,练习8.从甲、乙、丙三个产品中,各抽出8件产品,对其使用寿命进行跟踪调查,结果如下(单位:年)甲:3,4,5,6,8,8,8,10乙:4,6,6,6,8,9,12,13丙:3,3,4,7,9,10,11,12三家广告中都称该种产品的使用寿命是8年,请根据调查结果判断厂家在广告中分别运用了平均数、众数、中位数中哪一种集中趋势的特征数。,小结:,1、正确理解众数、中位数、平均数的概念;2、能够计
9、算和估计样本的数字特征(尤其是利用频率分布表和直方图)。3、通过对样本数据提取的基本数字特征进行合理的解释,体会三个特征的优缺点,进一步体会统计的思想,培养应用意识和能力。,目标导学,1、通过实例体会分布的意义和作用。学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点。2、会解决一些简单的实际问题。,统计的基本思想方法,用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.,统计的核心问题,如何根据样本的情况对总体的情况作出一种推断.这里包括两类问题:,一类是如何从总体中抽取样本?,另一类是如何根据对样本的整理、计算、
10、分析,对总体的情况作出推断.,用样本的有关情况去估计总体的相应情况,这种估计大体分为两类,一类是用样本频率分布估计总体分布,一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征。,整体介绍,将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。频率:每组数据的个数除以全体数据个数的商叫做该组的频率。根据随机抽取样本的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值状况),就叫做样本的频率分布。,说明:样本频率分布与总体频率分布有什么关系?,通过样本的频数分布、频率分布可以估计总体的频率分布.,如何用样本的频率分布估计总体分布?,我国是世界上严重缺水的国家
11、之一城市缺水问题较为突出。,1:某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费。,如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?,为了较合理地确定这个标准,你认为需要做哪些工作?,提出问题,思考:由上表,大家可以得到什么信息?,1.求极差:,步骤:,频率分布直方图,2.决定组距与组数:,组数=,4.3-0.2=4.1,3.将数据分组,0,0.5),0.5,1),4,4.5,4.列频率分布表,100位居民月平均用水量的频率分布表,5.画频率分布直方图,一、求极差,即数据中最大
12、值与最小值的差,二、决定组距与组数:组距=极差/组数,三、分组,通常对组内数值所在区间,取左闭右开区间,最后一组取闭区间,四、登记频数,计算频率,列出频率分布表,画一组数据的频率分布直方图,可以按以下的步骤进行:,五、画出频率分布直方图(纵轴表示频率组距),练 习,1.有一个容量为50的样本数据的分组的频数如下:,12.5,15.5)3,15.5,18.5)8,18.5,21.5)9,21.5,24.5)11,24.5,27.5)10,27.5,30.5)5,30.5,33.5)4,(1)列出样本的频率分布表;,(2)画出频率分布直方图;,(3)根据频率分布直方图估计,数据落在15.5,24.
13、5)的百分比是多少?,解:组距为3,分组 频数 频率 频率/组距,12.5,15.5)3,15.5,18.5)8,18.5,21.5)9,21.5,24.5)11,24.5,27.5)10,27.5,30.5)5,30.5,33.5)4,0.060.160.180.220.200.100.08,0.0200.0530.0600.0730.0670.0330.027,频率分布直方图如下:,0.010,0.020,0.030,0.040,0.050,12.5,15.5,0.060,0.070,小长方形有何实际意义?,24.5,2、对某电子元件进行寿命跟踪调查,情况如下:,1)、列出频率分布表2)、
14、估计电子元件寿命在100h400h以内的频率3)、估计电子元件寿命在400h以上频率,3.已知样本10,8,6,10,8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,11,那么频率为0.2范围的是(),A.5.57.5 B.7.59.5 C.9.511.5 D.11.513.5,D,4.一个容量为100的样本,数据的分组和各组的相关信息如下表,试完成表中每一行的两个空格.,课堂小结,编制频率分布直方图的步骤:,找最大值与最小值。,决定组距与组数,决定分点,登记频数,计算频率,列表,画直方图,说明:(1)确定分点时,使分点比数据多一位小数,并且把第1小组的起点稍微再小一点.,