《从数据分析角度看为什么要去掉最高分和最低分.docx》由会员分享,可在线阅读,更多相关《从数据分析角度看为什么要去掉最高分和最低分.docx(2页珍藏版)》请在三一办公上搜索。
1、从数据分析角度看为什么要去掉最高分和最低分从数据分析角度看 为什么要去掉最高分和最低分 在歌手电视大奖赛或跳水等比赛中,我们经常看到,评委亮完分后,往往采用去掉最高分与最低分再计算平均值的办法来计算选手的参赛成绩,这是为什么呢? 这类问题是日常生活中经常遇到的数学问题,在我们的教材里分别介绍了统计学中的三个重要概念-平均数、中位数和众数同学们仅知道平均数的概念,会机械地用公式计算而对平均数的价值、平均数的优缺点了解甚少,这是相当遗憾的!阅读了下文,你就可以补上这一课了 我们假设10个评委对某位歌手的打分情况如下: 9.3,9.2,9.2,9.1,9.0,8.9,8.5,8.0,8.0和7.8,
2、 那么,其平均分是10=8.7, 如果去掉一个最高分和最低分后,其平均分就变成8.8,明显大于8.7了 由此可见,个别评委的打分高低在很大程度上影响选手的参赛成绩,为了避免个别评委的个人好恶影响选手的成绩,常常要去掉最高分和最低分,有的甚至还要去掉两个最高分和最低分,以略去评委评分中可能出现的异常值,使得比赛尽可能客观公正因此,易受异常值影响是平均数的缺点之一 平均数的第二个缺点是不一定能代表“中等水平” 我们举个极端的例子说明,假设全班有30个学生,某次测验成绩如下: 2分、10分各一人,90分5人,80分22人 某同学甲78分,全班的平均分是30=76.67 显然,甲同学的成绩78高于全班
3、平均成绩76.67,给人的影响是“中上”水平,其实,他的成绩已排在倒数第三位了,可见,平均数有时不能反映“中等水平” 要正确反映“中等水平”,就要用统计学上的“中位数”概念,所谓“中位数”就是将所有数据从小到大依次排列起来,位于中间的那个数这时,比它大的数据个数与比它小的数据一样多,中位数大小就正确反映“中等水平”一般地,若有n个数据,n为偶数时,中位数就是第nn个和第+1个数据的平均数;若n为奇数时,中位数就是第22n+1个数据显然,第二例中反映全班学生测验成绩“中等水平”的中位数应该是80分,2而平均数是76.67;在第一例中歌手成绩的中位数是8.95,而平均数是8.7,两者都存在一定的距离 在第一个例子中,如果我们去掉一个最高分和最低分,其平均数就变为8.8;去掉两个最高分和最低分,其平均数就变为8.88可见,去掉若干对最高分和最低分,能够使得平均数接近中位数,从而更好地反映“中等水平”虽然中位数能很好标志“中间”水平,但抹煞了更多评委个人细微的评审意图在实际中既需要考虑异常值对平均数的影响,又要考虑绝大多数评委个人细微的评审意图,所以往往采用去掉一个或两个最高分和最低分再计算平均数的办法来统计选手的总成绩的