《《数据的数字特征》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《数据的数字特征》PPT课件.ppt(20页珍藏版)》请在三一办公上搜索。
1、4 数据的数字特征Datas characteristic,复习回顾,利用统计图表可以显示样本数据的特征,统计图,条形统计图,折线统计图,扇形统计图,茎叶图,数据的特征除了利用统计图表外,还可以利用一些统计量(多个数据“加工”为一个数值)来表述,使这个数值能反映这组数据的某些重要的整体特征。前面我们在表示数据的集中趋势和离散程度时,我们利用平均数、中位数,众数、极差、方差等来表示。,就是一组数据的平均,设有n个数据,x1,x2,xn,这组数据的平均数为:,特别地,如果上面n个数据中不同数据x1,x2,xn的个数分别为k1,k2,kn,那么它们的平均数为,常用的特征数,一、复习:,1、平均数:,
2、就是一组数据按照从小到大或从大到小的顺序进行排列时,处于中间位置的数(或中间两数的平均数)称为这组数据的中位数,奇数个数时,中间那1个,偶数个数时,中间那两个的平均数,就是一组数据中出现次数最多的数,2、中位数:,3、众数:,平均数、中位数或众数反映数据的集中趋势,就是一组数据中最大数与最小数之间的差,就是一组数据中所有数与平均数的差的平方和的平均数设有n个数据x1,x2,xn,这组数据的方差为:,4、极差:,5、方差:,极差和方差反映数据的离散程度,(1)分别计算该公司员工月工资的平均数、中位数和众数。(2)公司经理会选取上面哪个来代表该公司员工的月工资情况,税务官呢?工会领导呢?,分析:1
3、.根据平均数、中位数的计算公式,可以算出平均数为:1373元,中位数为:800元,众数为:700元,2.不同身份的人代表不同阶层人的利益,对公司领导平均数好,对税务官中位数比较好,对工会领导众数即使他的选择,例1 某公司员工的月工资情况如表:,如果你应聘该公司,你怎样看待公司员工的收入情况?,平均数是将所有的数据都考虑进去得到的度量,它是反映数据集中趋势最常用的统计量;中位数将观测数据分成相同数目的两部分,其中一部分都比这个数小而另一部分都比这个数大,对于非对称的数据集,中位数更实际地描述了数据的中心;当变量是分类变量时,众数往往经常被使用,例2、在上一节中,从甲乙两个城市随机抽取的16台自动
4、售货机的销售额可以用茎叶图表示如下,1甲乙两组数据的中位数众数极差分别是多少?,2你能从上图中分别比较甲乙两组数据的平均数和方差的大小吗?,甲的中位数:20 众数:10 18 30极差:53乙的中位数:29 众数:23 34极差:38,甲的平均数:22.8 方差:210.9乙的平均数:28.6方差:115.2,例3、甲乙两台机床同时生产直径为40mm的零件,为了检验产品的质量,从两台机床生产的产品中个抽取10件进行测量,结果如下:,你能选择适当的数分别表示这两组数据吗?,方法1(极差)甲:0.4 乙:0.2,方法2(方差)甲:,0.026(m),乙,0.006(m),它们的平均数都是40,因此
5、仅用平均水平还难以准确地刻画一组数据,方法3,甲,乙,方法4,甲,乙,用不同的方式刻画数据离散程度,其理想的形式满足一下三条:,1应充分利用数据,以便提供更确却的信息,2仅用一个数据来刻画数据的离散程度,3对于不同的数据,当离散程度大时,该数亦大,问题这么多方式都可以表达,那么什么方式表达最好呢?,方法1(即极差)因为极差对极值过于敏感,显然不满足第一条原则。,方法4、满足理想形式的三条原则,它也是刻画数据离散程度的一种方法。但运算量大。,方法2(即方差)满足理想形式的三条原则,它是刻画数据离散程度的一种方法,但是它的单位是原观测数据的单位的平方。,所以在实际中,人们更多使用的是标准差,方法3
6、(即绝对差)满足理想形式的三条原则,它也是刻画数据离散程度的一种方法。,二、标准差,1、方差的正的平方根,2、公式:,3、优点:,(1)、从数学上来说,二次函数的性质比绝对值函数要好;(2)、单位一致;(3)、比较方便运算。,问题3 分别计算上题中的甲乙车床的标准差?,根据标准差计算公式,甲:s0.16(mm)乙:s0.077(mm),因为甲的标准差比乙大,因此乙更稳定,注意:,对数据数字特征内容的评价,应当更多地关注对其本身意义的理解和在新情境中的应用,而不是记忆和使用的熟练程度因此,在分析数据的过程中,要理解数据的平均值和标准差在此处的意义,再对估计结果作出客观的评判,小结:,1.众数、中位数、平均数的概念2.三种数字特征的优缺点3.极差、方差、标准差的概念4.如何利用标准差刻画数据的离散程度?,1、练习:P31-练习,2、作业:P31习题14第1题,