统计学概念和方法-第3章.ppt

上传人:牧羊曲112 文档编号:6056645 上传时间:2023-09-18 格式:PPT 页数:31 大小:340KB
返回 下载 相关 举报
统计学概念和方法-第3章.ppt_第1页
第1页 / 共31页
统计学概念和方法-第3章.ppt_第2页
第2页 / 共31页
统计学概念和方法-第3章.ppt_第3页
第3页 / 共31页
统计学概念和方法-第3章.ppt_第4页
第4页 / 共31页
统计学概念和方法-第3章.ppt_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《统计学概念和方法-第3章.ppt》由会员分享,可在线阅读,更多相关《统计学概念和方法-第3章.ppt(31页珍藏版)》请在三一办公上搜索。

1、数学与信息科学学院 王 坤,第三章 数据的表述:图和表,统计学概念和方法,一旦数据被收集后,我们必须在它们中寻找所包含的信息。虽然我们可以看到数据文件中的数据,但是无法全部理解它们。因此,我们要想办法从数据中提取信息。这就意味着,我们需要通过图、表、和计算来分析数据。统计图是根据统计数字,用几何图形、事物形象和地图等绘制的各种图形。它具有直观、形象、生动、具体等特点。统计图可以使复杂的统计数字简单化、通俗化、形象化,使人一目了然,便于理解和比较。因此,统计图在统计资料整理与分析中占有重要地位,并得到广泛应用。,本章要点,图:画出数据分类变量:饼图和条形图度量变量:点图和直方图根据数据做图作图:

2、优秀的标准表:改变排列方式可能更合适,3.1图:画出数据,分析数据的一种方法是把它们画出来。作图的两个目的:帮助研究者从数据中提取信息;把信息传给他人。看图说话:一幅图胜过一千个文字。,3.2 分类变量:圆饼图和条形图,分类变量 也称定性数据,变量的观测值(转换为数字后)不能被排序,如性别,婚姻状况,满意度等。圆饼图(pie chart)用一个圆及圆内几个扇形的面积来表示数据的频数(频率)分布。每一类数据对应一个扇形,它的中心角等于360o乘以该类变量出现的频率。特点:(1)用扇形的面积表示部分在总体中所占的百分比。(2)易于显示每组数据相对于总数的大小。例:向50个消费者调查“在可口可乐、苹

3、果汁、橘子汁、百事可乐、杏仁露等5种饮料中,您最喜欢喝的是哪一种饮料?”,得到的结果汇总在下表中。,利用Excel软件可以得到以下饼图。,条形图,条形图是用宽度相同的长方形的高低或长短来表示数据变动特征的图形。接上例,饮料口味调查。,竖直条形图,横置条形图,可显示多个水平,条形统计图的特点:(1)能够使人们一眼看出各个数据的大小。(2)易于比较数据之间的差别。(3)能清楚的表示出数量的多少。,3.3 度量变量:点图和直方图,度量变量也称计量变量,我们可以用某一尺度度量其观测值。例如收入数,年龄,时间,高度等。3.3.1 为一个度量变量作图,盒形图,盒形图也称箱形图(boxgram).主要包含六

4、个数据节点,将一组数据从大到小排列,分别计算出他的上边缘,上四分位数,中位数,下四分位数,下边缘,还有一个异常值。,例 某班有31名学生,某门课的考试成绩如下:25,45,50,54,55,61,64,68,72,75,75,78,79,81,83,84,84,84,85,86,86,86,87,89,89,89,90,91,91,92,100,在R语言中输入:x boxplot(x),茎叶图,茎叶图(Stem-and-Leaf Diagrams)又称“枝叶图”,由统计学家约翰.托奇turkey设计,它的思路是将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位作为一个主干(茎),将变

5、化大的位的数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。例:下列数据是一个婚姻登记处一周内申请办理结婚证的37个女性的年龄(不一定是初婚)30,27,56,40,30,26,31,24,23,25,29,33,29,22,33,29,46,25;34,19,23,23,44,29,30,25,23,60,25,27,37,24,22,27,31,24,26。,从这些数字我们可以得到什么呢?,利用R软件,我们可以做出下列茎叶图:1|9 2|223333444 2|5555667779999 3|00011334 3|7 4|04 4|6 5|5|6

6、 6|0,左边的枝叶表示年龄的第一位数字,右边的枝叶代表年龄的第二位数字,处于该年龄的新娘有几个则列出几个,x stem(x)The decimal point is 1 digit(s)to the right of the|1|9 2|223333444 2|5555667779999 3|00011334 3|7 4|04 4|6 5|5|6 6|0,注:,用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上

7、的数据虽然能够记录,但是没有表示两个记录那么直观、清晰。,直方图,直方图(Histogram)又称柱状图、质量分布图。是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。一般用横轴表示数据类型,纵轴表示分布情况(如频数、频率等)。将数据取值的范围分成若干区间(一般是等间隔的),在等间隔的情形下,每个区间的长度称为组距。,下面是某班期末成绩统计的直方图。横轴代表分数,组距为10分,纵轴代表频率。,组距对直方图的形态有很大影响,组距太小,每组的频数较少;组距太大,直方图所反映的形态就不灵敏。,Karl Pearson与直方图,Karl Pearson(18571936),生卒于伦

8、敦,公认为统计学之父。K.Pearson 1879年毕业于剑桥大学数学系;曾参与激进的政治活动。出版几本文学作品,并且作了三年的律师实习。1884年进入伦敦大学学院(University College,London),教授数学与力学,从此待在该校一直到1933年。许多熟悉的统计名词如标准差,成分分析,卡方检验都是他提出的。K.Pearson、Galton 与 Weldon 为了推广统计在生物上的应用,于1901年创立统计的元老期刊Biometrika。1895年,K.Pearson在给伦敦的皇家协会发布的讲话中,首次使用了histogram(直方图)这个词语。,为两个度量变量作图,我们常常需

9、要显示两个度量变量的数据,如人们的身高和体重,年龄和收入,新娘和新郎的年龄等。散点图(scatterplot)散点图包括两个轴,横轴和纵轴。横轴和纵轴分别表示一个变量,两个变量的一对观测值在图中用点来表示。例如,下表是24对夫妇结婚年数和每年的吵架次数。,利用Excel软件可做出下面的散点图。,利用散点图可看出两个变量间的关系(线性/非线性)。散点图表示因变量随自变量而变化的大致趋势,据此可以选择合适的函数对数据点进行拟合或者回归分析。,时间序列图,当散点图里的横轴为时间变量时,称此时的散点图为时间序列图。使用它的主要目的是观 察变量是否随时间变化而呈某种趋势。例 已知1990年到2004年我

10、国第三产业的产值(单位:亿元)如下:,根据上表数据在EXCEL中作散点图即可。,作图:优秀的标准,图优性:在最短的时间内用最少的笔墨,在最小的空间里,给读者最多的信息和思想。图表要符合制图人的目的(坐标轴横纵方向单位比例,坐标轴刻度起始数值。)图中垃圾:矩形中的阴影,散点图中的格子,表示数量的符号,点缀图本身的说明。,例 1900-1936年奥林匹克男子跳高比赛的金牌获得者跳高成绩如下表所示。,原理:坐标轴刻度不同,导致视觉效果不同。,用Excel作出时间序列图:,表:改变排列方式可能更合适,表是另外一种用密集的形式归纳数据的方法,它是由写在行和列中的数字组成。表提供的视觉效果和图很不一样;表提供精确的数字,但不能快速使人对数据有印象。表的最下一行或者最右一行须给出各个项目的合计数。表的使用服务于制表人的目的。,3.7 小结,图:画出数据 将一个完整的数据集概括在图中。分类变量:圆饼图和条形图度量变量:茎叶图、盒形图、直方图作图优秀的标准,统计作图软件,Excel统计软件:Spss,R语言,Eviews,SAS等.参考文献:统计建模与R软件.清华大学出版社.定性数据分析.华东师范大学出版社.,赠语,读万卷书不如行万里路,行万里路不如阅人无数,阅人无数不如明师指路。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号