《数据的整理和展示.ppt》由会员分享,可在线阅读,更多相关《数据的整理和展示.ppt(14页珍藏版)》请在三一办公上搜索。
1、第二章,数据的整理和展示,本章主要内容,第一节 统计数据的整理第二节 统计数据的展示,本章重难点重点:统计分组以及组距数列的编制难点:组距数列的编制,并运用各种图表 来展示数据,第一节 统计数据的整理,一、排序二、统计分组 1、统计分组的概念 定性数据:依据属性的不同将数据划分成若干个组 定量数据:依据数值的不同将数据划分成若干个组 2、统计分组的原则:互斥原则和穷尽原则 3、统计分组的结果 使组内各单位的差异减小,组与组之间有明显的差异性 形成有序的、层次分明的、能显示总体数量 特征的数据资料,图示,三、频数分布 1、频数分布的概念 在统计分组的基础上,汇总计算各组单位数(频数或次 数),就
2、形成了一组数据的频数分布,也称为分配数列。2、频数分布的基本形式 由各组的分组形式与各组的频数组成,分组,频数(次数),频率(),合计,100,累计频数,累计频率,例,三、频数分布 3、频数分布的分类 定性数列:按定性数据分组形成的 定量数列:按定量数据分组形成的 单项数列:每组只有一个变量值 适用于离散型变量,且变量取值不多 组距数列:每组的变量取值是一个区间 适用于取值较多的离散型变量 和所有的连续型变量,三、频数分布 4、组距数列的编制(1)组数的确定(2)组距的确定(上限下限)等距数列:各组组距都相等 P23表25 异距数列:各组组距不全相等 P24表26(3)组限的表示 开口组:第一
3、组有上限无下限(“以下”),或 最后一组有下限而无上限(“以上”)闭口组:离散型变量:【下限,上限】连续型变量:【下限,上限),三、频数分布 5、组中值(1)组中值的概念 组中值是各组变量值的代表值 通常为上下限的算术中点(2)组中值的假定前提 各组变量值的分布是均匀或对称的(3)组中值的计算公式 组中值(上限下限)/2 组中值下限组距/2 组中值上限组距/2,第二节 统计数据的图表展示,一、统计表 1、按统计表的作用分 调查表、汇总整理表、计算分析表 2、根据统计表所属时间分 截面数据表和时间序列表 3、根据分组变量的多少分 单变量表和多变量表,二、统计图 1、饼图 以整个圆的360度代表全
4、部数据的总和,按照各类型 组所占的频率,把这个“饼”切割为各个扇形。2、条形图 在条形图中,每一个类型组表示成一个条,条的长度 代表了各组所含数据的频数或频率(宽度取相等)。饼图和条形图主要适用于定性数据,二、统计图 3、直方图 等距数列:在平面坐标系中,以横轴标示各组组距,纵轴标示各组频数或频率绘制直方图。异距数列:以组距为宽,以频数密度为高绘制直方图。频数密度频数组距 4、折线图 方法一:在直方图的基础上,将每个长方形的顶端的 中点用折线连接而成 方法二:用组中值与频数求坐标点连接而成,图示,图示,二、统计图 5、曲线图(1)钟形分布:靠近中间的变量值多,靠近两端的变量值少 对称分布:正态
5、分布是对称分布的特例 左偏分布:变量值存在极小值,分布曲线向左延伸 右偏分布:变量值存在极大值,分布曲线向右延伸(2)U型分布:靠近中间的变量值少,靠近两端的变量值多(3)J型分布 正J型分布:变量值越大,次数就越多 反J型分布:变量值越大,次数就越少,图示,返回1,返回2,返回3,返回,25,33,42,分组前,分组后,50名学生考试成绩分布表,合 计,50,5,16,33,44,成绩(分),频数,频率,频数,频数,频率,频率,由小到大累计,由大到小累计,5111711 6,506060707080809090100,1022342212,10,32,66,88,100,6,17,34,45,50,12,34,68,90,100,50,100,组中值,55,65,75,85,95,返回1,返回2,