数据的整理和展.ppt

上传人:小飞机 文档编号:6296746 上传时间:2023-10-14 格式:PPT 页数:16 大小:219KB
返回 下载 相关 举报
数据的整理和展.ppt_第1页
第1页 / 共16页
数据的整理和展.ppt_第2页
第2页 / 共16页
数据的整理和展.ppt_第3页
第3页 / 共16页
数据的整理和展.ppt_第4页
第4页 / 共16页
数据的整理和展.ppt_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《数据的整理和展.ppt》由会员分享,可在线阅读,更多相关《数据的整理和展.ppt(16页珍藏版)》请在三一办公上搜索。

1、第二章 统计数据的整理和展示,统计数据的整理,统计数据的展示,排序,统计分组,频数分布编制,统计表,统计图,第一节 统计数据的整理,统计搜集到的大量资料是分散的,不系统的,只能说明各个单位的特征和属性,必须按照科学的原则加以整理,使之条理化和系统化,成为便于储存和传递的、反映总体特征的数据。是人们对社会经济现象从感性认识到理性认识的过渡阶段。,一、排序 就是把定量数据按从大到小或从小到大的顺序排列,把定性数据按习惯的文字顺序排列,便于我们研究其条理。,二、统计分组,统计分组是根据研究任务的要求和研究现象总体的内在特点,把现象总体按某一标志划分为若干性质不同但又有联系的几个部分。其目的:揭示现象

2、内部各部分之间存在的差异,认识它们之间的矛盾,表明事物的本质与规律。,分组的性质兼有分和合双重含义(组内同质性,组间差异性)。,分组的原则:穷尽原则,互斥原则。,分组前,分组后,25,33,42,2、研究总体结构,例:上海市按GDP计算的三次产业结构(%)1980年 1990年 1996年 1997年 GDP 100 100 100 100 第一产业 3.2 4.3 2.5 2.3 第二产业75.7 63.8 54.5 52.2 第三产业21.1 31.9 43.0 45.5,1、划分现象类型,分组的作用:,例:按所有制性质划分,我国现有8种经济类型:,3、研究现象之间的依存关系,例:中国农民

3、家庭按收入分组的恩格尔系数(1984年),按收入分组(元)200 300 400 500 600 800 1000恩格尔系数(%)64.9 60.2 56.7 54.4 50.5 49.9 43.6,三、频数分布(分布数列、分配数列)编制,编制频数分布的关键:,分组变量的选择,选择与研究的问题有关的变量,组限的确定,应遵循穷尽和互斥原则,是一种重要的分组资料,反映总体单位在各组的分布状态。是各组单位数按顺序排列所形成的数列。,由组别和频数(单位数、次数)两部分组成。,分组,频数,频率,合计,100,(二)变量数列编制:分为单项数列和组距数列两种形式。,单项数列:即变量的一个取值为一组,适用于离

4、散型变量,并且变量的取值较少。,组距数列:即每一组有一个上限值和一个下限值所形成的区间,适用于连续性变量,或离散型变量且变量的取值较多的情况。,(一)定性数列编制:组限的确定一般比较简单。,如人口按性别分组、企业按所有制分组等,1.确定组数 要符合现象的实际情况,充分反映总体分布的特点。,2.确定组距:组距为上限与下限之差。等距数列数据分布均匀。异距数列数据分布不均匀。,3.确定组限,应能把现象的不同类型划分出来。要考虑到数据是连续性变量还是离散型变量。无法确定实际数据的取值范围,或者数据中存在极端数值,可采用开口组的形式。,(三)累计频数(或频率)向上累计:各组上限以下的频数(或频率)向下累

5、计:各组下限以上的频数(或频率),(四)确定组中值 闭口组组中值=(上限下限)2(=上限-组距/2=下限+组距/2)缺下限开口组组中值=上限-邻近组组距/2缺上限开口组组中值=下限+邻近组组距/2,第二节 统计数据的展示,当统计数据比较多时,就应该制作表格或者图形进行来展示,使数据的重要特性能从表格或者图形中直观地反映出来,这样可提高分析数据和解释数据的效率。,一、统计表,是把统计数据用表格的形式展示出来。,类型:,按作用分,调查表,按数据所属的时间分,截面数据表时间序列表,汇总整理表,计算分析表,按分组变量的多少分,单变量分组表多变量分组表,平行形式交叉形式,二、统计图,统计图形通常可比统计

6、表格更生动地描述数据。,类型:,1、饼图是以整个圆的360度代表全部数据的总和,按照各类组所占的百分比(频率),把一个“饼”切割为各个扇形。适用于定性数据。,50家门店按区域分组的饼图,2、条形图中,每一分类组表示成一个条,条的长度代表了这个组中所含数据的频数或频率。适用于定性数据。,50家门店数按区域分组的条形图,50家门店按区域并按人数分组的分段比例条形图,3、直方图与条形图相似,是在每个分组区间上绘制一个长条形而产生的图形,它可以用来描述已表示成频数或频率的数据。适用于定量数据。,根据表2-5的等距数列,对于异距数列,以组距为宽,以频数(频率)密度为高来绘制直方图,4、折线图。可以在直方

7、图基础上绘制。绘制频数分布折线图时,将直方图的每个长方形的顶端中点用折线连接而成,或用组中值与频数(或频率)求坐标点连接而成。,根据图2-6的直方图绘制的折线图,绘制累计频数(频率)分布折线图时:由小到大折线图,是从最小值的下限开始,连接各组上限与该组累计频数(频率)所形成的坐标点而成。由大到大折线图,是连接各组下限与该组累计频数(频率)所形成的坐标点及最大值的上限而成。,5、曲线图当变量的取值非常多,变量数列的组数无限增多时,折线便趋于一条平滑的曲线,这是一种概括描述变量数列分布特征的理论曲线。,6、枝叶图是探索性数据分析中的一种方法,也是对一批数据进行组织整理的很有价值的一个工具,可用以了解一批数据中由所有观测值构成的数据的取值范围是如何分布的。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号