【教学课件】第三章统计数据的整理和显示.ppt

上传人:牧羊曲112 文档编号:5661005 上传时间:2023-08-07 格式:PPT 页数:102 大小:980KB
返回 下载 相关 举报
【教学课件】第三章统计数据的整理和显示.ppt_第1页
第1页 / 共102页
【教学课件】第三章统计数据的整理和显示.ppt_第2页
第2页 / 共102页
【教学课件】第三章统计数据的整理和显示.ppt_第3页
第3页 / 共102页
【教学课件】第三章统计数据的整理和显示.ppt_第4页
第4页 / 共102页
【教学课件】第三章统计数据的整理和显示.ppt_第5页
第5页 / 共102页
点击查看更多>>
资源描述

《【教学课件】第三章统计数据的整理和显示.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第三章统计数据的整理和显示.ppt(102页珍藏版)》请在三一办公上搜索。

1、第三章 统计数据的整理与显示,第一节 统计数据的整理概述第二节 统计数据分组第三节 频数分布第四节 数据的显示,第一节 统计数据整理概述,一、数据整理(一)概念手工整理条件电子计算机整理条件,(二)作用从认识论看,整理,总体,个体,从统计工作看,是调查的继续,分析的前提.,二、数据整理的内容,设计统计整理方案数据的预处理数据处理编制统计表,三、统计数据的预处理,数据的审核发现数据中的错误数据的筛选找出符合条件的数据数据排序升序和降序发现数据的基本特征,数据的审核(原始数据),审核的内容完整性审核检查应调查的单位或个体是否有遗漏所有的调查项目或指标是否填写齐全准确性审核检查数据是否真实反映客观实

2、际情况,内容是否符合实际,一组假冒的数据,一名癌症研究中心的研究者有一次因为伪造数据受到了谴责。他的数据中包含的数字来6组老鼠,每一组老鼠有20只。这些数据表示每一组老鼠的存活率:53%,58%,63%,46%,48%,67%。这组数据的主要缺陷是什么?存活率应该是5的倍数。,数据的审核,审核数据准确性的方法逻辑检查从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象主要用于对定性数据的审核计算检查检查调查表中的各项数据在计算结果和计算方法上有无错误主要用于对定量数据的审核,数据的筛选,数据筛选的内容包括:将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种

3、特定条件的数据筛选出来,数据的排序(要点),按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索排序有助于对数据检查纠错,以及为重新归类或分组等提供依据在某些场合,排序本身就是分析的目的之一排序可借助于计算机完成,数据的排序(方法),1.定类数据的排序字母型数据汉字型数据2.定距和定比数据的排序递增排序递减排序,第二节 统计数据分组,一、统计数据分组的含义 含义:对总体“分”;对总体单位“合”组内同质,差异减小;组间异质,差异变大。,分组,二、统计分组的类型,(一)根据分组标志的性质,1.属性分组(按品质标志),为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问

4、题做了邮寄问卷调查,其中的一个问题是“您比较关心下列哪一类广告?”1商品广告;2服务广告;3金融广告;4房地产广告;5招生招聘广告;6其他广告。,2.变量分组(按数量标志),(二)简单分组、复合分组和分组体系,1.简单分组,劳动人事系的学生,人力资源专业,社会保障专业,将总体按一个标志进行分组,2.复合分组,将总体按照两个或两个以上的标志加以重叠分组,劳动人事系的学生,人力资源专业,社会保障专业,男生,男生,女生,女生,3.分组体系 按照两个或两个以上的标志对总体加以平行分组。对北京物资学院的学生按性别、年级、年龄分组:1)性别分组:男生、女生2)按年级分组:大一、大二、大三、大四3)按年龄分

5、组:18岁以下,1820岁、2022岁、22岁以上,三、统计数据分组的原则和方法,(一)统计数据分组的原则1.穷尽原则2.互斥原则3.反映事物本质原则,(二)分组标志的选择(三)分组界限的划分 自然形成的组界 需要人为界定组界,四、国民经济统计中常用的分类,(一)经济成份分类 公有经济、非公有经济(二)登记注册类型分类 内资企业、港澳台投资企业、外商投资企业(三)国民经济行业分类 16个门类、92个大类、368个中类、846个小类(四)三次产业分类 第一产业、第二产业、第三产业(五)机构部门分类 非金融企业部门、金融企业部门、政府部门、住户部门,五、统计数据分组的应用,在一项城市住房问题的研究

6、中,研究人员在甲城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1非常不满意;2不满意;3一般;4满意;5非常满意。,(一)应用数据分组划分现象的类型,(二)应用数据分组反映现象的内部结构,(三)应用数据分组研究现象之间的依存关系,第三节 频数分布,把所有数据或总体单位按组归并、排列、形成所有数据或总体的各单位在各组间的分布。,频数分布,一、频数分布及种类,(一)品质频数分布(品质数列),按属性(品质标志)分组后形成的频数分布。适用范围:对品质数据或者定性数据分组。,“您比较关心下列哪一类广告?”,按照变量(数量标志)分组后形成的分布数列。对定量数据或者数量数据分

7、组。,(二)变量频数分布(变量数列),分组方法,1.单项数列 例:某生产车间50名工人每小时加工零件数如下(单位:个)。试采用单变量值对数据进行分组。,12 12 12 12 12 12 12 12 13 13 13 13 13 13 13 13 1314 14 14 14 14 14 14 14 14 1415 15 15 15 15 15 15 15 15 15 15 1516 16 16 16 16 16 16 16 16 16 16,单变量值分组的特点,1.将一个变量值作为一组2.适合于离散变量3.适合于变量值较少的情况,2.组距数列,117 122 124 129 139 107 1

8、17 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121,【例3.3】某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。,组距分组的几个概念,1.下 限:一个组的最小值2.上 限:一个组的最大值3.组 距:上限与下限之差4.组中值:下限与上限之间的中点值,组距分组的种类,等距分组:上下

9、组限重叠适用于连续数据和离散数据上下组限间断适用于离散数据开口组适用于离散和连续数据不等距分组:异距数列上下组限重合、上下组限间断、开口组,组距分组的特点,将变量值的一个区间作为界限适合于变量值较多的情况必须遵循“不重不漏”的原则可采用等距分组,也可采用不等距分组,二、累计频数和累计频率,从小到大或从低到高,从大到小或从高到低,注意:累计频数和累计频率只适用于测量尺度在定序以上的数据,三、频数分布的编制,(一)品质频数分布的编制适用条件:定性数据,定类数据的整理与显示,定类数据的整理(基本过程),1.列出各类别,3.制作频数分布表4.用图形显示数据,定类数据的整理(可计算的指标),1.频 数:

10、落在各类别中的数据个数2.频 率:不同类别数值的比值,定类数据整理频数分布表(实例),【例3.1】为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了邮寄问卷调查,其中的一个问题是“您比较关心下列哪一类广告?”1商品广告;2服务广告;3金融广告;4房地产广告;5招生招聘广告;6其他广告。,定类数据的图示圆形图(由 Excel 绘制的圆形图),定类数据的图示圆形图(圆形图的制作),也称饼图,是用圆形及园内扇形的面积来表示数值大小的图形主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用在绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形面积表示,这些扇形的中

11、心角度,是按各部分百分比占3600的相应比例确定的例如,关注服务广告的人数占总人数的百分比为25.5%,那么其扇形的中心角度就应为360025.5%91.80,其余类推,定类数据的图示条形图(由 Excel 绘制的条形图),定类数据的图示条形图(条形图的制作),条形图是用宽度相同的条形的高度或长短来表示数据变动的图形条形图有单式、复式等形式在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图,定序数据的整理与显示,定序数据的整理(基本过程),1.列出各类别,3.制作频数分布表4.用图形显示数据,定序数据的整理(可

12、计算的指标),1.累计频数:将各类别的频数逐级累加2.累计频率:将各类别的频率(百分比)逐级累加,定序数据频数分布表(实例),【例3.2】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1非常不满意;2不满意;3一般;4满意;5非常满意。,定序数据的图示累计频数分布图(由 Excel 绘制的累计频数分布图),图3-3 甲城市家庭对住房状况评价的累积频数分布,(二)变量频数分布的编制,1.单项数列的编制适用条件:离散变量、变量值的种类较少。步骤:将变量值排序,确定分组数计算每个变量值出现的次数和频率绘制频数分布表,1.单

13、项数列 例:某生产车间50名工人每小时加工零件数如下(单位:个)。试采用单变量值对数据进行分组。,12 12 12 12 12 12 12 12 13 13 13 13 13 13 13 13 1314 14 14 14 14 14 14 14 14 1415 15 15 15 15 15 15 15 15 15 15 1516 16 16 16 16 16 16 16 16 16 16,2.组距数列的编制,适用条件:离散变量(变量值多)、连续变量步骤:1)求出全距(range)全距=最大值-最小值 最大值:98,最小值:49 全距:98-49=49分,2)确定组距和组数 可以根据经验以5的倍

14、数作为组距,例如5、10、15 等。计算组距的经验公式i=R/(1+3.322lgN)i=49/(1+3.322lg30)=8.310分 组数=全距/组距 组数=49/10 5组,3)确定组限为了符合习惯,每组的上限和下限最好是5的倍数。最小组的下限一定要小于最小值,最大组的 上限一定要大于最大值。组限一定要把不同性质的总体单位区分开。如果存在极端值可以采用开口组如果上下组限连续,要遵守上限不包括原则。60分以下,6070,7080,8090,90100。,4)归组并计算各组的次数 60分以下:3人,6070:5人,7080:9人,8090:8人,90100:5人。5)显示出次数分布表,频数分

15、布表的编制(实例),117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121,【例3.3】某生产车间50名工人日加工零件数如下(单位:个)。对数据进行分组。,步骤:(等距上下限重合)1)求出全距(range)全距=最大值-最小值 最大值:139,最小值:107 全距

16、:139-107=322)确定组数和组距 分为7组,组距5,3)确定组限 105-110 110-115 115-120 120-125 125-130 130-135 135-140 4)归组并计算各组的次数 105-110:3 110-115:5 115-120:8 120-125:14 125-130:10 130-135:6 135-140:45)显示出次数分布表,影响次数分布的因素有哪些?,组距、组数组限、组中值,分组数据直方图(等距直方图的绘制),频数(人),15,12,9,6,3,日加工零件数(个),图3-5 某车间工人日加工零件数的直方图,我一眼就看出来了,大多数人的日加工零件

17、数在120125之间!,15,12,9,6,3,140,日加工零件数(个),图3-5 某车间工人日加工零件数的直方图,不等距直方图的绘制,频数(人),次数密度(频数密度),等距数列频数(频率)密度,3,2.5,2,1.5,1,日加工零件数(个),等距直方图的绘制,频数密度(人/个),不等距数列频数(频率)密度,不等距直方图的绘制,3,2.5,2,1.5,1,140,日加工零件数(个),图3-5 某车间工人日加工零件数的直方图,频数密度(人/个),分组数据直方图(直方图的制作),用矩形的宽度和高度来表示频数分布的图形。在直角坐标中,用横轴表示数据分组,纵轴表示频数(密度)或频率(密度),各组与相

18、应的频数就形成了一个矩形,即直方图(Histogram),分组数据直方图(直方图与条形图的区别),条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的矩形的高度表示每一组的频数(密度)或频率(密度),宽度则表示各组的组距,其高度与宽度均有意义直方图的各矩形通常是连续排列,条形图则是分开排列,15,12,9,6,3,105,110,115,120,125,130,135,140,日加工零件数(个),频数(人),分组数据折线图(折线图的绘制),图3-6 某车间工人日加工零件数的折线图,分组数据折线图(折线图的制作),折线图也称频数多边形图(Frequency polyg

19、on)是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴,曲线图,频数(人),105 110 115 120 125 130 135 140,四、频数分布的类型,几种常见的频数分布,第四节 数据的显示,一、统计表 Statistical table(一)统计表的结构,横标题,总标题,数字资料,纵标题,宾词,主词,(二)统计表的种类按用途分:调查表、整理表、分析表按组此是否分组和分组的情况:简单表总体单位都显示在

20、统计表中 分组表按一个标志把总体单位分组后形成的统计表复合表按两个或两个以上的标志把总体单位分组后形成的统计表,(三)统计表设计的原则和方法,数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明表中的上下两条横线一般用粗线,其他线用细线通常情况下,统计表的左右两边不封口表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一对于没有数字的表格单元,一般用“”表示必要时可在表的下方加上注释,二、统计图,频数(人),15,12,9,6,3,直方图,条形图,折线图,15,12,9,6,3,105,110,115,120,125,130,135,140,频数

21、(人),图3-6 某车间工人月奖金的折线图,圆形图,环形图,时间序列数据曲线图(实例),【例3.5】已知19911998年我国城乡居民家庭的人均收入数据如表3-11。试绘制线图,¥,时间序列数据(由 Excel 绘制的曲线图),多变量数据雷达图,【例3.6】2006年我国城乡居民家庭平均每人各项生活消费支出数据如表3-12。试绘制雷达图。,今天的主食是面包,多变量数据雷达图(实例),【例3.7】为研究某条河流的污染程度,环保局分别在上游、中游和下游设立取样点,每个取样点化验水中的五项污染指标,所得数据如表3-13。将各指标用雷达图表示出来,并分析该河流的主要污染源。,多变量数据雷达图(由 Excel 绘制的对数坐标雷达图),脸谱图:你对相信明星用过的他们代言的药品个保健品吗?,不相信,感觉他们是在演戏95.5%半信半疑 4.1%相信,他们真的对产品有切身感受0.4%,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号