统计数据的整理和显示(老教材).ppt

上传人:小飞机 文档编号:6599343 上传时间:2023-11-16 格式:PPT 页数:53 大小:484.50KB
返回 下载 相关 举报
统计数据的整理和显示(老教材).ppt_第1页
第1页 / 共53页
统计数据的整理和显示(老教材).ppt_第2页
第2页 / 共53页
统计数据的整理和显示(老教材).ppt_第3页
第3页 / 共53页
统计数据的整理和显示(老教材).ppt_第4页
第4页 / 共53页
统计数据的整理和显示(老教材).ppt_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《统计数据的整理和显示(老教材).ppt》由会员分享,可在线阅读,更多相关《统计数据的整理和显示(老教材).ppt(53页珍藏版)》请在三一办公上搜索。

1、第三章 统计资料论,6学时,课前练习,1调查表在形式上一般有哪三个方面()A指标名称、计量单位、数值B栏号、计量单位、填表者C表头、表体、表脚D调查单位、调查项目、调查标志,课前练习,2下列调查中,调查单位与报告单位一致的是()企业设备调查人口普查工业企业现状调查农村耕畜调查,课前练习,将统计总体按某一标志分组的结果表现为()A组内同质性,组间差异性B组内差异性,组间差异性C组内同质性,组间同质性D组内差异性,组间同质性,课前练习,4某连续变量,其末组的组限为“500”以上,又知其邻组的组中值为460,则末组的组中值应为多少(),课前练习,统计调查方案的主要内容包括下列哪些方面()A确定调查的

2、目的和任务B确定调查对象和调查单位C确定调查项目、拟定调查表式或调查问卷D确定调查时间和方法E确定调查人员,课前练习,判断统计调查中的调查单位与填报单位是一致的。()统计是研究事物的数量特征,而不去研究其质的规定性。()典型调查时专门组织的一次性的全面调查。(),一、数据整理及其类型,统计数据整理(Statistical data arrangement)就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。根据数据搜集的方式和研究任务不同,统计数据的整理可以分为下列三种:定期统计报表数据的整理 统计台帐:为整理统计数据和进行统计分析而专门设

3、置的一种系统积累统计资料的表册。专题性统计数据的整理。根据专题研究的目的确定整理的内容和题目,注意资料的时效性、广泛性、政策性。历史统计数据的整理。对本部门、本单位的历史统计数据按照研究目的的要求,进行系统的加工和处理。,二、数据整理的原则和内容,(一)原则目的性原则按目的整理综合指标联系性指标之间有联系,有逻辑关系简明性同一资料有不同整理方法,选简明方法(二)内容 根据目的和要求,确定应该整理的指标,并根据分析的需要确定具体的分组。对大量原始数据进行预处理。对各指标进行汇总,计算出各组单位数,总体单位数以及各组、总体的有关标志值之和。将汇总整理的数据编制成统计表。对统计数据分门别类地系统积累

4、。,三、数据的预处理,数据的预处理是数据整理的先行步骤,它是在对数据分类或分组之前对原始数据和二手数据所做的必要处理,包括对数据的审核、订正和排序。(一)数据的审核准确性、及时性、完整性、适用性准确性是审核的重点。审核方法有计算检查和逻辑检查两种。逻辑检查是审核调查数据的内容是否合理、有无相互矛盾和不符合实际的地方。计算检查是通过计算来复核表中的各项数值有无差错,各项指标的计算方法是否恰当,计量单位是否正确,有关指标之间的平衡关系是否得以保持等。审核数据的及时性,是审核数据是否符合调查时间,数据的报送是否及时,并找出未按时报送的原因。,三、数据的预处理,(一)数据的审核审核数据的完整性,即审查

5、搜集的数据能否达到规定的调查单位数目,调查资料中的各项目是否填写齐全。数据适用性的审查主要是针对第二手数据。二手数据已经是专门处理过的,首先弄清数据来源、数据的计算口径和有关的背景资料,以便确定这些数据是否符合分析研究的需要,是否需要重新进行加工整理等。,三、数据的预处理,(二)数据的订正审核中发现迟报、漏报及计算错误,应及时催报、补报、改正。针对不同的错误作出不同的处理:对于可以肯定地一般错误,即代为更正,并向有关单位核对。对于可疑之处或无法代为更正的错误,应通知原报单位复查更正。对于在一个单位发现的有代表性的重大差错,除通知原报单位更正外,还要将差错情况通报尚未报送资料的单位,以防止类似错

6、误发生。错误情节属于违反统计法规的,应查明责任,予以适当处理。,三、数据的预处理,(三)数据的排序数据排序就是按照一定的顺序将数据排列,以便初步显示数据的一些明显特征和规律。定类数据,可以按字母或笔画排序。定距定比可以按递增,递减排序。,第二节统计数据分组,一、统计数据分组的含义统计数据分组(Statistical data grouping)是指根据统计研究的目的和要求,将总体单位或全部数据按照一定的标志划分成若干类型组,使组内的差异尽可能小,组间的差别尽可能明显,从而使大量无序的、混沌的数据变为有序的、反映总体特征的资料。例如:按性别、民族、文化程度分类。,二、统计数据分组的类型,(一)属

7、性分组和变量分组属性分组(Attributive grouping)是按照反映事物的属性和品质标志来进行的分组,例:按性别、民族、文化程度、职业分组。变量分组(Variable grouping)是指按照数量标志进行的分组。组限是指各种不等的变量值。,二、统计数据分组的类型,(二)简单分组、复合分组和分组体系简单分组(Simple grouping):就是将总体按一个标志进行的分组。复合分组(Composite grouping):按照两个或两个以上的标志对总体加以重叠的分组,所谓重叠的分组,是指在前一次分组结果的内部再进行下一次分组。分组体系(Grouping system):是按照两个或两

8、个以上的标志对总体加以平行的分组,从不同的侧面分别说明总体的特征。,三、统计数据分组的原则和方法,(一)原则穷尽原则:分组时每一个总体单位都应有组可归,各个组要有足够的空间容纳总体的所有单位。互斥原则:组与组之间在涵义上和口径上不能发生重叠。反映事物本质的原则:使分组的结果尽量反映事物的本质特征,突出各组之间质的差异。,三、统计数据分组的原则和方法,(二)分组标志的选择Classification characteristic:统计数据分组时所依据的标志。(三)分组界限的划分Grouping ambit:组限分明:例如性别、党派属性有过渡、复杂、依据分类目录,四、国民经济统计中的常用分类,(一

9、)经济成分:公有、非公有(二)登记注册类型:内资、港澳台、外商投资(三)国民经济行业:A-P(四)三次产业:农林牧渔、工业建筑、流通服务(五)机构部门:非金融、金融、政府、住户,五、统计数据分组应用,应用数据分组划分现象类型研究不同类型现象的特征。反映现象内部结构计算各组比重,反映总体内部结构。研究现象之间的依存关系有助于人们全面、深刻地认识事物。先按一个标志分组,再计算另一个标志在各组的数值,据以观察它们之间的相互依存关系。,第三节 频数分布,一、频数分布及其种类Frequency distribution:在分组的基础上,把所有数据或总体单位按组归并、排列、形成所有数据或总体各单位在各组间

10、的分布,又称分布数列。频数分布两部分组成:组别、频数f和频率性质:,一、频数分布及其种类,(一)品质分布经过属性分组、组别表现为一系列的概念和范畴。(二)变量分布经过变量分组,组别表现为不同的数值或数域。单项数列:以一个变量值为一组。组距数列:以表示一定变动范围的两个变量构成的组。各组组距相等叫等距数列,不等叫异距数列。组距=上限-下限 组中值=(上限下限)/2缺下限的组的组中值=上限-相邻组的组距/2缺上限的组的组中值=下限+相邻组的组距/2,频数分布表实例Frequency Distribution Table Example,原始数据:24,26,24,21,27,27,30,41,32

11、,38,组界,(上界+下界)/2,组距,组别,组中值,频数,15 且 25,20,3,25 且 35,30,5,35 且 45,40,2,二、累积频数和累计频率,Cumulative frequency和cumulative absolute frequency:将变量频数分布中各组频数或频率依次累加而得到的各组频数或频率。向上累计:变量值低组高组向下累计:变量值高组低组,三、频数分布的编制,数列的编制过程实质上是分组与汇总的过程。(一)品质频数分布的编制首先按品质数列对总体作属性分组,划分各组界限,属性分组比较简单,分组标志一经确定,组名称和组数也就确定,不存在组与组之间界限划分的困难。分组

12、确定后,再汇总各组单位数,并编成统计表,即得品质数列。,三、频数分布的编制,(二)变量频数分布的编制单项数列的编制对于离散型变量,如果变量值的种类较少且变量的变动范围不大时,可编制单项数列。首先应将各种变量值按大小顺序排列,然后计算各变量值的频数和频率,最后将上述结果以表格的形式表现。组距数列的编制离散变量,若变动幅度不大,变量值的种类较多,则宜编成组距数列。连续变量,可取值难以一一列出,只能编制组距数列。(1)将原始数据大小顺序排列,并确定最大值、最小值和全距(2)确定组距数列的类型。等距or异距。,组距数列的编制,(3)确定组数和组距。组数越多,组距越小。注意考虑组内的同质性。要能反映总体

13、分布的规律,即要体现原始数据分布的集中趋势或离中趋势。组距不能太大或太小。一般在5-15组内。组距最好是5的整数倍。在等距数列情况下,如果总体单位数不是很多,变量变动范围不是很大时,可用斯特吉斯经验公式计算出一个参考组距。,组距数列的编制,(4)确定组限和组限的表示法最小组下限低于或等于最小变量值,最大组上限应大于最大变量值。如果有极端值,可用开口组。组限应有利于表现总体单位分布规律。对于等距数列,如果组距是5的倍数,则每组下限也最好是5的倍数。还应确定组限的表示法是用同限,还是用异限。(5)从最小组依次排列,并分别计算各组频数和其他有关指标,形成分组的统计表。,四、频数分布的类型,1对称分布

14、型正态分布:中间多,两边少,对称。2偏态分布型非对称,右偏(正偏),左偏(负偏)。3U型分布中间少,两边多,人口死亡率分布。4丁型分布 正丁(供给曲线),反丁(需求曲线),第四节 数据的显示,数据的表现形式主要有统计表和统计图。一、统计表(一)统计表的结构统计表(Statistical table)是以纵横交叉的线条组成的表格来表现统计数据的一种形式,或者说统计表是用来反映统计数据的一种表格,例如调查表、整理表、数据积累表、分析表等。总标题、横行标题、纵栏标题、数字资料主词:要说明的对象、总体、总体的各个组、总体单位的名称和时间。宾词:用来说明主词的各个统计指标,包括指标名称和数值。,一、统计

15、表,(二)统计表的种类按用途分:调查表、整理表、分析表。按主词是否分组和分组的情况,分为简单表、分组表、复合表(三)统计表的设计原则和方法科学、实用、简练、醒目、美观1设计表式纵横交叉线条组成的长方形表格。线条的绘制,表左右两端不封口,尽量少横竖线。合计栏。栏数编号。,(三)统计表的设计原则和方法,2内容设计标题设计:简明扼要,内容、数据的空间时间范围。指标数值的填写:数字数位对齐,0补齐,缺数用“”,不该有数用“”,数字栏没有空格。计量单位栏的设计:一个单位写于纵栏标题,小写入括号。全表一个单位写在表的右上方。横行的计量单位可以专设一栏。注解与资料来源:表下方注明资料来源,添加注解或说明。画

16、图举例说明。,二、统计图,统计图用来表现数据的几何图形。遵守如实反映、便于比较、通俗易懂、鲜明醒目、灵活机动的原则。(一)直方图和条形图Histogram:用矩形的宽度和高度表示频数分布,横轴表示数据分组,纵轴表示频数或频率。2 Bar chart:用宽度相同的条形的高度或长度来表示数据的变动。可横置或纵置。纵置也叫柱形图。区别:条形图用条形的长度表示各类别数量的多少,其宽度是固定的,直方图是用面积表示数量的多少。直方图各矩形通常是连续排列,而条形图则是分开排列。,0,1,2,3,4,5,直 方 图Histogram,频数频率百分数,01525354555,下界,柱条接触,计数,类别,频数,1

17、5 25,3,25 35,5,35 45,2,条形图 Bar chart,柱条不接触,二、统计图,(二)折线图和曲线图1折线图,也称频数多边图(frequency polygon)。在直方图的基础上,把相邻直方形的顶边中点连接成一条折线,再把折线两端与横轴上直方形两侧延伸的假象组中点连线,或由组中值与次数求坐标点连接而成。2曲线图(curve chart):用曲线的升降起伏来表示被研究现象的变动情况及其趋势。分为频数分布曲线图,动态曲线图,依存关系曲线图。,0,1,2,3,4,5,多边形图 Polygon,中点,虚拟的外推组,0102030405060,组别,频数,15 25,3,25 35,

18、5,35 45,2,频数频率百分数,计数,八城市现代化管理综合评价排序表,折线图,曲线图curve chart,二、统计图,(三)圆形图和环形图1圆形图pie chart,又称饼图。以圆的面积或圆内各扇形的面积来表示数值大小或总体内部结构的一种图形。圆形比较图、圆形结构图、圆形结构比较图。360度*各组频率圆形结构图通过圆内各扇形的面积来反映总体中各组成部分所占的比例。,圆形结构图,圆形结构图,二、统计图,2环形图:可以同时绘制多个总体的数据系列,每一个数据系列为一个环,可以显示多个总体部分所占的相应比例。有利于进行比较研究。,环形图,二、统计图,(四)雷达图Radar chart 多指标的图

19、示方法。N组样本S1,S2,Sn,每个样本测得P个变量X1,X2,XP,要绘制P个变量的雷达图,做法:先画一个圆平分P份,得到P个点,让P个点对应P个变量,再将这P个点与圆心连线,得到P个辐射状的半径,作为P个变量的坐标轴,每个变量值的大小用半径上的点到圆心的距离表示,将同一个样本的值在P个坐标上的点用线段连接,这样N个样本形成的N个多边形即雷达图。,八城市市民公共道德和法律意识调查统计表,雷达图,课上练习1,某百货公司连续40天的商品销售额(单位:万元)如下:41 25 29 47 38 34 30 38 43 4046 36 45 37 37 36 45 43 33 44 35 28 46

20、 34 30 37 44 26 38 4442 36 37 37 49 39 42 32 36 35要求:根据上面的数据进行适当分组,编制频数分布表,并绘制直方图。,课上练习2,某行业管理局所属40个企业1999年的产品销售收入数据(单位:万元)如下:152 124 129 116 100 103 92 95 127 104105 119 114 115 87 103 118 142 135 125117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126要求:(1)根据上面的数据进行适当分组,编制频数分布表,并计算出累积频数和累积频率。(2)按规定,收入在125万元以上为先进企业,115125万元为良好企业,105115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业分组。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号