统计学第二章统计数据的搜集、整理和显示.ppt

上传人:牧羊曲112 文档编号:6015802 上传时间:2023-09-14 格式:PPT 页数:78 大小:502.50KB
返回 下载 相关 举报
统计学第二章统计数据的搜集、整理和显示.ppt_第1页
第1页 / 共78页
统计学第二章统计数据的搜集、整理和显示.ppt_第2页
第2页 / 共78页
统计学第二章统计数据的搜集、整理和显示.ppt_第3页
第3页 / 共78页
统计学第二章统计数据的搜集、整理和显示.ppt_第4页
第4页 / 共78页
统计学第二章统计数据的搜集、整理和显示.ppt_第5页
第5页 / 共78页
点击查看更多>>
资源描述

《统计学第二章统计数据的搜集、整理和显示.ppt》由会员分享,可在线阅读,更多相关《统计学第二章统计数据的搜集、整理和显示.ppt(78页珍藏版)》请在三一办公上搜索。

1、第二章 统计数据的搜集、整理和图表展示,教学目的和要求:1.掌握统计调查各组织方式的分类特点和应用;2.掌握统计调查方案设计的内容;3.熟悉各种统计数据的搜集方法;4.掌握数据分组方法和频数分布数列的编制方法;5.掌握各种统计表的结构和表现形式;6.熟悉各种统计图的表现形式;7.熟悉各种统计表的制表规则。,第一节 数据来源和调查第二节 统计数据第三节 数据整理第四节 数据的图表展示,第一节 数据来源和调查,一、调查的基本理论(一)统计调查的概念1、统计数据搜集的概念统计数据搜集就是根据统计任务的要求,运用科学的调查方法,有目的、有计划、有组织地及时搜集各项反映社会经济活动和科学试验成果的统计资

2、料的过程。,2、搜集数据的方法:实验与调查(1).调查:人们为获得社会经济现象的相关数 据,运用相应的调查方法,向客观实际搜集 数字资料的过程,所获数据为调查数据。(2).实验:在实验中控制一个或多个变量,在一 定的控制条件下观察实验对象,从实 验中获得的数据为实验数据,3、搜集的统计数据有两种:(1).原始资料(初始资料):是直接向调查对象搜集反映调查单位情况的统计资料,对原始资料的搜集即为统计调查(2).次级资料(二手资料):根据研究目的,搜集已经加工,整理过的说明总体现象的资料,(二)统计调查的要求,根据统计制度方法的统一规定,统计调查必须达到准确、及时两个基本要求,做到数字准、情况明、

3、反映及时。1、准确性。统计调查的准确性是指提供的统计资料必须符合客观实际情况,保证各项统计资料真实可靠。2、及时性。各项调查资料不但要求准确,而且需要及时,这是很明显的,因为过时的资料落在了形势发展的后面,失去时效,犹如“雨后送伞”起不到统计的真实作用。,统计调查形式示意图,(三)统计调查的种类,1、全面调查与非全面调查统计调查按调查的范围划分,可分为全面调查和非全面调查两大类。(1)全面调查是对调查对象的所有单位一一进行调查。普查、全面统计报表都属于全面调查。,1)普查,概念:普查是专门组织的一次性的全面调查,它主要是用以调查某些不能或不宜用定期的全面报表搜集的统计资料。世界各国一般都定期进

4、行各种普查,以便掌握国情,国力的基本统计数据。普查有主要特点:是一次性或周期性的调查。间隔时间较长。普查要规定统一的标准时点和普查期限。以避免调查数据的重复或遗漏。规定普查的项目和指标,不能随意改变或增减普查的数据较准确,全面,但普查的范围较窄普查的组织形式:组织普查机构或利用调查单位的原始记录和核算资料。,2)全面统计报表制度,概念:全面统计报表制度是依照国家有关法规,自上而下地统一布置,以一定的原始记录为依据,按照统一的表式,统一的指标项目,统一的报送时间和报送程序,自下而上地逐级地定期提供统计资料的一种调查方式。全面统计报表的实施范围,是调查对象的全部单位均要填报。统计报表的主要特点:第

5、一,资料的来源是各个基层单位的原始记录。第二,逐级上报和汇总的。第三,属于经常性(连续性)调查,调查项目相对稳定。,(2)非全面调查:对调查对象其中的一部分单位进行调查。,1)抽样调查。抽样调查是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据所获得的样本数据,对调查对象总体特征作出具有一定可靠程度的推算。A)特点:第一,按随机原则抽取样本。第二,根据部分调查的实际资料对调查对象总体的数量特征作出估计。第三,抽样误差可以事先计算并加以控制。B)适用范围:第一,不可能或不必要进行全面调查的社会现象。第二,对普查资料进行必要的修正。,C)抽样调查的理论基础概率论和数理统计的有关定理。

6、D)抽样调查对数据的要求:所研究的变量是随机变量。E)抽样调查应遵循的原则:第一,随机原则。第二,最大抽样效果原则。,2)重点调查,重点调查:是指在调查对象中,只选择一部分重点单位进行的非全面调查。选择的单位在全部总体中虽然数目不多,所占比重不多,但可以说明整个总体在该标志总量方面的基本情况。优缺点:优点是调查单位少,可调查较多的项目和指标;缺点是不能由重点调查的结果推算总体。重点单位的选择:第一,选多少由调查任务确定;第二,选择时要注意重点可变动;第三,选中单位应是管理健全,统计基础工作较好的单位组织形式:是专门调查的组织形式搜集资料的方法:以企事业单位的原始资料为依据的报告法,3)典型调查

7、,概念:典型调查是一种专门组织的非全面调查。根据调查的目的,在对所研究的对象进行初步分析的基础上,有意识地选取若干具有代表性的单位进行调查和研究,借以认识事物发展变化的规律。有人也认为它是“目的抽样”,以若干具有代表性的单位为样本。特点:第一,调查单位少,能深入实际,深入群众;第二,有意识的选择,对其调查,能取得代表性较高的资料;第三,调查机动灵活。选择:第一,为近似估算总体,可将总体分为若干类型,从每一类型中选择典型单位;第二,总体一般数量表现,可选择中等的典型单位;第三,如为研究成功经验教训,可选择先进或后进的单位。,(二)经常性调查与一次性调查,统计调查按时间标志可分为连续性(经常性)和

8、不连续性(一次性)调查两大类。1、连续性(经常性)调查:是指随着研究现象的变化,连续不断地进行调查登记。如统计报表制度。2、不连续性(一次性)调查:是指间隔一段较长的时间对事物的变化进行一次性调查,如普查、典型调查。,(三)定期报表形式与专门调查,统计调查按组织形式可分为定期报表形式和专门调查。1、定期报表制度是按国家统一规定的表式和内容,定期地向各级领导机构报送统计资料的一种形式。2、专门调查是为某一专题研究而组织的专项调查,如抽样调查、典型调查、普查。,二、调查方案的设计,(一)调查方案的含义 调查方案是指在统计调查工作正式开始之前,应当事先设计一个切实可行、周密细致的数据搜集方案,以指导

9、整个调查工作,使调查得以顺利地实施和完成。调查方案又称数据搜集方案,它是指导整个调查过程的纲领性文件。,(二)统计调查的方案设计(5W1H),1、确定调查目的(why)。(为什么要进行调查,调查要 解决什么问题,是统计调查中的根本性问题)2、确定调查对象和调查单位(根据目的确定who)调查对象:是指需要调查的现象总体,该总体是由许多性质相同的调查单位组成的。调查单位:是指所要调查的具体单位,它是进行调查登记的标志的承担者。报告单位:报告单位亦称填报单位,它是负责向上报告调查内容、提交统计资料的单位。调查单位与报告单位,有时是一致的,有时不一致。3、确定调查项目和调查表(what)(1)确定调查

10、项目。调查项目就是调查中所要登记的调查单位的特征,即调查单位所承担的基本标志,它由一系列品质标志(或称质量标志、属性标志)和数量标志所构成。,在拟定调查项目时要注意以下四个问题:,调查项目要少而精本着需要和可能的原则,只列入能够得到确定答案的项目调查项目之间尽可能保持联系,以便相互核对起到校验作用有的项目可拟定为“选择式”(2)、调查表格和问卷的设计。1)调查表:列出调查项目的表格形式就是调查表。有一览表和单一表两种形式。(包括表头、表体和表外附加)一览表:把许多单位和相应的项目按次序登记在一张表格里的一种统计表,在调查项目不多时用。这种表格优点是每个调查单位的共同事项只需登记一次,缺点是不能

11、多登记调查单位的标志。单一表:一张表格内只登记一个调查单位,项目多时,一张表格可由几张表组成。优点是可容纳较多的标志,缺点是每份表上都要注明时间 地点和其他共同事项。,2).问卷调查:根据调查目的,在调查对象中随 机选择或有意识地确定调查单位,以书面文 字或表格形式了解被调查者的意见,调查者 自愿、自由回答问卷中所提出的问题。这是 一种特殊形式的调查表,主要用于非政府统 计机构或个人的市场调查或社会调查。问卷有 面访与自填两种,其基本结构、问题类型、设 计要求大致相同。基本结构:说明词、问题、作业记录 主题问句类型:开放式问题和封闭式问题 基本要求:主题明确、提问科学、逻辑性强、容量适当,4、

12、确定调查时间(when)。统计调查时间包括二种 涵义,即调查时间和调查期限。调查时间:是指调查资料所属的时点或时期。调查期限:是进行调查工作的时限,包括搜集 资料和报送资料的工作所需的时间。5、确定调查地域范围(where)6、调查的计划实施(how)包括调查人员的选择、组织和培训:调查表格 问卷和调查员手册的印刷;调查工具的准备等。,三、调查体系及应用,(一)统计调查方法体系的含义统计调查方法体系是指以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和少量的全面报表综合运用的调查方法体系。(二)统计调查方法体系的应用,普查和全面报表都是全面调查,但两者不能互相替

13、代。抽样调查虽然是一种非全面调查,但它能够解决全面调查无法或难以解决的问题,抽样调查调查单位少,调查项目就可以多一些,以便对某一社会经济现象进行更深入的研究,也可以节省调查费用,又可以满足统计时效性的要求。所以,我国统计调查体系是以经常性的抽样调查为主体。如果调查任务只要求掌握基本情况,而现象总体中又有部分单位能比较集中地反映研究项目的数量特征,则可采用重点调查。在统计调查体系中,适度地采用了科学的推算方法。,四、现有统计资料的主要来源,1.统计年鉴2.有关期刊3.有关网站,第二节 统计数据,一、数据类型(一)数据的计量尺度 根据对研究对象计量的不同精确程度,人们将计量尺度由低到高、由粗略到精

14、确分为四个层次:定类尺度、定序尺度、定距尺度和定比尺度。(二)数据类型1、横截面数据。是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。2、时间序列数据。是指在不同时间对同一总体的数量表现进行观察而获得的数据。,(三)数据的表现形式,1、绝对数 现象的规模、水平一般以绝对数形式表现。绝对数的计量单位一般为实物单位或价值单位,有时也采用复合单位。2、相对数相对数由两个互相联系的数值对比求得。常用的相对数包括:结构相对数、动态相对数、比较相对数、强度相对数、利用程度相对数、计划完成相对数等。3、平均数平均数反映现象总体一般水平或分布的集中趋势,二、数据误差,(一)数据误差的产生调查数据

15、误差根据其产生的原因可以分为登记性误差和代表性误差。登记性误差是统计过程中的种种工作失误引起的,代表性误差一般指抽样调查误差,是由调查方式本身引起的,不可避免,但可以计算和控制。(二)数据误差的防范为了取得准确的数据资料,必须采取各种措施,具体有:制定科学的统计调查方案。加强对调查人员的培训。建立健全经济核算体系,加强统计基础工作建设。加强对统计资料质量的监督检查。,三、数据的搜集方法,(一)访问调查(二)电话调查(三)邮寄调查(四)座谈会(五)个别深度访问(六)网上调查,第三节 数据整理,一、数据的预处理(一)数据的审核对调查资料进行审核是统计整理的第一步,包括以下内容:1、审核资料的完整性

16、和及时性2、审核资料的正确性:审核资料的正确性,是检查所填报的资料是否准确可靠。常用的审核方法有两种:逻辑检查和计算检查3、历史资料的审核,(二)资料审核后的订正,通过上述审核,如发现有缺报、缺份和缺项等情况,应及时催报、补报;如有不正确之处,则应分别不同情况作如下处理:1、对于可以肯定的一般错误,应及时代为更正,并通知原报单位。2、对于可疑之数或无法代为更正的错误,应要求原单位复查更正。3、如果所发现的差错在其他单位也可能发生时,应将错误情况通报所有单位,以免发生类似错误。4、对于严重的错误,应发还重新填报,并查明发生错误的原因,若属于违法行为,则应依法严肃处理。,二、数据统计整理的内容和程

17、序,(一)统计整理及其作用1、统计整理的含义统计整理就是根据统计研究的目的,对所搜集到的资料进行科学的加工,使之系统化,条理化的工作过程。统计整理即包括对统计调查所得到的原始资料进行整理,也包括对加工过的综合资料,即次级资料进行再整理。2、统计整理的作用(1)通过对第一手资料的加工整理,使之系统化,以便通过综合指标对总体作出概括性的说明。(2)统计整理是整个统计工作和研究过程的中间环节,起着承前启后的作用。(3)统计整理还是积累历史资料的必要手段。,(二)统计整理的内容和程序,统计整理的全过程包括对统计资料的审核、分组、汇总和编制统计图表四个环节,需要按照一定的程序进行:第一步,设计和制定统计

18、整理方案。第二步,对原始资料进行审核。第三步,对经过审核的资料进行分组、并结合汇 总,计算相应的统计指标。第四步,将汇总计算的结果,以统计表或统计图的 形式表现出来。第五步,对统计资料妥善保存,系统积累。,三、统计分组和频数分布,(一)统计分组1、统计分组1)根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。分组标志可为品质标志也可为数量标志。2)分组的性质来说:兼有分和合双重含义。2、统计分组的原则(不重不漏原则)穷尽原则,使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。互斥原则,在特定的分组标志

19、下,总体中的任何一个单位的只能归属于某一组,而不能同时或可能归属于几个组。,3、统计分组的类型,1)按分组标志的多少,可分为简单分组和复合分组。简单分组:就是对研究现象按一个标志进行分组。复合分组:用两个或两个以上标志分组,即先按一个标志分组,在此基础上再按第二个标志分小组,又再层叠地按第三个标志分成更小的组,这称为复合分组。2)按分组的标志的性质不同,分为品质分组(或称属性分组)和数量分组(或称变量分组)。品质分组:按品质(或属性)标志进行分组。品质分组所形成的数列称为品质数列。数量分组:按数量标志分组,数量标志的变异性体现在它不断变动自身的数量上,故也称为变量分组。变量分组所形成的数列称为

20、变量数列。,3)按分组的作用和任务不同,分为类型分组、结构分组和分析分组。,类型分组:把复杂的现象总体,划分为若干个不同性质的部分,就是类型分组。结构分组:在对总体分组的基础上计算出各组对总体的比重,借此研究总体各部分的结构,即结构分组。分析分组:为研究现象之间依存关系而进行的统计分组即分析分组。,4、统计分组的方法,(1)、品质分组的方法。按品质标志分组,有些分组比较简单,分组标志一经确定,组的名称和组数也随之确定。(2)、数量分组的方法。按数量标志分组,应注意如下两个问题:首先,分组时各组数量界限的确定必须能反映事物质的差别。其次,应根据被研究的现象总体的数量特征,采用适当的分组形式,确定

21、相宜的组距、组限。,1)单项式分组与组距式分组,A)单项式分组:用一个变量值作为一组,形成单项式变量数列。单项式分组一般适用于离散型变量且变量变动范围不大的场合。B)组距式分组:将变量依次划分为几段区间,一段区间表现为“从到”距离,把一段区间内的所有变量值归为一组,形成组距式变量数列。区间的距离就是组距。连续型变量或者变动范围较大的离散型变量,适宜采用组距式分组。,2)间断组距式分组和连续组距式分组,下限,上限:组距式分组的每一组变量值中,其最小值为下限,最大值为上限。组距:上下限之间的距离。组限:相邻两组的界限。间断组距式分组:组限不相连的组距式分组。连续组距式分组:组限相连(或称相重叠的)

22、,即以同一数值作为相邻两组的共同界限的组距式分组。离散型变量,可间断组距式分组,也可连续组距式分组。连续型变量,只能采用连续组距式分组。“上限不在内”原则:在连续组距式分组中,以同一个数值作为相邻两组共同的界限,统计上规定,凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内。,3)等距分组与异距分组,等距分组:标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。一般用于标志值变动比较均匀的场合。异距分组:各组的组距不相等。,4)、相关指标的计算,(1).组距连续式分组的组距计算公式:组距=本组上限本组下限间断式分组的组距计算公式:组距=本组上限本组下限

23、+1开口组的组距:以相邻组的组距为本组的组距可根据全部数据的最大值和最小值及所分的组数来确定组数即组距=(最大值-最小值)/组数,另为便于计算,组距宜取5或10的倍数。(2).组中值:上下限之间的中点数值称为组中值,组中值的计算公式:闭口组,开口组:计算组中值时,开口组的组距是以相邻组的组距为本组组距即组中值=下限+相邻组组距/2 组中值=上限-相邻组组距/2计算平均指标或进行其它统计分析时,常以组中值来代表各组标志值的平均水平。,(3).组数组数=全距/组距斯特杰斯经验公式:组数=1+3.3 Lg N 由此推出组距=(最大变量值-最小变量值)/(1+3.3Lg N),斯特杰斯经验公式只是一经

24、验公式,在实际应用时刻根据数据的多少和特点及分析要求,参考这一标准灵活确定组数,另按经验看法,组数过多或过少都不妥,一般情况下可分为57组,组数尽可能取奇数,避免偶数。,(4)、组限的确定原则:(按这样的组限分后,标志值在各组的变动能反映事物质的变化),应根据标志值分布的情况找出变量的最大值和最小值。根据分布比较集中的标志值确定组距的中心位置根据预定的组距大小定出上下限第一组下限必须略小于实际变量值的最小值,最后一组的上限必须略大于实际变量值的最大值连续变量的相邻组上下限通常以同一数值来表示,按“上限不在内”原则;离散变量相邻组组限可用同一数值表示也可用两个相邻的不同整数表示。,(二)频数分布

25、,1、频数分布的基本概念(1)、频数分布频数:也叫次数,是落在各类别中的数据个数即各组内的数据个数频率:各组总体单位个数和总体单位总数之比即各组次数与全部次数之和的比值称为频率或比重在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,称为频数分布,或次数分布。即将各个类别及其相应的频数全部列出来。可反映总体各组之间单位分布的状况。根据分组标志特征的不同,分布数列可分为品质分布数列和变量分布数列。品质分布数列:有各组名称和次数组成,可用绝 对数(频数)表示也可用相对数(频率)表示 数列分布数列:单项式和组距式分布数列,(2)、分布数列的两个要素,1)总体按某标志所分的组。2)各组所出现的

26、单位数,即频数,亦称次数。对于变量数列,标志值形成的数列,称为变量,一般用x表示;频数(次数)用f表示。,2、变量数列的编制,1、编制方法。1)将原始资料按顺序排列,确定变量值变动范围 2)确定组距、组数、组限和组限的表示方法 3)确定频数和频率(如为异距分组则确定频数密度和频率密度)2、频率的性质1)任何频率都是界于0和1之间的一个分数,即:2)各组频率之和等于1,即:3、频数密度:采用异距分组,各组次数的多少受到组距不同的影响,为消除异距分组所造成的影响须计算频数密度(或称次数密度)。频数密度的计算公式:频数密度=频数/组距 频率密度=频率/组距各组频数密度与各组组距乘积之和等于总体单位数

27、,各组频率密度与各组组距乘积之和等于1。,3、累计频数与累计频率,1、向上累计频数(或频率)分布:先列出各组的上限,然后由标志值低的组向标志值高的组依次累计。向上累计频数表明某组上限以下的各组单位数之和是多少,向上累计频率表明某组上限以下的各组单位数之和占总体单位数比重的大小。2、向下累计频数(或频率)分布:先列出各组的下限,然后由标志值高的组向标志值低的组依次累计。向下累计频数表明某组下限以上的各组单位数之和是多少,向下累计频率表明某组下限以上的各组单位数之和占总体单位数比重的大小。,4、累计频数分布特点,1)第一组的累计频数等于第一组本身的频数;2)最后一组累计频数等于总体单位数。累计频率

28、同样也具有两个特点:1)第一组的累计频率等于第一组本身的频率;2)最后一组的累计频率等于1。累计频数(频率)分布图分为向上累计频数(频率)分布图和向下累计频数(频率)分布图。以分组变量为横轴,以累计频数(频率)为纵轴。在直角坐标点系上将各组组距的上限与其相应的累计频数(频率)所构成坐标点,依次用直线(或光滑曲线)相连,即是向上累计曲线。在直角坐标系上将各组组距下限与其相应累计频数(频率)所构成坐标点,依次用直线(或光滑曲线)相连,即是向下累计分布曲线图。,累计频数分布曲线 显然,累计频数分布曲线只有两种形状:或持续增长的或持续减少的。这分别取决于向上累计或向下累计。累计频数分布曲线一般都呈逻辑

29、斯谛曲线形,其斜率最大的地方对应于频数最大的组,其水平的地方对应于空组。,5、频数分布的类型,(1).钟形图:“两头小,中间大”1)对称分布 2)偏态分布 婚龄、学生身高近似正态分布 收入分配、资源配置偏态分布(2).u型分布:“两头小,中间大”(3).J型分布:“一边小,一边大”1)正J型 2)反J型这三种频数分布的图形是常见的曲线图形,U形曲线:中间小,两头大,J形曲线:正J分布,反J分布,思考题:1.按百分制计分,某班学生统计学考试成绩如下:89 88 76 99 74 60 82 60 89 86 93 99 94 82 77 79 97 78 95 92 87 84 79 65 98

30、 6759 72 84 85 56 81 77 73 65 66 83 63 79 70试分组,并计算组中值。2.如某组数据最大值为139,最小值为107,组数为 7,则组距应为多少?3.按完成净产值分组(万元),计算各组组中值 10以下 1020 2030 3040 4070 70以上,4某行业管理局所属40个企业1999年的销售收入如下:(单位:万元)152 124 129 116 110 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 8

31、8 123 115 119 138 112 146 113 126按125以上为先进企业,115125为良好企业,105115为一般企业,105一下为落后企业分组编制频数分布表,并计算累计频数和累计频率,第四节 数据的图表展示,统计调查搜集来的资料往往是没有次序的原始资料,使原始资料有序化,列表和作图是两种基本方法,得到的分别就是统计表和统计图。一、统计表(一)统计表的定义和作用1、统计表的定义统计表:把统计数据按一定的顺序排列在表格上,就形成了统计表。它清楚地、有条理地显示统计资料,直观地反映统计分布特征,是统计分析的一种重要工具。,2、统计表的作用:1、它利用表格形式,合理地安排统计资料,

32、清晰、简明地反映出现象总体的特征。2、统计表通过科学、合理地表现统计资料,便于对统计资料进行对照比较和分析,有利于计算统计分析指标。3、在统计分析报告中使用统计表,能节省文字叙述篇幅,达到简明易懂、紧凑有力的分析效果。4、统计表还是汇总和积累统计资料,进行统计分析的重要工具。,2002年我国城乡人口情况,按城乡分,比重(%),人口数(万人),128453,39.09,60.91,78241,50212,(二).统计表的结构,1)从表式上看,表格包括总标题、横行标题、纵栏标题和指标数值四个部分。,总标题,乡村,城镇,100.00,合计,纵栏标题,统计数值,横行标题,表34 离婚案件构成,2)从内

33、容上看,统计表由主词栏和宾词栏两个部分组成。主词统计表所要说明的总体及其组成部分。宾词用来说明总体数量特征的各个统计指 标。如需要,主宾词可互换。,(三)统计表的分类,1、按主词的结构分类1)简单表:主词未经任何分组的统计表称为简单表,也称一览表。主词罗列各单位的名称。2)分组表:主词只按一个标志进行分组形成的统计表,也称简单分组表,。3)复合表:主词按两个或两个以上标志进行分组的统计表,也称复合分组表。,简单表 我国城市居民家庭基本情况(2002年),中国人口年龄结构状况 单位:%,资料来源|:2003中国统计年鉴第99页。,简单分组表,复合分组表 我国社会福利主要费用情况 单位:亿元,资料

34、来源|:2003中国统计年鉴第838页。,2、按宾词设计分类,1)宾词简单排列是指宾词不加任何分组、按一定顺序排列在统计表上,就是宾词简单排列表。2)宾词分组平行排列是指宾词栏中各分组标志彼此分开,平行排列,就是宾词分组平行排列表。3)宾词分组层叠排列:指同时按两个或两个以上标志分组,(四)统计表的设计,统计表的设计应注意如下事项:1.线条的绘制。表的上下端应以粗线绘制,表内纵横线以细线绘制。表格的左右两端一般不划线,采用“开口式”。2.合计栏的设置。3.标题设计。以简练而又准确的文字表述统计资料的内容、资料所属的空间和时间范围。,4.指标数值的填写。当数字因小可略而不计时,可写上“0”;当缺

35、某项数字资料时,可用符号“”表示;不应有数字时用符号“”表示。5.计量单位。统计表必须注明数字资料的计量单位。当全表只有一种计量单位时,可以把它写在表头的右上方。如果表中各格的指标数值计量单位不同,可在横行标题后添一列计量单位。6.注解或资料来源。在统计表下,应注明资料来源。,二、统计图,(一)分类和顺序数据的图形显示1、条形图(bar graph):在平面直角坐标系中,我们指定横坐标为各组变量,纵坐标表示各组的频数、相对频数或百分比频数,然后使各组条形的宽度相同,条形的高度等于该组的频数、相对频数或百分比频数。横置条形图、纵置条形图 例:某商店顾客购买计算机频数分布表、条形图购买计算机数据的

36、频数分布表,公司 频数 比重(%)苹果机 13 26康柏机 12 24贝尔 5 10盖特威2000 9 18IBM 11 22合计 50 100,2、饼形图(pie chart):首先绘制一个圆形(饼形),然后利用相对频数或百分比频数,按各组在圆形360度中的比重,将圆形划分成对应的几个部分。例:某商店顾客购买计算机饼形图,3、环形图环形图与圆形图又有区别,环形图中间有一个空洞,总体中的每一部分数据用环中的一段表示;圆形图只能显示每一个总体各部分所占的比例,而环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环。因此环形图可以显示多个总体各部分所占的相应比例,从而有利于进行比较

37、研究。例如:在一项有关住房问题的研究中,调查人员在甲乙两个城市各抽样调查300户家庭,其中一个问题是:“您对您家庭目前的住房状况是否满意?”备选答案有:(1)非常不满意;(2)不满意;(3)一般;(4)满意;(5)非常满意。调查结果如下表:,频数分布不但可以用统计表的形式表现,也可以用统计图的形式表现。用统计图表示频数分布,较之用统计表,要直观便捷得多。但缺点是不及统计表精确。统计图的种类很多,本节仅就与频数分布数列相衔接的统计图加以介绍。根据编制好的频数分布数列,可以绘制出相应的统计图,最常用的有频数分布直方图、折线图、曲线图以及累计频数分布曲线。具体方法是:先画直角坐标系,横轴代表分组或各

38、组组限,纵轴代表各组频数或频率,然后再根据相应的分配数列作图。,(二)数值型数据的显示,条件下,很显然各矩形的面积与其高度成正比。因此,各矩形的面积同样可以用来表示各组的频数或频率,而且看起来更形象直观。如果取各矩形的总面积为1,各矩形的面积必定等于各组的相对频数。,1.直方图(Histograms)直方图是用矩形(或长条)的高度来表示数列各组的频数或频率。对于定类变量和定序变量的分组,矩形(或长条)的宽度是没有意义的,各矩形之间要留出一定的空隙;对于定距变量(和定比变量)的分组,矩形的宽度表示各组组距,各矩形之间一般不留空隙。在等距分组的,其实,在频数分布图中,用面积来理解频数分布状况更合适

39、。比如直方图,当处理异距分组时应该用矩形面积而不是用矩形高度来显示频数分布。下面是根据表315绘制出的两个直方图。左图用矩形高度来表示各组频数就会产生错觉。右图是按照标准组距频数作出来的,用矩形面积来表示各组频数就避免了不必要的错觉。以后当我们接触正态曲线等曲线后,将进一步体会到用面积来表示频数分布的好处。,2.折线图(Polygon)表示频数分布的另一种图形是频数多边形图,简称折线图。直接把直方图各矩形顶部的中点用直线连接起来,并把原来的矩形抹掉,就得到频数多边形图。,当变量数列中的组数愈加增多,变量值也非常多时,折线图会逐步过渡到平滑曲线。频数分布曲线图实质上是对应于连续变量的频数分布的函

40、数关系图。,3.曲线图,4、描述时间序列的线图线图是在平面坐标上用折线表现数量变化特征和规律的统计图。线图主要用于显示时间序列数据,以反映事物发展变化的规律和趋势。,从上图可以清楚地看出,城乡居民的家庭人均收入逐年提高,而且城镇居民的家庭人均收入高于农村,1993年以后这种差距有扩大的趋势。绘制线图时应注意以下几点:1、时间一般绘在横轴,指标数据绘在纵轴;2、图形的长宽比例要适当,一般为横轴略大于纵轴的长方形,其长宽比例大致为10:7,图形过扁或过于瘦高,不仅不美观,而且会给人造成视觉上的错觉,不便于对数据变化的理解;3、一般情况下,纵轴数据下端应从0开始,以便于比较。数据与0之间的间距过大,可以采取折断的“”符号将纵轴折断。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号