统计数据的搜集、处理与显.ppt

上传人:小飞机 文档编号:6332895 上传时间:2023-10-17 格式:PPT 页数:82 大小:1.29MB
返回 下载 相关 举报
统计数据的搜集、处理与显.ppt_第1页
第1页 / 共82页
统计数据的搜集、处理与显.ppt_第2页
第2页 / 共82页
统计数据的搜集、处理与显.ppt_第3页
第3页 / 共82页
统计数据的搜集、处理与显.ppt_第4页
第4页 / 共82页
统计数据的搜集、处理与显.ppt_第5页
第5页 / 共82页
点击查看更多>>
资源描述

《统计数据的搜集、处理与显.ppt》由会员分享,可在线阅读,更多相关《统计数据的搜集、处理与显.ppt(82页珍藏版)》请在三一办公上搜索。

1、统计学基础,非统计学专业选修课,沈阳大学经济学院统计学系 侯振明,目 录,第一章 总论第二章 统计数据的搜集、整理与显示第三章 统计综合指标第四章 抽样与参数估计第五章 相关与回归分析第六章 时间序列分析与预测第七章 统计指数方法,目 录,第二章,第一节 统计数据的搜集,第二节 统计数据的整理,第三节 统计数据的显示,【学习目标】通过对本章的学习,掌握统计调查的概念、程序、统计分组的概念、技术;掌握各种具体调查形式、调查数据的搜集方法、分布数列的概念;了解累计频数与累计频率;了解统计表的结构和各种统计图。,统计数据的搜集、处理与显示,一、统计数据搜集的概念,统计数据搜集:是根据统计研究预定的目

2、的和任务,运用科学的方法与手段,有计划、有组织地向客观实际采集数据的过程。,第二章,统计数据的搜集、处理与显示,第一节 统计数据的搜集,统计数据搜集方式,原始资料:是指向调查单位搜集的,需要由个体过渡到总体的统计资料。,二手资料:是指经过加工,由个体过渡到总体,能够在一定程度上说明总体现象的统计资料。,统计数据的类型,调查数据,实验数据,数据的来源直接来源,直接来源,普查,统计调查方式,统计报表,重点调查,典型调查,抽样调查,选择适合调查方式的方法,第二章,调查数据的搜集方法,直接观察法,采 访 法,报告法(通讯法),统计数据的搜集、处理与显示,第一节 统计数据的搜集,二、统计数据的搜集方法,

3、通过试验,搜集测试某一新产品、新工艺或新方法使用效果的数据。,登 记 法,试验数据搜集方法,分为,第二章,统计数据的搜集、处理与显示,第一节 统计数据的搜集,明确调查目的 调查方案的设计 问卷的设计 实施调查过程 调查数据处理 调查报告撰写,三、统计数据搜集的程序,第二章,统计数据的搜集、处理与显示,第一节 统计数据的搜集,就是明确调查要解决什么问题和为什么要解决这个问题。,亲爱的朋友:我们调研中心受公司的委托,进行该项公众意识调查,其目的是想了解人们对事业的看法,征求大家的意见,以便促进我国事业的发展。您的回答无所谓对与错,只要真实地反映了您的情况和看法,就达到了这次调查的目的。希望您能参与

4、这项调查,如果您还有其他看法与要求,也欢迎告诉我们。,明确调查目的,第二章,统计数据的搜集、处理与显示,第一节 统计数据的搜集,1.确定调查对象和调查单位:调查对象是指需要调查的现象总体,该总体是由调查单位组成的;调查单位是所要调查的单位,是进行调查登记的标志的承担者。报告单位是负责向上报告调查内容、提交统计资料的单位。.设计调查项目(大纲):调查项目就是调查中所要登记的调查单位的特征,即调查单位所承担的基本标志。也就是确定向调查单位登记些什么问题,调查项目一般就是调查单位的各个标志的名称。,调查方案的设计,第二章,统计数据的搜集、处理与显示,第一节 统计数据的搜集,调查方案的设计,.设计调查

5、表格:将各个调查项目按照一定的顺序排列在一定的表格上,就形成了调查表。分为一览表和单一表。.确定调查时间:调查时间是指调查资料所属的时间。调查期限是进行调查工作的时限,包括搜集资料和报送资料的工作所需的时间。,第二章,统计数据的搜集、处理与显示,第一节 统计数据的搜集,统计表的结构,中国1999年国内生产总值,横行标题,纵栏标题,数字资料,宾 词 栏,主词栏,第二章,统计数据的搜集、处理与显示,第一节 统计数据的搜集,单一表,房屋销售价格调查表,单位详细名称:单 位 代 码:表 号:V221表单位详细地址:制表机关:国家统计局单 位 邮 编:200 年 文 号:国统字 号,第二章,统计数据的搜

6、集、处理与显示,第一节 统计数据的搜集,一览表,价格调查点一览表,表 号:V309表 制表机关:国家统计局综合机关名称:200 年 文 号:国统字号,第二章,统计数据的搜集、处理与显示,第一节 统计数据的搜集,问卷设计,问卷调查是一种特殊的调查形式,常用于民意测验或市场调查。根据调查目的,在调查对象中随机选择或有意识地确定调查单位,以书面文字或表格形式了解被调查者的意见,调查者自愿、自由地回答问卷中所提出的问题。调查问卷的设计是调查方案设计的核心内容,在调查中十分重要,它是将调查目的转化为一些被调查者可以回答的问题的重要环节。调查问卷在结构上一般都由说明词、填写要求、问题与答案和结束语部分组成

7、。问卷设计的内容一般包括调查中所提问题的设计、问题答案的设计、提问顺序的设计、编码的设计、量表的设计以及问卷版面格式的设计等。,【专栏21】,手机游戏调查问卷(部分),尊敬的女士/先生:您好!我们是xx大学在校学生,为搜集毕业论文资料发放此问卷。本问卷针对您使用手机/手机游戏的行为进行一些调查,大概会占用您5分钟时间。所有调查项目不涉及个人隐私。您有手机吗?甄别问题(过滤式)A、有(继续提问)B、没有(结束提问),第二章,【专栏21】,统计数据的搜集、处理与显示,第一节 统计数据的搜集,1、您每天用于手机游戏的时间是:(封闭式)A、不使用 B、10分钟以内 C、10-60分钟 D、1小时以上

8、2、请列出您经常玩的手机游戏的名字:(开放式)(最多3个;如不玩游戏,请填“0”):A、B、C、D、E、F、G、H、,第二章,【专栏21】,手机游戏调查问卷(部分),统计数据的搜集、处理与显示,第一节 统计数据的搜集,3、您下载手机游戏的主要方式是(如不玩游戏,请选“其它”项并填“0”):(半封闭半开放的结构式)A、网上下载并通过数据线传输;B、通过WAP网站下载;C、到手机服务中心安装;D、通过百宝箱下载 E、其它(请注明),第二章,【专栏21】,手机游戏调查问卷(部分),统计数据的搜集、处理与显示,第一节 统计数据的搜集,第二章,统计数据的搜集、处理与显示,第一节 统计数据的搜集,实施调查

9、,要使统计调查工作顺利进行,就要做好组织实 施工作,其主要内容包括:1.建立调查工作的办事机构和领导机构;2.组织和培训调查人员;3.落实调查经费来源和开支办法;4.确定调查数据的处理方法、报送方式;5.公布调查结果的时间。,第二章,统计数据的搜集、处理与显示,第一节 统计数据的搜集,调查数据处理,对调查所搜集的原始数据进行检查、核对,审核原始数据的完整性与准确性。大部分情况需要对原始数据进行预处理,数据的预处理包括:对原始资料审核校对、对缺失的数据进行插补、对变量进行相应的转换等。而后运用相应的统计软件对已检验的、已经过预处理的数据进行运算。该阶段是为撰写统计调查报告提供数量依据。,调查报告

10、内容包括调查过程的描述、依调查数据所作的决策和对调查结果的评价。调查的评价主要是对调查的精度、费用等进行评价。,调查报告的撰写,第二章,统计数据的搜集、处理与显示,第一节 统计数据的搜集,(一)统计调查体系 我国的统计调查体系是建立以周期性的普查为基础,经常性的抽样调查为主体,以必要的统计报表、重点调查、综合分析等为补充的统计调查方法体系。,四、统计调查体系,统计调查方法体系中数据搜集形式,按调查的范围划分(单位是否全面),全面调查,非全面调查,按调查时间标志分(时间是否连续),连续性(经常性)调查,不连续性(一次性)调查,第二章,统计数据的搜集、处理与显示,全面调查是对调查对象中所包括的全部

11、单位都进行调查,其主要目的在于取得总体现象的全面系统的问题指标。普查和全面统计报表都属于全面调查。非全面调查是对调查对象中的一部分单位所进行的调查,包括重点调查、典型调查、抽样调查等。,经常性调查是连续性的调查,它是随着被研究对象在时间上的发展变化而连续不断地进行登记。在进行这种调查时,被研究对象过程量上的变化都被记录下来,因此所取得的资料体现了现象的发展过程和一段时间内现象发展变化的总量。一次性调查是间隔一定时间,一般是相当长时间,如一年以上,它是对事物在一定时点上的状态进行登记。一次性调查的主要目的在于获得事物在某一时点上的水平、状态的资料。对现象指标值在一定时期内变动不大的情况往往采用一

12、次性调查的方式。,第二章,统计数据的搜集、处理与显示,第一节 统计数据的搜集,(二)各种具体的统计调查形式,普 查,抽样调查,重点调查,统计报表制度,调查形式,第二章,普查,统计数据的搜集、处理与显示,普查:是专门组织的一种全面调查,它主要是用以搜集某些不能或不宜用定期报表收集的统计资料。特点:非经常性的调查;一种全面调查,比任何一种调查形式更能掌握大量、详细、全面的统计资料。意义:普查是统计调查体系的基础,对国情国力调查一般采用普查。组织形式:有组织普查机构配备一定人员和由调查单位利用原始资料填表两种。,第一节 统计数据的搜集,第二章,抽样调查,统计数据的搜集、处理与显示,第一节 统计数据的

13、搜集,抽样调查是一种非全面调查,分为概率抽样和非概率抽样。概率抽样:是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据所获得的样本数据,对调查对象总体特征作出具有一定可靠程度的推算。概率抽样的特点:(1)按机原则抽取样本;(2)根据部分调查的实际资料对调 查对象总体的数量特征作出估计;(3)抽样误差可以事先计算并加以控制。概率抽样的适用范围主要有:(1)对一些不可能或不必要进行全面调 查的现象进行调查。(2)对普查资料进行检查和必要的修正。,【专栏22】,抽样调查的应用案例,抽样调查的方法是透过部分来推断总体。比如要研究一个城市的家庭小汽车问题,按照传统统计报表制,只能通过各区、

14、各居委、各小区、各单位层层发放调查表,再层层上报,每个家庭填一张表。而用抽样调查的方法,只需要调查两三百个家庭就足以比较准确地推断出整个城市的情况。当然,这两三百户家庭要通过科学的抽样来决定。,第二章,【专栏22】,统计数据的搜集、处理与显示,第一节 统计数据的搜集,抽样调查的应用案例,1936年,美国总统大选前夕,当时,调查业在美国也刚刚起步,该届总统大选的候选人有两位,就是兰登和罗斯福。当时有一本杂志叫文学文摘,它随杂志发了1000万张预选票,最后收回237万张,统计结果是兰登获胜。同时,有一位研究人员叫乔治盖洛普,他运用了与刚才不同的方法科学抽样的调查方法,在全美国选取了1000个样本,

15、他的分析结果是罗斯福获胜。大选结果是罗斯福获得选票1800万张,而兰登只获得选票700万张。这件事使得盖洛普所采用的这种调查方法在全球引起了轰动。,第二章,【专栏22】,统计数据的搜集、处理与显示,第一节 统计数据的搜集,抽样调查的应用案例,从此,抽样调查在西方得到了普遍认可,盖洛普用他的名字创办的调查公司也常胜不衰。到现在为止,盖洛普调查公司还是全球声誉最好的调查公司。我们国家申办奥运时,就请盖洛普调查公司来做民意调查,调查结果是中国有百分之九十几的支持率,这个数据没有人怀疑,这个数据也是中国获胜的一个重要法码。,第二章,【专栏22】,统计数据的搜集、处理与显示,第一节 统计数据的搜集,第二

16、章,重点调查就是在调查对象中选择一部分重点单位所进行的调查。组织方式有两种:1.专门组织一次性调查;2.利用定期统计报表经常地对一些重点单位进行调查。,重点调查,这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况,统计数据的搜集、处理与显示,第一节 统计数据的搜集,第二章,统计数据的搜集、处理与显示,第一节 统计数据的搜集,统计报表制度:是依照国家有关法规,自上而下地统一布置,以一定的原始记录为依据,按照统一的表式,统一的指标项目,统一的报送时间和报送程序,自下而上地逐级地定期提供统计资料的一种调查方式。统计报表的主要特点:1.统计报表的来源是建立在各个基层单位的原

17、始记录的基础上,基层单位可利用其资料、经营活动进行监督管理。2.各级领导可根据逐级上报的资料了解、本部门的经济和社会发展情况。3.统计报表是经常性调查,有利于积累资料,并进行动态对比分析。,统计报表制度,第二章,统计报表制度,种类,资料来源,国家、部门、地方报表,全面报表和非全面报表,日报、旬报、月报、季报、半年报和年报,基层报表和综合报表,邮寄报表和电讯报表,基层单位的原始记录、统计台帐和有关核算资料,统计数据的搜集、处理与显示,第一节 统计数据的搜集,统计报表制度,第二章,统计调查所得统计数字与调查总体实际数量之间的差别称为统计调查误差。统计调查误差有两类:一是登记误差,一是代表性误差。任

18、何统计调查方法都有可能出现登记误差。它是由于调查过程中各个环节上的工作不准确而引起的。代表性误差是指用总体一部分单位的数据来推算总体指标时所产生的误差。如抽样调查就会出现代表性误差。代表性误差不能避免但可以控制。在实际工作中,全面调查不存在代表性误差,非全面调查既有登记误差,又有代表性误差。,五、统计调查误差,统计数据的搜集、处理与显示,第一节 统计数据的搜集,第二章,统计数据的搜集、处理与显示,第二节 统计数据的整理,数据处理程序,资料审核,分 组,频数分布,统 计 表,统 计 图,资料分类,资料编码,统计整理:是指根据统计研究目的,将统计调查所得的原始资料进行科学的分类汇总,或对已经加工的

19、次级资料进行再加工,为统计分析准备系统化、条理化的综合资料的工作过程。,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,统计分组:根据统计研究的目的和客观现象的内在特点,按某个(或几个标志)把被研究的总体划分为若干个不同性质组。统计分组的性质:分组兼有分与合双重含义。统计分组的原则:1.穷尽原则:使总体中的每一个单位都应有组可归。2.互斥原则:即在特定的分组标志下,总体中的任何一个 单位只能归属于某一组,而不能同时或可能归属于几个组。,一、统计分组,(一)统计分组的概念和原则,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,16.7,33.3%,22.2%,27

20、.8%,分组前,分组后,统计分组的作用:总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的差异,使数据变得条理化。,1.划分社会经济现象的类型,按所有制性质划分经济类型:国有经济、集体经济、私营经济、个体经济联营经济、股份制经济、外商投资经济、港澳台投资经济。,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,2.反映社会经济现象的内部结构和比例关系,例:某市按GDP计算的三次产业结构(%)2005年 2006年 2007年 2008年 GDP 100 100 100 100 第一产业 3.2 4.3 2.5 2.3 第二产业75.7 63.854.5 52.2 第三

21、产业21.1 31.943.0 45.5,3、揭示社会经济现象之间的相互依存关系,例:中国农民家庭按收入分组的恩格尔系数(某年),按收入分组(元)200 300 400 500 600 800 1000恩格尔系数(%)64.9 60.2 56.7 54.4 50.5 49.9 43.6,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,统计分组可按照不同的标志进行分类。分组的标志是划分资料的标准和依据,它关系到能否正确反映总体数量特征及其变化规律。,(二)统计分组的种类,统计分组的种类,简单分组,品质分组,复合分组,数量分组,标志多少,标志性质,单项式分组,组距式分组,等距式分组

22、,异距式分组,每组一个标志值,每组为标志值区间,各组组距相等,各组组距不等,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,二、分组的技术 分组的关键在于分组标志的选择和各组界限的划分。,1.根据统计研究的目的与任务选择分组标志。在对社会经济现象进行研究时,可以根据不同的研究目的而从不同的角度进行研究,也正是研究目的的不同,才选择不同的分组标志进行分组。2.在若干个标志中抓住具有本质性的或主要的标志作为分组的依据。总体中的若干标志,有能反映问题本质特征的标志,也有对反映事物本质作用不大的标志,这时我们应该选择最能反映问题本质特征的标志。3.根据现象所处的历史条件或经济条件来选择

23、标志。对现象进行研究,要视具体时间、地点条件的不同而选择不同的分组标志。,分组标志的选择,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,(一)简单分组:简单分组是对研究对象按一个标志进行分组,它只能从某一方面说明和平行的反映事物的分布状况和内部结构。,人均国内生产总值 单位:元,资料来源:2000年中国统计年鉴,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,平行分组体系,年GDP比上年预计增长率,同时使用多个简单分组,从不同角度说明同一个总体,就构成一个平行分组体系。例如:先按第一、二、三产业分组,然后对第二、三产业进行第二次分组,形成平行分组体系。,资料来

24、源:虚拟数据,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,(三)复合分组:复合分组就是对研究现象按两个或两个以上标志进行层叠分组。复合分组本身就形成复合分组体系。,某市1999年在岗职工人数 单位:万人,资料来源:2000年上海统计年鉴,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,复合分组体系,2005 年各产业GDP预计增长率,资料来源:中国社科院中国经济形势分析与预测,中国经济日报2005年4月25日,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,(四)品质分组:品质分组是按品质标志进行分组。一般对以定类尺度(列名尺度)或定序尺度(

25、顺序尺度)进行的分组。品质分组所形成的数列叫品质数列。例如:,沈阳市2008年在岗职工构成,资料来源:沈阳市2008年统计公报,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,(五)数量分组:数量分组就是按数量标志进行的分组。数量分组所形成的数列叫变量数列。,按数量标志分组应注意的两个问题:A.分组时各组界限的确定必须能反映事物质的区别。B.应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限。,数量标志分组的种类:,异距分组,间断组距式分组,连续组距式分组,等距分组,单项式分组,单项式分组,组距式分组,第二章,统计数据的搜集、处理与显示,第二节 分组技术

26、与频数分布,.单项式分组,按每个变量值分别列组,依次分组编制的变量数列叫做单项式分组,进而形成单项式变量数列。一般适用于离散变量且变动范围不大的情况。,【例】己知某车间24名工人的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23。要求:根据以上资料进行单项式分组编制变量数列。,分组结果及数列编制如下:,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,2.组距式分组,对于连续变量和变动范围较大的离散变量,将变量依次划分为几段区间,一段区间表现为“从 到”的距离,将一段

27、区间的变量值归为一组,这种分组形式称为组距式分组,组距式分组形成组距式数列。,组限:相邻两组之间的界限;下限:一组变量值中最小值;上限:一组变量值中最大值;组距:是一组变量值上下限之间的 距离,组距的确定尽可能是5或10的倍数,组距式分组应明确的概念如下:,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,分组数值产参考表,组距式分组应明确的概念(续),组数:分组的数量,组数必须是整数。组距大小决定组数多少,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,开口组:使用“以下”或“以上”作为组限的不 确定组距的组开口组的组距:邻组的组距开口组的组中值:临组组距的一半

28、,组距式分组应明确的概念(续),组中值:一组变量值上下限间的中点数值,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,某团体50人年龄分组表,上限值,下限值,分组概念示例,缺下限开口组,缺下限开口组,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,(1)间断组距式分组,组限不相连的组距式分组,称为间断组距式分组,某区年家庭按人数分组,资料来源:虚拟数据,间断组距式分组适用于离散变量,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,50名学生统计学考试成绩分组表,(2)连续组距式分组,凡是组距相连(或称相重叠的)即以同一数据作为相邻两组的共同界限,

29、称为连续组距式分组。连续变量只能采用连续组距式分组,资料来源:虚拟数据,“上限不在内原则”,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,(3)等距分组,等距分组:是标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。等距分组适用于标志值分布比较均匀的情况,50名学生统计学考试成绩分组表,资料来源:虚拟数据,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,异距分组:就是各组组距不相等的组距式分组形式。适用于标志值分布很不均匀的场合、标志值相等的量具有不同意义的场合、标志值按一定比例发展变化的场合。,(4)不等距(异距)分组,年龄组人口占总人口的百分

30、比(%),资料来源:虚拟数据,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,二、频数分布,(一)频数分布 在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,称为频数分布(或次数分布)。通过对无序化的原始资料的频数分布形式整理,形成一系列反映总体各组间单位分布状况的数列,即分布数列。根据分组标志不同,分布数列可分为两类:A.按品质标志分组所形成的数列即品质分布数列,亦称品质数列。B.按数量标志分组所形成的数列叫变量分布数列,亦称变量数列。分布数列由两个要素构成,一是总体按某标志所分的组,二是各组标志值所出现的单位数。就变量数列而言,分组标志在各组有不同的数量表现,亦称

31、变量,一般用 表示;变量出现的单位数叫次数,也叫频数用 表示,各组频数与总体单位数之比叫频率:,频率=,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,50名学生统计学考试成绩分组表,总体单位按标志的分组,各组出现的次数即频数,各频数比总体单位数叫频率,各组频数之和等于总体单位总数,资料来源:虚拟数据,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,频率的性质:1.频率非负性,即介于0和1之间;2.频率之和等于1。频数密度=频数/组距 频率密度=频率/组距 向上累计频数(或频率)的方法:是分组后由标志值低的组向高的组依次累 计频数(或频率)。向上累计频数的含义:

32、表明某组上限以下各组单位数之和;向上累计频率的含义:表明某组上限以下各组单位数之和占总体单位数的比重。向下累计频数(或频率)的方法:是分组后由标志值高的组向低的组依次累计频数(或频率)。向下累频数的含义:表明某组下限以上各组单位数之和;向下累计频率的含义:表明某组下限以上各组单位数之和占总体单位数的比重。向上累计频数分布的特点:1.第一组累计频数等于第一组本身的频数;2.最后一组累计频数等于总体单位数。向上累计频率分布的特点:1.第一组累计频率等于第一组本身的频率。2.最后一组累计频数等于1。,意义:在于消除因异距分组组距大小不同造成频数和频率多少的影响。,第二章,统计数据的搜集、处理与显示,

33、第二节 分组技术与频数分布,(二)变量数列的编制,例如:某班50名学生统计学考试成绩如下:50 51 54 58 59 61 61 62 63 64 65 66 67 68 69 69 70 71 72 72 72 73 74 74 74 75 75 75 75 76 77 78 79 80 81 82 83 84 84 85 86 86 87 88 90 91 91 95 97 99要求:将上述变量值分组,同时编制变量数列并进行频数和频率累计。,1.找出最大值和最小值计算全距(即极差):全距=9950=49分。2.根据成绩的性质、等级特征确定组数:显然 分为优、良、中、及格和不及格五组为宜。

34、3.计算组距:组距=全距/组数=49/5=9.8 可近似取10,即组距为10分。分组变量值性质、特征不明显时可以使用斯特吉斯(sturges)公式计算组距,第二章,统计数据的搜集、处理与显示,第二节 分组技术与频数分布,50名学生统计学考试成绩分布表,计算累计频数和累计频率,便于概括数据的结构。例如,向上累计栏表明,90分以下学生人数占全班人数的88%;向下累计栏表明,80分以上学生人数占全班人数的34%。,资料来源:虚拟数据,第二章,统计数据的搜集、处理与显示,中国1999年国内生产总值 单位:亿元,横行标题,纵栏标题,宾 词 栏,主词栏,一、统计表,第三节 统计数据的显示,(一)统计表的定

35、义和结构 统计表是容纳各种统计资料的表格,将一系列有联系的统计数据按一定的顺序和格式排列在表格上,就形成了统计表。统计表的结构从表式上看,可分为总标题、横栏标题、纵栏标题和指标数值四个部分;从内容上看可分为主词栏和宾词栏两部分。,指标数值,总标题,第二章,统计数据的搜集、处理与显示,第三节 统计数据显示,.按主词的结构分类:根据主词是否分组和分组程度划分:简单表;分组表;复合表。简单表主词未经任何分组的统计表。,资料来源:当前经济运行与预测,2005年4月4日。,国民经济主要指标,(二)统计表的分类,第二章,统计数据的搜集、处理与显示,第三节 统计数据显示,分组表主词只按一个标志进行的分组形成

36、的统计表,也叫简单分组表。,人均国内生产总值 单位:元,资料来源:2000年中国统计年鉴。,第二章,统计数据的搜集、处理与显示,2005 年各产业GDP预计增长率,资料来源:中国社科院中国经济形势分析与预测,中国经济日报2005年4月25日,第三节 统计数据显示,复合表主词按两个或两个以上标志进行分组的统计表,也叫复合分组表。,第二章,统计数据的搜集、处理与显示,第三节 统计数据显示,.按宾词设计分类 宾词简单排列表:宾词不进行任何分组,按一定顺序排列在统计表上。,沈阳市2008年在岗职工构成,资料来源:沈阳市2008年统计公报,第二章,统计数据的搜集、处理与显示,第三节 统计数据显示,宾词分

37、组平行排列表:宾词栏中各分组标志彼此分开,平行排列。,某市1999年在岗职工人数 单位:万人,资料来源:虚拟资料。,第二章,统计数据的搜集、处理与显示,第三节 统计数据显示,宾词分组层叠排列表统计指标同时有层次地按两个或两个以上标志分组。,某市2008年房地产经营情况 单位:亿元,第二章,统计数据的搜集、处理与显示,第三节 统计数据显示,主词分组的结果使总体分成许多组成部分,它们需要用统计指标(宾词)来描述。宾词分组的结果并不增加统计总体的各组成部分,仅仅是比较详细地描述总体已有的的各个组成部分。主词分组具有独立的意义,而宾词分组从属于主词的要求,是为更详细地描述主词的数量特征而设计的。,统计

38、主词分组与宾词分组的区别:,(三)统计表的设计 设计要求;简练、明确、实用、美观、便于比较。设计应注意的事项:.线条的绘制;.合计栏的设置;.标题设计;.指标数值;.计量单位;6.注解或资料来源。,第二章,统计数据的搜集、处理与显示,第三节 统计数据显示,二、统计图,柱形图:用于显示离散型变量的次数分布,第二章,统计数据的搜集、处理与显示,第三节 统计数据显示,柱形图:用于显示离散型变量的次数分布,第二章,统计数据的搜集、处理与显示,第三节 统计数据显示,条形图:用于显示离散型变量的次数分布,第二章,统计数据的搜集、处理与显示,第三节 统计数据显示,直方图及曲线图:用于显示连续型变量的次数分布

39、,第二章,统计数据的搜集、处理与显示,第三节 统计数据显示,圆形图(饼图):,用于显示定类变量的次数分布,第二章,统计数据的搜集、处理与显示,第三节 统计数据显示,用于显示定类变量的次数分布,圆形图(饼图):,第二章,统计数据的搜集、处理与显示,第三节 统计数据显示,曲线图:主要用于显示连续型变量的次数分布和现象的动态变化,第二章,统计数据的搜集、处理与显示,第三节 统计数据显示,散点图:主要用来观察变量间的相关关系,也可显示数量随时间的变化情况。,第二章,统计数据的搜集、处理与显示,第三节 统计数据显示,折线图:以线段的起伏表示数量分布的特征,第二章,统计数据的搜集、处理与显示,第三节 统计

40、数据显示,折线图:以面积的大小表示数量分布的特征,第二章,统计数据的搜集、处理与显示,第三节 统计数据显示,环形图:以环状面积的大小表示数量分布的特征,1.北部;2.西部;3.东部,1,2,3,第二章,统计数据的搜集、处理与显示,第三节 统计数据显示,雷达图:以雷达环型折线方式表示数量分布的特征,第二章,统计数据的搜集、处理与显示,第三节 统计数据显示,三维圆柱形图:以柱形高低方式表示数量分布的特征,第二章,统计数据的搜集、处理与显示,第三节 统计数据显示,三维折线图:以线段的起伏表示数量分布的特征,本章小结:,第二章,统计数据的搜集、处理与显示,统计数据搜集:是根据统计研究预定的目的和任务,

41、运用相应的科学的调查方法与手段,有计划、有组织地向客观实际搜集资料的过程。调查对象:是指需要调查的现象总体,该总体是由调查单位组成的。调查单位:是进行调查登记的标志的承担者。报告单位:是负责向上报告调查内容、提交统计资料的单位。调查时间:是指调查资料所属的时间。调查期限:是进行调查工作的时限,包括搜集资料和报送资料的工作所需的时间。,本章小结:,第二章,统计数据的搜集、处理与显示,统计分组应遵循穷尽与互斥两个原则。数量分组有单项式分组和组距式分组,组距式分组又分为间断组距与连续组距、等距与异距分组。相关概念有:组限、组距、组数、组中值。分布数列由两个要素构成,一个是总体按某标志所分的组,另一个

42、是各组所出现的单位数,即频数。各组频数与总体单位总和之比即频率,频率是介于0和1之间的一个分数,各组频率之和等于1。为消除异距分组所造成的影响需计算频数密度。频数密度=频数/组距,频率密度=频率/组距。向上累计频数(或频率)分布,其方法是先列出各组的上限,然后由标志值低的组向标志值高的组依次累计。向下累计频数(或频率)分布,其方法是先列出各组的下限,然后由标志值高的组向标志值低的组依次累计。,复习思考题:,第二章,1什么是统计数据搜集?统计数据的类型有几种?2统计调查的程序有哪些?3调查方案的设计包括哪些主要内容?4什么是普查?普查和统计报表都是全面调查,为什么不能 互相替代?5抽样调查与重点调查都是非全面调查,两者有什么区别?6什么是统计分组?统计分组遵循的原则 是什么?7什么是统计表?它包括哪几个组成部分?8请解释频数、频率、频数密度和频率密 度的含义和它们之间的联系。,统计数据的搜集、处理与显示,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号