统计学数据的整理和展.ppt

上传人:小飞机 文档编号:6332804 上传时间:2023-10-17 格式:PPT 页数:67 大小:4.84MB
返回 下载 相关 举报
统计学数据的整理和展.ppt_第1页
第1页 / 共67页
统计学数据的整理和展.ppt_第2页
第2页 / 共67页
统计学数据的整理和展.ppt_第3页
第3页 / 共67页
统计学数据的整理和展.ppt_第4页
第4页 / 共67页
统计学数据的整理和展.ppt_第5页
第5页 / 共67页
点击查看更多>>
资源描述

《统计学数据的整理和展.ppt》由会员分享,可在线阅读,更多相关《统计学数据的整理和展.ppt(67页珍藏版)》请在三一办公上搜索。

1、第三章 数据的整理和展示,统计工作的三个中心阶段,第一节 统计数据的整理一、数据整理的概念和作用统计整理是指根据统计研究的目的,将统计调查所得的原始资料(也称初级资料)进行科学的分类和汇总;或对已经加工的综合资料(也称次级资料)进行再加工,为统计分析准备系统化的、条理化的综合资料的工作过程。统计整理是统计调查的继续、统计分析的前提。,二、统计整理的步骤(一)设计和编制统计资料的整理方案。(二)对原始资料进行审核。(三)用一定的组织形式和方法,对原始资料进行排序、分组、汇总和计算。(四)对整理好的资料再一次进行审核,改正在汇总过程中发生的各种差错。(五)编制统计图表。(六)统计数据的积累和保管。

2、,三、统计整理的组织方式 1、逐级整理 2、集中整理 3、逐级整理与集中整理相结合,主要方法,分组,汇总,统计表,统计图,汇总手工汇总计算机汇总,四、统计整理的方法,第二节、统计分组 一、统计分组的概念 统计分组是根据统计研究的目的和研究对象的特点,将统计总体各个单位按照一定的标志划分为若干性质不同的部分或组。统计分组的两方面涵义:对总体而言,是“分”,即将总体中的各个个体按照它们的差异性区分为若干部分;对个体(总体单位)而言,是“合”,即将性质相同的个体组合起来。即对总体实行异质分解,对总体单位实行同质组合。即组内同质性,组间差异性,分组,分组前,分组后,25,33,42,(1)划分社会经济

3、现象的类型,二、作用:,例:按所有制性质划分,我国现有8种经济类型:国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港澳台投资经济,(2)揭示社会经济现象的内部结构和比例关系,例:上海市按GDP计算的三次产业结构(%)1980年1990年 1996年1997年 GDP100 100 100 100 第一产业3.2 4.32.5 2.3 第二产业75.7 63.854.5 52.2 第三产业21.1 31.943.0 45.5,(3)研究现象之间的依存关系,例:某地农民家庭按收入分组的恩格尔系数,按收入分组(元)200 300 400 500 600 800 1000恩

4、格尔系数(%)64.9 60.2 56.7 54.4 50.5 49.9 43.6,(1)科学性原则(2)完整性原则(穷尽原则)即应使总体中的每一单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。(3)互斥原则(不相容性)即总体中任一单位只能归入某一组。,三、统计分组的原则和方法,1、统计分组的原则,2、统计分组的方法,统计分组的关键在于正确选择分组标志。(1)分组标志的选择原则是:1)从研究目的出发选择分组标志;2)选择最能反映现象本质特征的分组标志;3)根据事物所处的具体历史条件和经济条件选择分组标志。,(2)分组方法(统计分组的种类)1)、按分组标志的性质不同,分为品质分组(或

5、称属性分组)和数量分组(或称变量分组)。品质分组按品质标志进行的分组。数量分组按数量标志进行的分组。、按分组的作用和任务不同,分为类型分组、结构分组和分析分组。类型分组将复杂现象分为若干性质不同部分的分组。结构分组表明总体结构的分组。分析分组分析现象间依存关系的分组。,2)、按采用分组标志多少不同的分组方法 简单分组对总体各单位只采用一个标志进行分组。平行分组体系对总体各单位同时采用两个或两个以上的标志进行并列分组。(表3-4)复合分组对总体各单位同时采用两个或两个以上的标志进行层叠分组。(表3-5)四、统计分类标准化和国民经济中常用的统计分组,第三节 次数分布一、次数分布数列的概念和种类1、

6、次数分布数列的概念 在统计分组的基础上,将总体中的所有单位按组归类整理,形成总体中各个单位数在各组间的分布,叫做频(次)数分布,将各组组别与次数依次编排而形成的数列叫做次数分布数列,简称为分布数列。,次数分布(分布数列),是一种重要的分组资料,反映总体单位在各组的分布状态。,基本形式:,分组,单位数(频数),频率,合计,100,次数分布,频率分布,一、次数分布数列的概念和种类2、次数分布数列的种类 按分组标志特征的不同,分布数列可以分为两种:品质分布数列与变量分布数列。(1)品质分布数列,()按数量标志分组则应按照研究目的及研究对象的特点确定相应的组数,划分相应的组限。按数量标志分组即变量分组

7、,有两种:单项式分组 单项式分组即将某一变量的每一个变量值作为一组。组数及组限是明确的。*,单项式分组,组距式分组,变量分布数列的分类见P56图示,*,组距式分组在连续变量或变量值较多的情况下,可采用组距分组。它将全部变量值依次分为若干个区间,并将这个区间的变量值作为一组。连续型变量相邻两组的上、下限采用同限,且遵循“下闭上开”(即上限不在内)的原则。“上限在不内”原则:在连续组距式分组中,以同一个数值作为相邻两组共同的界限,统计上规定,凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内。离散型变量相邻两组的上、下限间断,且采用差数为“”的形式。相邻两组的上、下限

8、重叠。,下限,上限:组距式分组的每一组变量值中,其最小值为下限,最大值为上限。组限:相邻两组的界限。间断组距式分组:组限不相连的组距式分组。连续组距式分组:组限相连(或称相重叠的),即以同一数值作为相邻两组的共同界限的组距式分组。离散型变量,可间断组距式分组,也可连续组距式分组。连续型变量,只能采用连续组距式分组。开口式分组第一组缺下限、最末组缺上限闭口组各组上下限齐全,组距:上下限之间的距离。连续式分组的组距计算公式:组距=本组上限本组下限间断式分组的组距计算公式:组距=本组上限本组下限+1等距分组:标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。一般用于标志值变动比较均匀的

9、场合。异距分组:各组的组距不相等。开口组的组距:以相邻组的组距为本组的组距。,组中值:上下限之间的中点数值称为组中值,组中值的计算公式:计算平均指标或进行其它统计分析时,常以组中值来代表各组标志值的平均水平。组数 组数=全距/组距 组数依经验确定,一般分为组。,缺下限开口组组中值=该组上限-1/2邻组组距,缺上限开口组组中值=该组下限+1/2邻组组距。,闭口组组中值=(上限+下限)2,二、变量数列的编制1、单项变量数列的编制适用于变量值个数不多的离散型变量第一步:将调查获得的原始资料按数值大小依次排列第二步:确定各组的标志值和组数。第三步:计算各组的次数和频率。第四步:按变量值大小顺序编制单项

10、变量数列。,二、变量数列的编制2、组距变量数列的编制适用于标志值比较多的离散型变量和连续性变量 第一步:将调查获得的原始资料按数值大小依次排列起来,并确定最大值、最小值和全距。(全距)最大值最小值。第二步:确定组数和组距。第三步:确定组限和组限的表示方法。第四步:计算各组次数和频率,编制成组距数列。,【例】某生产车间50名工人日加工零件数如下(单位:个):,117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112

11、 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139,采用单变量值分组形成的频数分布表,某车间50名工人

12、日加工零件数分组,采用组距式分组形成的频数分布表,三、次数分布的特征,图3-1.2.3 几种常见的次数分布,*,某地企业规模分组表,按职工人数分组 企业个数 频率(%)200人以下 1 1.7 200299 3 5.0 300399 5 8.3 400499 16 26.7 500599 20 33.3 600699 9 15.0 700799 4 6.7 800人以上 2 3.3 合 计 60 100.0,*,P70习题、累计频数与累计频率 累计频数(或频率)可以是向上累计频数(或频率),也可以是向下累计频数(或频率)。向上累计频数(或频率)分布,其方法是先列出各组的上限,然后由标志值低的组

13、向标志值高的组依次累计频数(或频率)。某组向上累计频数表明该组上限以下的各组单位数之和是多少,某组向上累计频率表明该组上限以下的各组单位数之和占总体单位数的比重。向下累计频数(或频率)分布,其方法是先列出各组的下限,然后由标志值高的组向标志值低的组依次累计频数(或频率)。某组向下累计频数表明该组下限以上的各组单位数之和是多少,某组向下累计频率表明该组下限以上的各组单位数之和占总体单位数的比重。,累计频数(或频率)分布曲线,可用以研究财富、土地和工资收入的分配是否公平。这种累计分布曲线最早由美国洛伦茨博士提出的,故又称洛伦茨曲线图。其绘制方法如下:1将分配的对象和接受分配者的数量均化成结构相对数

14、并进行向上累计 2.纵轴和横轴均为百分比尺度,纵轴自下而上,用以测定分配的对象(如一国的财富、土地或收入等),横轴由左向右用以测定接受分配者(如一国的人口)。3根据计算所得的分配对象和接受分配者的累计百分数,在图中标出相应的绘示点,连接各点并使之平滑化,所得曲线即所要求的洛伦茨曲线。,第四节:统计数据的图表展示,从统计图表获取信息用统计图表表达信息,统计图表进入寻常百姓家,对青年报2007年2月15日的调查带有统计数字的文字随处可见,如3天近百个咨询电话,50余热心人将牵手空巢老人零点公司最新调查显示,独生子女夫妻流行分居过年截至2006年底,全国657个城市中,已经有512个城市建立了廉租住

15、房制度,占城市总数的77.9%,对青年报的调查(续),统计图表主要在财经&证券版,一、统计表1、统计表的概念和作用 统计调查所取得的原始资料,经过整理,得到说明社会现象及其发展过程的数据,把这些数据按一定的顺序排列在表格上,就形成了统计表。广义的统计表包括统计工作各个阶段中所用的一切表格:调查表,汇总整理表,计算分析表。狭义的统计表专指分析表和容纳各种统计资料的表格,也就是通常所说的统计表。,2、统计表的结构可以从表式和内容两个方面来认识。1从表式上看,统计表是由纵横交叉的线条组成的一种表格,表格包括总标题、横行标题、纵栏标题和指标数值四个部分。2从内容上看,统计表由主词栏和宾词栏两个部分组成

16、。主词栏是统计表所要说明的总体及其组成部分;宾词栏是统计表用来说明总体数量持征的各个统计指标。,统计表的结构,行标题,总标题,列标题,数字资料,附加,统计表的制作要求(1),(1)统计表的各种标题,特别是总标题的表达应该十分简明、确切,概括地反映出表的基本内容,总标题还应该标明资料所属的地点和时间。(2)统计表的内容要扼要而不庞杂,无论主词(即统计表所要说明的总体及其分组)还是宾词(即用来说明主词的各种统计指标)分组层次不宜过多,为使统计表长宽适中,必要时,可将主词与宾词互换位置。(3)表中数字应填写整齐,对准位数。表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一.当数

17、字为0或因数小可略而不计时,要写上0;当缺乏某项资料时,用符号“”表示;无数字的空格,用符号“”表示。,统计表的制作要求(2),(4)统计表中必须注明数字资料的计量单位。当全表只有一种计量单位时,可以把它写在表的右上方;当表中需要分别注明不同单位时,横行的计量单位,可专设“计量单位”一栏,纵栏的计量单位,要与纵栏标目写在一起,用小字标写。(5)统计表的表式,一般是“开口”式的,即表的左右两端不划纵线;表的上下端基线通常要划粗线,其余用细线表示。(6)必要时,统计表应加注说明或注解。例如某些指标有特殊的计算口径,某些资料只包括一部分地区,某些数字是由估算来插补的等等,都要加以说明。此外还要注明统

18、计资料的来源,以便查考。说明或注解一般写在表的下端,说明或注解不宜太多。,二、统计图统计图是用几何学的点、线、面或具体事物的形象所构成的用来描述统计资料的图形。,【例】某生产车间50名工人日加工零件数如下(单位:个):,117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 12

19、4 121,1、直方图(Histogram):用矩形的宽度和高度来表示频数分布的图形。高度表示每一组的次数,宽度表示各组的组距。,等距分组表,频数(人),15,12,9,6,3,日加工零件数(个),图2-1 某车间工人日加工零件数的直方图,2、折线图,折线图也称频数多边形图是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来形成的多边形图折线图的两个终点要与横轴相交,做法是:第一个矩形的顶部中点和最后一个矩形顶部中点分别通过竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的,15,12,9,6,3,105,110,115,120,125,130,1

20、35,140,日加工零件数(个),频数(人),折线图的绘制,图2-4 某车间工人日加工零件数的折线图,2、折线图,3、曲线图:在作直方图时,如果数据不断增多,组距不断缩小,直方图中的矩形将逐渐变窄,顶端将渐渐珠连使折线接近于一条光滑曲线,这条曲线称为次数分布曲线,或称为次数密度曲线,近似于概率密度曲线。次数分布曲线的三种类型:钟型分布曲线,U型分布曲线和J型分布曲线。,次数分布曲线的三种类型,图2-9 几种常见的频数分布,4、条形图(Bar chart)用宽度相同的条形的高度或长短来表示数据变动的图形。,图2.1 某城市居民关注不同类型广告的人数分布,5、饼图也叫圆形图(Pie chart):

21、用圆形及圆内扇形面积来表示数值的大小。主要用于表示总体中各组成部分所占的比例。,(6)雷达图,(7)气泡图,8、散 点 图,9、枝(茎)叶图直方图可大体上看出一组数据的分布状况,但没有给出具体的数值,所能提供的信息量不大,比较粗糙。茎叶图实际上是由数据构成的图形,图中给出了每一个数据的原始数值,不仅能看出数列次数的分布状况,还能显示数据是否对称,反映数据的离散程度和集中趋势,表明某些数值是否远离其他数、某些数值是否有空缺等。,适用于不多的数据,【例】某生产车间50名工人日加工零件数如下(单位:个):,117 122 124 129 139 107 117 130 122 125108 131

22、125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121,树茎,树叶,788,0223457778889,0133445799,数据个数,茎叶图的制作,图2-5 某车间工人日加工零件数的茎叶图,表达信息 Excel的使用,历届奥运会男子100米冠军成绩:12.0 10.8 11.0 10.8 10.8 10.8 10.6 10.8 10.3 10.3 10.3 10.4 10.5 10.2 10.0 9.9 10.14 10.06 10.25 9.99 9.92 9.96 9.84 9.87,有一个体育记者在写一篇评论,他希望在文章旁配一个形象的图给读者留下奥运会男子100米冠军成绩提高得很快的印象,请你帮他设计这张图。一般地,如果我们要给读者留下变化很快的印象,我们可以怎样设计图?,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号