统计学基础课件(第三章统计数据的整理与展示).ppt

上传人:牧羊曲112 文档编号:5375160 上传时间:2023-07-01 格式:PPT 页数:104 大小:5.27MB
返回 下载 相关 举报
统计学基础课件(第三章统计数据的整理与展示).ppt_第1页
第1页 / 共104页
统计学基础课件(第三章统计数据的整理与展示).ppt_第2页
第2页 / 共104页
统计学基础课件(第三章统计数据的整理与展示).ppt_第3页
第3页 / 共104页
统计学基础课件(第三章统计数据的整理与展示).ppt_第4页
第4页 / 共104页
统计学基础课件(第三章统计数据的整理与展示).ppt_第5页
第5页 / 共104页
点击查看更多>>
资源描述

《统计学基础课件(第三章统计数据的整理与展示).ppt》由会员分享,可在线阅读,更多相关《统计学基础课件(第三章统计数据的整理与展示).ppt(104页珍藏版)》请在三一办公上搜索。

1、,第三章 统计数据 的整理与展示,教学目的与要求:本章阐述统计整理的理论与方法,包括统计分组、汇总和统计表的设计。学习本章,要求:1.明确统计整理在统计研究中承前启后的地位。2.掌握分组方法和汇总技术。3.认识统计分布是统计整理的重要表现形式。4.学会统计表的编制并能熟练运用,统计学原理(第三讲),第一节 统计的整理整理,一、统计数据整理的概念,根据统计研究的任务与要求,对统计调查阶段所搜集到的原始资料进行加工与汇总,使其条理化、系统化的工作过程称统计整理。统计整理包括对原始资料和次级资料的整理。,统计整理是统计调查的继续,统计分析的前提和基础。,(二)统计数据整理的程序,制定统计整理方案,统

2、计资料的审核,进行统计分组,进行加工汇总编制分配数列,编制统计表和绘制统计图,统计数据资料的积累保管和公布,二、统计分组,根据统计研究任务的要求和研究现象总体的内在特点,把现象总体按某一标志划分为若干性质不同但又有联系的几个部分称统计分组。,(一)统计分组的概念,例如,将某一班级的全体同学按照性别划分为男、女两个组;对某市100家大型零售商店按照零售额、职工人数进行分组等。,统计分组具有两个方面的含义:对总体而言,是“分”,即将同质总体区分为性质有别的不同组成部分;对总体单位而言,它是“组”,即将性质相同或相近的不同总体单位组合在一起,构成一个组。,例如,要了解我国人口状况,只知道总人口数量是

3、不够的,而应将人口总体按照年龄、性别、民族、城乡、文化程度等分组,才能进一步地深入地了解我国人口总体的年龄结构、性别比例、民族构成等。,(二)统计分组的分类,按分组标志的多少,简单分组,只按照一个标志进行分组,复杂分组,按照两个或两个以上的标志进行分组,并且层叠在一起。,如企业按经济类型,隶属关系、规模、轻重工业分组均属于简单分组:,按经济类型分组国有经济集体经济私营经济个体经济联营经济股份制经济外商投资经济港澳台投资经济,按隶属关系分类中央企业地方企业,按轻重工业分类轻工业重工业,按企业规模分类大型工业企业中型工业企业小型工业企业,复合分组是先按一个标志分组,在此基础上再按第二个标志分组,又

4、再此基础上按照第三个标志分组,依次类推。,如工业企业先按轻重工业分组,在此基础上又按企业规模分类,轻工业大型企业中型企业小型企业,重工业大型企业中型企业小型企业,复合分组的特点是可以从不同的角度了解总体内部的差别和关系,比简单分组更全面更深入的研究问题,注意两点,1、分组的标志不宜过多,2、只有在总体包含的单位数很多的情况下,适当采取分组才有意义,按分组标志的性质,品质分组,按品质标志进行分组。主要反映被研究现象的质的属性或特征,变量分组,按照数量标志进行的分组。主要反映的是总体单位的数量特征。,二、统计分组的原则,统计分组必须遵循穷尽和互斥两条原则。穷尽原则就是总体中的每一个单位都有组可归,

5、无一遗漏。互斥原则就是在特定的分组标志下,总体中的任何一个单位只能归属于某一组,而不能同时归属几个组。,(三)、分组标志的选择,分组标志是将现象总体划分为不同类型的组的标准或依据。,统计分组的关键是分组标志的选择,因为选择什么样的分组标志就有什么样的分组,什么样的分组体系。分组标志选择的是否正确,关系到能否正确地反映总体的性质特征,能否实现统计研究的目的和任务。,分组标志一旦选定,就必然突出了总体在该标志下性质差异掩盖了总体在其他标志下的差异。分组标志选择不当,就无法显示现象的根本特征,歪曲社会经济的真实情况。正确选择分组标志是保证实现统计分组任务的关键,是统计研究获得正确结论的前提。,恰当得

6、选择分组标志,须注意一下问题:,1、根据统计研究的目的进行选择,2、若干个标志,要选择最能反映事物本质特征的标志作为分组标志,另:同一标志在某以历史条件下最能反映事物的本质特征,而在另一历史条件下不一定能反映事物的本质特征。,(三)、关于分组标志的选择问题,1为什么说统计分组的关键是分组标志的选择?,2怎样正确选择分组标志?,四、统计分组的方法,1、品质分组的方法,按品质标志分组就是选择反映事物属性差异性的品质标志作分组标志,并在品质标志的变异范围内划分各组界限,将总体划分为若干性质不同而又有联系的几个部分。,例如,人口按性别、文化程度、民族、籍贯等标志分组;企业按经济类型、轻重工业、隶属关系

7、,企业规模等标志分组等。,2、变量分组的方法,变量分组就是选择反映事物数量差异的数量标志作为分组标志,并在数量标志的变动范围内划分各界限,将总体划分为若干性质不同而又有联系的组成部分。,例如,地区经济按国内生产总值分组、企业按销售收入分组等,(1)单项分组与组距分组单项式分组 一个变量作为一组 组距式分组 一个区间作为一组,如果变量值的变动幅度较小,就可采用单项式分组。如果变量值的变动幅度较大,采用组距式分组。,单项式分组 组距式分组家庭按儿童数分组 职工按月工资分组 0 700-800 1 800-900 2 900-1000,2等距分组与不等距分组 区间的距离叫组距。在组距式分组中,如果每

8、组的组距相等,则称为等距分组;不相等则称为不等距分组 应用条件:标志值变动比较均匀的情况下,采用等距分组。如产品合格率、企业按职工人数分组、职工按月工资分组等。标志值变动不均匀,变动幅度较大时,采用不等距分组。如人口普查,将人口按年龄分组为:0-14岁、15-64岁和65岁以上三个组。,3组限与组中值,在进行组距式分组时,组距两边的数据称为组限。每组的起点值称为下限,每组的终点值称为上限。,组距就是上限与下限之差。,组中值是上限与下限的中点数值,它是各组上下限数值的简单平均,用来代表组标志值的一般水平。计算方法是(上限+下限)/2或(下限+组距/2).,统计学原理(第三讲),按学生人数分组 按

9、工资分组50-59 400-50060-69 500-60070-79 600-70080-90 700-800,按工资分组 组中值 人数300元以下 250 10300400 350 20400600 500 25600元以上 700 12,组中值的计算,离散变量相邻两组的上下限既可以间断,也可以重叠;连续变量相邻两组的上下限只能重叠。,在确定组限时应该注意:第一,最下组的下限应低于最小变量值,最大组的上限应高于最大变量值第二,组限的确定应该有利于反映总体分布的规律性第三,如果组距为5,10,-、100,则每组的下限最好是他们的倍数。,(一)分配数列的概念、构成要素 在统计分组的基础上,总体

10、中的所有单位按其所属的组别归类整理,并且按照一定的顺序排列,形成总体单位数在各组分布的一系列数字,称为分配数列,又称次数分配或次数分布。分配数列中,分布在各个组的总体单位数叫次数,又称频数。如果将分组标志序列与各组相对应的频率按照一定的顺序排列,就形成频率分布数列。分配数列有两个组成要求:一是分组;另一个是次数或比率。它可根据分组标志的性质不同,可以分为品质数列与变量数列。,五、分配数列,2000年我国人口性别构成情况,分组名称,次数(频数),比率(频率),(二)品质数列与变量数列,它是按品质标志分组的数列,用来观察总体单位中不同属性的单位分布情况。如上表就是品质数列。,品质数列的编制比较简单

11、,但要注意分组时,应包括分组标志的所有表现,不能有遗漏,各种表现相互独立,不得相融。,变量数列是将总体按数量标志分组,将分组后形成的各组变量值与该组中所分配的单位次数或频数,按照一定的顺序相对应排列所形成的分配数列。,某班级统计学成绩分布表,(各组变量值)(次数)或(频数)比率,(变量分组),第一步,将原始资料按数值大小依次进行排列第二部 确定变量的类型和分组的方法(如单项式分组或组距式分组第三步,确定组数和组距:组距=全距/组数 全距=最大值-最小值第四步,确定组限以及表示方法第五步,汇总各组出现的次数,并计算频率,(三)变量数列的编制方法,例对某企业30个工人完成劳动定额的情况进行调查,某

12、原始资料如下(%)98 81 95 84 93 86 91 102 100 103105 100 104 108 107 108 106 109 112 114 117 125 115 120 119 118 116 129 113可以通过编制变量数列来反映工人的完成情况,步骤如下,第一步:计算全距将各变量值由小到大排序,确定某最大值,最小值,并计算全距。变量的最大值是129最小值是81,全距=最大值-最小值=129-81=48第二步:确定组数和组距在等距分组时,组距与组数的关系是:,本例中根据一般将成绩分成优、良、中、及格和不及格的五档评分习惯,可以先确定组数为5。在等距分组时,计算组距如下

13、:,组距=48/5=9.6,为了符合习惯和计算方便,组距近似地取 10,第三步:确定组限关于组限的确定,应注意如下几点:第一,最小组的下限(起点值)应低于最小变量值,最大组的上限(终点值)应高于最大变量值。第二,组限的确定应有利于表现出总体分布的特点,应反映出事物质的变化。第三,为了方便计算组限应尽可能取整数,最好是5或10的整倍数。第四,由于变量有连续型变量和离散型变量两种,其组限的确定方法是不同的。,某企业30个工人劳动定额完成情况分布图表,第四步:编制频数(频率)分布表,第五步:计算累计频数和累计频率 为了更详细的认识变量的分布特征,还可以计算累计频数和累计频率,编制累计频数和累计频率数

14、列。累计频数和累计频率有向上累计频数(频率)和向下累计频数(频率)两种。以变量值大小为依据,由变量值小的组向变量值大的组累计频数和频率,成为向上累计频数和向上累计频率。向上累计数的意义是:小于各组的该组上限的各组的频数或频率之和;相反,由变量值大的组向变量值小的组累计各组的频数或频率,称为向下累计频数或向下累计频数。向下累计数的意义是:大于及等于该组下限的各组的频数或频数或频率之和。根据某企业工人完成劳动定额的资料编制的向上累计频数(频率)和向下累计频数(频率)分布如表38。表38 某企业工人完成劳动定额累计分布表,表38 某企业工人完成劳动定额累计分布表,(四)次数分布的主要类型,(一)钟形

15、分布钟形分布的特征是“两头小、中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少,如果将变量值与其对应的频数在直角坐标系中对应的点连接起来绘制成曲线图,宛如一口钟,所以又称钟形分布。,在自然或社会经济现象中,有许多次数分布是属于钟形分布的。例如,人体体重、身高,学生的成绩,居民货币收入,单位面积的农产品产量,市场价格等现象都属于钟形分布。,(二)U形分布 U形分布的特征是:靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,形成“两头大,中间小”的分布特征。将这种分布绘成曲线,像英文字母“U”的形状,故称U形分布 例如,人口死亡率的分布,一般是婴幼儿死亡率和老年人死

16、亡率均较高,而中年人死亡率最低,所以人口年龄分组的死亡率是呈U形分布的。另外,失业人口按年龄的分布等均呈U形分布。,(三)J形分布 J形分布的特征是“一边小,一边大”,即大部分变量值集中在某一端分布,有两种类型。1、正J形分布 正J形分布是次数随着变量值的增大而增多。如投资额按利润率大小分布,一般是正J形分布。2、反J形分布 反J形分布是次数随着变量值的增大而减小。如成年人数量按年龄大小分组,表现出年龄越高,人数越少。,第二节 统计数据的展示 一、统计表1.统计表的概念 统计表是表现统计资料的一种形式。把经过大量调查得来的统计资料,经过汇总整理以后,按照一定的规定和要求填列在相应的表格内,就形

17、成了一定的统计表。2、作用 统计表对表现统计资料具有重要作用。统计表是统计整理的重要形式。它利用表格形式,合理地安排统计资料,清晰、简明地反映出现象总体的特征。统计表通过科学、合理地表现统计资料,便于对统计资料进行对照比较和分析,有利于计算统计分析指标。在统计分析报告中使用统计表,能节省文字叙述篇幅,达到简明易懂、紧凑有力的分析效果。统计表还是汇总和积累统计资料,进行统计分析的重要工具。,3、结构 从外表形式上看,是由四部分构成:(1)总标题:它是表的名称,用于概括统计表中要说明的内容。(2)横行标题:它是各组的名称,反映总体各组成部分的。(3)纵栏标题:它是分组标志或指标的名称,说明纵行所列

18、各项资料的内容。(4)指标数值:也称数字资料,它是统计表的具体内容,从统计表的内容来看,由主词和宾词两个部分组成。主词是统计表所说明的总体,总体的各组或各组的名称。宾词是用于说明主词的各种指标。通常,统计表的主词列在表的左方,宾词列在表的右方。,4.统计表的种类统计表按照总体分组情况不同,可分为简单表、分组表和复合表三类。1、简单表是主词未经过任何分组,反映出总体各单位的名称或按时间顺序简单排列,或同时反映以上内容的统计表。2、分组表分组表是主词按照一定标志分组的统计表,也称简单分组表。它可以揭示出现象的不同类型的特征,研究现象的内部结构。3、复合表复合表是主词按照两个或两个以上的标志层叠分组

19、所形成的统计表。,我国五次人口普查家庭规模统计表,(按时间顺序排列简单表),2004年我国普通小校和学生情况,(分组表),五、统计表的编制规则,(1)表的各种标题,特别是总表题,要简明确切,概括地反映出表的基本内容,表明统计资料所属地点和时间.,(2)表中的横行标题各行,纵栏标题各栏一般按照先局部后整题的原则排列.,(3)如果统计表的栏数较多,通常应加以编号.主词栏和计量单位各栏,一般用甲乙丙等文字编号;宾词栏各统计指标一般用数字编号.,(4)表中的数字要对准位数,填写整齐,当某项无数字时,用规定符号表示.,(5)统计表的上下横线一般用粗线条封口,左右两端不封口,即统计表采用开口表格式.,二、

20、统计图,(一)含义 通过几何图形或具体事物的形象和符号来表现统计资料的方式。(二)优点 鲜明直观 形象生动 通俗易懂 一目了然 易读易记 印象深刻,(三)统计图的分类,1.几何图 利用点、线、面等几何图形来表示统计资料的统计图形。,2.象形图 是利用事物本身的形象来表明现象的数量特征的统计图形。,3.统计地图 是利用点、线、面或事物的形象在地图上显示现象的分布状况的统计图形。,2011年11月7日各版块资金流入统计图,线形图:,15%,6%,9%,8%,33%,29%,饮食,教育,娱乐,旅游,交通,服装,深圳市家庭支出结构:,面积图,统计地图:,合成纤维人造纤维的地域分布,(四)统计图的构成,

21、1 图题,图8,某国各地降水量,降水量(毫米),2 图号,3 图目,4 图尺,5 图形,6 图注,图题,图号,图目,图尺,图形,图注,图目,(1)什么是线形图?,是以线条的连续升降来表示现象动态及现象间的依存关系的统计图形。,1.线形图的绘制,(五)常用的几种统计图的绘制,技能训练时间和成绩相关资料,(2)线形图的绘制,某企业1998年各月产量资料,做做看,800,600,400,200,2 4 6 8 10 12,200,400,600,100,500,700,0,月份,产量(件),月份,纵横轴比度不恰当的图形,某企业1998年各月产量资料,你做对了吗?,1998年末深圳、香港、新加坡人口比

22、较 单位:万人,反映同类现象在不同时期上的发展变化,反映计划执行情况,反映现象内部的结构,深圳、香港、新加坡人口比较 单位:万人,反映同类现象在不同空间的比较,用Excel绘制统计图,本章练习,一、判断题部分 1.对统计资料进行分组的目的就是为了区分各组单位之间质的不同。(),2.统计分组的关键问题是确定组距和组数。(),3.某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。(),4.连续型变量和离散型变量在进行组距式分组时,均可采用相邻组组距重叠的方法确定组限。(),5.按数量标志分组形成的分配数列和按品质标志分组形成的分配数列,都可称为次数分布。(),6.按数量标志分组的目的,就

23、是要区分各组在数量上的差异。(),7.统计分组以后,掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。(),二单项选择题部分1.统计整理的关键在()。.对调查资料进行审核.对调查资料进行统计分组.对调查资料进行汇总.编制统计表,B,2.在组距分组时,对于连续型变量,相邻两组的组限()。.必须是重叠的.必须是间断的.可以是重叠的,也可以是间断的.必须取整数,A,3.下列分组中属于按品质标志分组的是()。.学生按考试分数分组.产品按品种分组.企业按计划完成程度分组.家庭按年收入分组,B,4.有一个学生考试成绩为分,在统计分组中,这个变量值应归入()。.60-70分这一组.70-80分这一组.

24、6070或7080两组都可以.作为上限的那一组,B,5.某主管局将下属企业先按轻、重工业分类,再按企业规模分组,这样的分组属于()。.简单分组.复合分组.分析分组.结构分组,B,6.简单分组和复合分组的区别在于()。.选择的分组标志的性质不同.选择的分组标志多少不同.组数的多少不同.组距的大小不同答案:,B,7.有20 个工人看管机器台数资料如下:2,5,4,4,3,4,3,4,4,2,2,4,3,4,6,3,4,5,2,4。如按以上资料编制分配数列,应采用()A.单项式分组 B.等距分组 C.不等距分组 D.以上几种分组均可以,A,8.在分组时,凡遇到某单位的标志值刚好等于相邻两组上下限数值

25、时,一般是()。A.将此值归入上限所在组 B.将此值归入下限所在组 C.此值归入两组均可 D.另立一组,B,9.次数分配数列是()A.按数量标志分组形成的数列B.按品质标志分组形成的数列C.按统计指标分组所形成的数列D.按数量标志和品质标志分组所形成的数列,D,10.划分连续变量的组限时,相邻组的组限必须()。A.重叠 B.相近 C.不等 D.间断,A,11.将某地区国有企业按利润计划完成程度分为以下四组,正确的是()。A:第一种 B:第二种 C:第三种 D:第四种 80%-89%80%以下 80%以下 85%以下 90%-99%80.1%-90%80%-90%85%-95%100%-109%

26、90.1%-100%90%-100%95%-105%110%以上 100.1%-110%100%-110%105%-115%110.1%以上 110%以上 115%以上,C,12.复合分组是()。A.用同一标志对两个或两个以上的总体层叠起来进行分组B.对某一总体选择一个复杂的标志进行分组C.对同一总体选择两个或两个以上的标志层叠起来进行分组D.对同一总体选择两个或两个以上的标志并列起来进行分组,C,13.对总体按某个标志进行分组,得到的统计表属于()。A.分组表 B.复合表 C.简单表 D.整理表,A,三多项选择题,1.下列分组哪些是按品质标志分组()A.职工按工龄分组 B.科技人员按职称分组

27、 C.人口按民族分组 D.企业按经济类型分组 E.人口按地区分组,2.下面哪些分组是按数量标志分组()A.企业按销售计划完成程度分组 B.学生按健康状况分组 C.工人按产量分组D.职工按工龄分组 E.企业按隶属关系分组,A C D,3.将某地区国有企业按产值计划完成程度分为以下四组,哪些是正确的?()、第一种、第二种、第三种、第四种 100%以下 80%以下 80%以下 85%以下 100%110%80.1%90%80%90%85%95%110%以上 90.1%100%90%100%95%105%100.1%110%100%110%105%115%110.1%以上 110%以上 115%以上,

28、AC,4.下列数列属于()按生产计划完成程度分组(%)企业数 8090 15 90100 30 100110 5 合 计 50、品质分配数列、变量分配数列、组距式变量分配数列、等距变量分配数列、次数分配数列,B C D E,5.统计表按主词是否分组及分组的程度,可分为()A.简单表 B.一览表 C.分组表 D.复合表 E.单一表,A C D,四填空题部分 1.统计整理实现了个别单位的()向说明总体数量特征的()过渡。,标志值,指标值,2.统计分组按分组标志的多少不同,可分为()和()两种。,简单分组,复合分组,3.社会劳动力资源按学历程度不同分组,属于(),按劳动生产率水平分组属于()。,品质

29、分组,变量分组,4.统计分组按分组标志的多少不同,可分为()和()两种.,简单分组,复合分组,5.离散变量分组中,变量值变动幅度比较小时,应采取(),如变量值变动很大,项数很多时则采取()。,单项式分组,组距式分组,6.统计分布主要包括()和()两个要素。,统计分组,各组单位数,7.根据分组标志的不同,分配数列可分为()和()。,品质数列,变量数列,8.变量数列中各组标志值出现的次数称(),各组单位数占单位总数的比重称()。,頻数,頻率,9.累计()和累计()可以更简便地概括总体各单位的分布特征。,頻数,頻率,10.任何一个统计分布都必须满足()和()两个条件。,各组頻率大于零,各组頻率之和等于1(或100%),五简答题部分1.为什么说统计分组的关键在于分组标志的选择?2.变量分组的种类及应用条件。3.单项式分组和组距式分组分别在什么情况下运用?4.什么是统计分组?统计分组可以进行哪些分类?5.什么是统计分配数列?它包括哪两个要素?,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号