统计学第三章统计数据的整理.ppt

上传人:小飞机 文档编号:6015800 上传时间:2023-09-14 格式:PPT 页数:48 大小:1.12MB
返回 下载 相关 举报
统计学第三章统计数据的整理.ppt_第1页
第1页 / 共48页
统计学第三章统计数据的整理.ppt_第2页
第2页 / 共48页
统计学第三章统计数据的整理.ppt_第3页
第3页 / 共48页
统计学第三章统计数据的整理.ppt_第4页
第4页 / 共48页
统计学第三章统计数据的整理.ppt_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《统计学第三章统计数据的整理.ppt》由会员分享,可在线阅读,更多相关《统计学第三章统计数据的整理.ppt(48页珍藏版)》请在三一办公上搜索。

1、第三章 统计数据的整理,重点:统计分组与分布数列的关系 第一节 统计整理 第二节 统计分组与次数分布 第三节 统计数据的显示第四节 EXCEL的应用,“绘制统计图表”任务书(三)一、任务题目:自选某一社会经济现象,将相关数据信息用统计图表反映出来。二、主要内容:学习统计分组方法和次数分布的特征;学习统计表的制作要求和方法;学习统计图的绘制方法和技巧;自选某一社会经济现象,将相关数据信息用统计图表反映出来。三、基本要求:1.所选社会经济现象可以是工商企业的生产经营数据资料;学校的人财物结构分布等。2.收集资料的方法可以是实地调查、网络调查等;3.每人用EXCEL制作一张复合分组表;同时将相关数据

2、信息绘制成圆饼图、折线图或直方图。4.将所作的统计图表存入一个文件夹,拷贝到自己的U盘备查。四、成绩评定:1评分标准。基础分:统计图表设计正确、数据真实可信。4分;加分:按时提交作业,独立完成。加1分。2.成绩占学期总成绩5%。任务下达日期:2012年 3 月 22 日 任务完成日期:2012年 3 月 30 日 指导教师签字:,任务书,第一节 统计整理 重点:统计分组的作用和方法 带着问题学:1、为什么对研究对象要进行统计 分组?2、按数量标志分组要掌握什么技 巧?,一、统计数据整理的意义和内容 意义 统计整理是指根据统计研究的需要,将统计调查 阶段搜集到的大量个体资料进行科学的分类汇总、加

3、工或再加工处理,使之系统化,条理化,成为能反 映总体特征的综合资料的过程。内容 数据处理:分组、汇总、制表。数据管理:传输、存储、更新、输出。要求科学性、条理性、充分性。二、统计数据审核与汇总 原始资料审核。数据资料分类汇总。编制统计报表或绘制统计图。数据保管和发布。,汇总技术:有传统手工汇总和现代电子计算机汇总两种技术。(1)手工汇总。常用的汇总方式有四种:划记法。划“正”字符号计数,多用于对总体单位数或次数的简单汇总。过录法。将原始资料分类过录到事先设计的汇总简表中,可用于对内容项目较多的资料的汇总。折叠法。将每张调查表中需要汇总的同类项目及数据折压一个印记,一张一张的重叠在一起,再进行汇

4、总。这种方法一次只能选择一个项目及其数据进行汇总,故适用于数据较少的资料。卡片法。将需要汇总的项目数据分类登记在卡片上,再汇总计算。这种方法适用于总体单位数多、且多采用复合分组形式的事物,特别是设备、器材类的实物资产的汇总。(2)电子计算机汇总。其数据处理程序如下:第一步,编程。使用计算机语言编写出一套完整的数据处理程序。第二步,数据录入。计算机自动按程序进行数据处理,并将数据处理结果存储在磁盘、磁带等磁介质中。第三步,审核。对程序设计进行逻辑性审核;对录入数据进行误差审核。第四步,输出结果。,第二节 统计分组与次数分布,重点:对变量数列进行统计分组 带着问题学:1、为什么对研究对象要进行统计

5、 分组?2、对变量数列如何正确进行分组 3、次数分布有哪些表现形式?,第二节 统计分组与次数分布(重点节),一、统计分组 1、统计分组的概念和作用 根据研究任务需要,将总体中所有单位按一定的标志划分为若干性质不同而又有联系的部分的一种统计方法。对总体是分;对总体单位是合。科学性原则:关键是正确选择分组标志。互斥性原则:同组同性。2、统计分组的作用 划分社会经济现象类型。研究总体内部结构。分析现象之间的依存关系。,(三)统计分组的方法(重点),1、按分组标志个数简单分组和复合分组。简单分组 only one 复合分组 two or greater(按两个或两个以上标志分组,且重叠排列.)2、按分

6、组标志性质品质标志分组与数量标志分组。数量标志分组(又称变量分组)中根据离散型 变量和连续型变量不同可进行单项式分组或组距式 分组。,(例:复合分组)某地区2009年工业总产值和职工人数,某地区工业企业2009年基本情况统计表,这是复合分组表吗?,(例:离散型变量单项式分组)某汽配厂生产“东风”汽车某种配件产量统计表,(例:离散型变量组距式分组)某企业工人日产量登记表次数表,(例:连续型变量组距式分组)某班学生考试成绩次数表,注意:相邻两组的上下限是否重合?,课堂练习题判断题1:下面的两种分组中,分组方法正确的是()1 2,第二种分法有两个错误:同组异性;数值断缺、脱节。,二、次数分布(分配数

7、列),1、次数分布的概念 概念_指在统计分组的基础上,形成 总体单位在各组间的分布的一种数列。2、要素 组名(标志);总体单位数(次数、频数或频率)3、分布数列的种类 品质数列(属定性数列)例P59表3.7;变量数列(属定量数列)例P59表3.8_3.10。,2、次数分布的类型及图示,U 形分布,正J 形分布,反J 形分布,统计分组与分布数列的对应关系及内容,统计分组 分布数列(以标志为主线,组距式分组为重点)(以分组为基础,以两要素为纲展开标志 标志 一个_简单分组 品质标志_品质数列个数 数量标志_变量数列 多个_复合分组)单位数(表现形式)品质标志 绝对数_频数(次数)性质 相对数_频率

8、 数量标志 离散型 单项式 连续型 组距式 组数 组距 等距(均匀分布),异距(不均匀分布)上限下限 组限 开口组(缺限)_ 邻组组距作本组组距.上下限重合_下限在内,上限不在内(指该单位数)组中值 假定性(组内各单位均匀分布,组间分布可不均)计算:(上限值+下限值)/2,(二)变量数列的编制,(例:品质数列)某地区2009年底按三次产业分类的就业人数,3、变量数列的编制 某班学生统计学考试成绩分布表,判断题:下面的两个统计资料中,属于分配数列的是()1.2.,第二个表是。具备了分配数列的两要素。,返回,第三节 统计数据的显示(重点节),重点:统计表、统计图的制作。带着问题学:1、统计表的结构

9、和种类有哪些?2、复合分组表的特点是什么?3、统计图有哪些种类?怎样正确选 用统计图来反映社会经济现象?,第三节 统计数据的显示 重点:统计图表的制作(一)统计表,1、统计表的概念 统计表指将经过调查整理的统计数据资料填列在表格中,形成统计表。,、统计表的结构(例P65表3.12)按形式:按内容:标题总标题(表名)横栏标题(组名).主词 纵列标题(指标).宾词 格线(左右两端不封口)数字(绝对数,相对数,平均数),3、统计表的种类,按主词是否分组及分组标志的个数多少分为:简单表(未分组表)no(例如:职工工资表、学生成绩单、零售商品销售流水账等)分组表 yes 简单分组表 only one 复

10、合分组表 two or greater(按两个或两个以上标志分组,且重叠排列.),简单表例:某班学生统计学成绩(分),75 90 68 73 75 86 68 89 87 6272 86 83 71 74 77 84 95 80 9051 66 62 79 75 83 81 53 60 6549 68 70 70 72 75 82 83 90 9185 89 77 75 63 86 82 80 81 8587 78 76 95,例:复合分组表 某地区2009年工业总产值和职工人数,(二)统计图(重点),直方图 折线图 曲线图累计曲线图 茎叶图 箱图饼图 EXCEL,1、直方图:用直方形的宽度和

11、高度来表示频数分布的图形,即在直角坐标系上,以横轴表示变量,以纵轴表示频数或频率,以各个宽度为组距、高度为频数或频率的直方块矩形所构成的图形。2、折线图:在直方图的基础上,将各组直方形顶边线的中点(即由组中值与频数或频率确定的坐标点)用直线连接起来,就形成为折线图。3、曲线图:当变量数列的分组数较多、组距较小时,折线图就变成了平滑的曲线图。4、累计曲线图:根据累计频数或累计频率分布数列,可以绘制累计分布图。它以分组变量为横轴,以累计频数或累计频率为纵轴,以各组的上限(下限)与累计频数或累计频率为坐标点,平滑连接各点即成向上(向下)累计曲线。5、茎叶图:茎叶图是一种用以表现原始数据分布状况的图形

12、,由“树茎”与“树叶”两部分构成,并且都是以数字来表示的。6、箱形图:箱形图是由变量的5个特征值绘制而成的图形,由一个箱子和两条线段组成。5个特征值是变量的最大值、最小值、中位数、第一四分位数和第三四位数(中位数和分位数在下一章介绍)。连接两个分位数画出一个箱子,箱子用中位数分割,把两个极点值与箱子用线条连接,即成相形图。,直方图(条形图),直方图(条形图),2009年四川部分地区 城乡居民储蓄存款余额,饼图(圆形图),股票K线图,折线图,累计曲线图(据某校教师年龄数据绘图)累计频数(人)累计频率(%),。,。,。,。,。,。,。,。,。,。,洛伦茨曲线,A,B,基尼系数是国际上综合考察居民内

13、部收入分配差异状况的指标联合国定:.绝对平等;.比较平均;.相对合理;.差距较大;.以上差距悬殊国际警戒线.,绝对平等线,实际收入分配曲线,茎叶图(假设):工人日加工零件茎叶表,象形图,第四节 EXCEL的应用,重点:运用EXCEL的功能(统计函 数)进行数据处理。带着问题学:1、EXCEL表进行数据处理的程序是 什么?2、对组距式变量数列进行次数统计时,手工汇总与EXCEL处理的区别何在?,例:某班54名学生按学号登记的统计学期末考试成绩:75 90 68 73 75 86 68 89 87 6272 86 83 71 74 77 84 95 80 9051 66 62 79 75 83 8

14、1 53 60 6549 68 70 70 72 75 82 83 90 9185 89 77 75 63 86 82 80 81 85 87 78 76 952、排序 1打开EXCEL工作表。将原始数据录入相应的单元格区域中“B2:B55”。2排序。光标指向B2单元格,按下鼠标左键,拖曳光标覆盖B2:B55区域(如图3-15),选定数据区域。左击“数据”菜单,弹出下拉菜单。选择并单击“排序”按钮,弹出对话框,在“主要关键字”空格内输入“成绩(分)”。若需从小到大排序,则单击“升序”按钮前面的圆圈;若需从大到小排序,则单击“降序”按钮前面的圆圈,再按“确定”按钮。,3分组及分布数列 分组。在C

15、1单元格输入“分组上限值”,在C2:C6采用键盘输入方式输入各组上限值。需要注意的是,因为EXCEL的FREQUENCY函数进行次数(频数)统计时采用的是“上限值包含在内”的原则,意即不会发生相邻两组上下限重合的现象,但C2:C6各组的实际组距与图3-16中内嵌的一张成绩分布表的“按成绩分组”栏的D4:D8区域内的组距是一致的。,次数分布(频数和频率)。光标指向E4单元格,按下鼠标左键,拖曳光标覆盖E4:E8E区域。单击“插入”菜单,在下拉菜单在选择“函数”,弹出“插入函数”界面。在“选择类别”的空格内选择“统计”。在“选择函数”框内选择FREQUENCY函数,再按“确定”按钮。如图3-16所

16、示。,统计函数:频数“FREQUENCY”,在弹出的对话框“函数参数FREQUENCY”中的“Data-array”框内输入原始数据所在的数据区“B2:B55”,在“Bins-array”框内输入分组上限值所在的数据区“C2:C6”,然后同时按下“Ctrl-Shift-Enter”三个键,便可以得到图3-17中E4:E8所示的各组次数。计算合计数。在E9单元格中输入公式“=SUM(E4:E8)”,再按回车键即得。计算各组比重(频率)。在F4单元格中输入公式“=E4/$E$9*100”,再按回车键即得第一组占全部人数的比重(频率)。然后将F4单元格中的公式复制到数据区域内的其它单元格。方法是光标

17、指向F4单元格右下角,此时光标变成实体小十字星“+”,按下鼠标左键,拖曳到F8单元格,即可得到其余各组的频率。计算合计数。在F9单元格中输入公式“=SUM(F 4:F8)”,再按回车键即得。也可以从E9单元格复制,方法是光标指向E9右下角,此时光标变成实体小十字星“+”,按下鼠标左键,拖曳到F9单元格,即可得到频率合计数。,向上累计次数和频率:,在G4单元格中输入公式“=E4”,意即将初始值“3”存入G4单元格。在G5单元格输入公式“=G4+E5”,意即将第一组次数与第二组次数的累计数存入G5单元格,按回车键即可得G5单元格的累计数。然后将G5单元格中的公式复制到数据区域内的其它单元格。方法是

18、光标指向G5单元格右下角,此时光标变成实体小十字星“+”,按下鼠标左键,向下拖曳到G8单元格,即可得到其余的累计数。同理,在H4单元格中输入公式“=F4”,意即将初始值“5.5555”存入H4单元格。在H5单元格输入公式“=H4+F5”,意即将第一组频率与第二组频率的累计数存入H5单元格,按回车键即可得H5单元格的累计数。然后将H5单元格中的公式复制到数据区域内的其它单元格。方法是光标指向H5单元格右下角,此时光标变成实体小十字星“+”,按下鼠标左键,向下拖曳到H8单元格,即可得到其余的累计数。,向下累计次数和频率:,在I8单元格中输入公式“=E8”,意即将初始值“6”存入I8单元格。在I7单

19、元格输入公式“=I8+E7”,意即将第五组(最后一组)次数与第四组次数的累计数存入I7单元格,按回车键即可得I7单元格的累计数。然后将I7单元格中的公式复制到数据区域内的其它单元格。方法是光标指向I7单元格右下角,此时光标变成实体小十字星“+”,按下鼠标左键,向上拖曳到I4单元格,即可得到其余的累计数。在J列进行累计频率的操作。其操作步骤和原理与次数累计相同。次数和频率的“合计”栏不填数字。在G9单元格输入“/”,复制到H9:J9区域即可。全部计算结果如图3-18所示。,返回,本章小结 1统计整理是对统计资料进行分组、汇总、编表,使其系统化、条理化的过程。2统计分组是把总体按照某一标志划分为若

20、干性质不同而有联系的若干组。统计分组可以按标志性质或按标志的个数分组(即简单分组和复合分组)。3统计分组的关键是选择分组标志。选择能反映现象本质的代表性标志。4分组方法中侧重掌握变量的组距式分组。对离散型变量可用单项式分组和组距式分组;对连续型变量只能采用组距式分组。(1)在组距式分组中,组距、组数的确定应以变量值的分散程度而定。(2)组限的划分:按离散型变量分组时,各相邻组的组限不重叠;而连续型变量分组时,相邻组的上、下限会重叠。开口组组限的确定,是以邻组组距为本组组距进行推算补缺的。(3)组中值的计算前提是假定各组内变量值的变动是均匀的,所以它是上下限数值的简单平均数。5分布数列是在统计分组的基础上形成的总体单位在各组间的分布的数列。由组名(标志)和总体单位数两个要素组成。分布数列分为品质数列和变量数列两种。6.统计表从构成要素看,由总标题、横行标题、纵列标题、格线和统计数字等部分组成。从内容上看,统计表主要包括主词和宾词两个部分。统计表按照主词是否分组分为简单表、分组表两大类,分组表按照标志个数又分为简单分组表和复合分组表两种。7使用EXCEL进行频数计算时,主要是应用统计函数FREQUENCY进行处理。,思考与练习题一、判断题:第5、7题二、简答题:第2题技能训练题 实践题 本章布置的项目任务,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号