统计认知与技术-统计整理技术.ppt

上传人:小飞机 文档编号:6332946 上传时间:2023-10-17 格式:PPT 页数:49 大小:9.66MB
返回 下载 相关 举报
统计认知与技术-统计整理技术.ppt_第1页
第1页 / 共49页
统计认知与技术-统计整理技术.ppt_第2页
第2页 / 共49页
统计认知与技术-统计整理技术.ppt_第3页
第3页 / 共49页
统计认知与技术-统计整理技术.ppt_第4页
第4页 / 共49页
统计认知与技术-统计整理技术.ppt_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《统计认知与技术-统计整理技术.ppt》由会员分享,可在线阅读,更多相关《统计认知与技术-统计整理技术.ppt(49页珍藏版)》请在三一办公上搜索。

1、统计认知与技术(项目三统计整理技术),陆立才,盐城生物工程高等职业学校,项目三 统计整理技术,学习目标及重难点提示学习目标认知统计整理的含义和步骤。学会运用Excel软件对数据进行排序、筛选和分组。能运用统计分组的方法,正确选择分组标志和划分各组界限,并规范地编制分配数列。地位及重难点提示统计工作过程的承前启后的作用。重点是正确选择分组标志和划分各组界限,并规范地编制分配数列。,任务一认知统计整理,任务引入:学校对某班级进行调查,发现40名学生统计考试成绩分别为:(单位:分)63 57 82 82 73 77 72 62 70 88 67 89 88 84 86 87 75 73 72 667

2、8 82 97 56 81 54 79 76 96 7473 60 90 64 76 74 76 83 89 93用统计整理的方法,对数据进行加工整理,用图表形式将数据展示出来,掌握学生的学习情况。,任务一认知统计整理,一、统计整理的概念和意义,任务一认知统计整理,二、统计整理的步骤,任务一认知统计整理,二、统计整理的步骤,任务一认知统计整理,二、统计整理的步骤,任务一认知统计整理,三、统计数据的审核1.数据的准确性2.数据的及时性3.数据的完整性,完成任务:学生成绩统计表,任务二数据排序,一、数据排序的含义 数据排序是将所有总体单位按照字段中常量(即标志值)的大小按顺序重新排列,由此形成新的

3、数据序列的方法。二、用Excel进行数据排序的方法现要求将学生按总分从高到低排序,如果总分相同再按学号从低到高排序,任务二数据排序,第一步:选中所有数据,即从A1到H16,这时选中区域出现蓝底色。,任务二数据排序,第二步:单击“数据”菜单栏,选择“排序”菜单,于是出现“排序”对话框。,任务二数据排序,第三步:在 排序对话框中点击自定义排序“主要关键字”栏选择“总分”,右面选“降序”,在“次要关键字”栏选择“学号”,右面选“升序”,然后单击“确定”按钮,于是所有学生便按总分从高到低排序,如果总分相同再按学号从低到高排序,任务二数据排序,第四步:加上“名次”字段,在I1中输入“名次”,在I2,I3

4、中分别输入“1”和“2”,选中I2:I3,将光标移到I3单元格的填充柄处,按住左键不放拖至I16,于是就会出现名次排序结果。,任务二数据排序,三、用Excel进行排序要注意的问题1.通常情况下,进行排序操作前要将重新排列的数据全部选中,否则当数据中出现空列和空行时,在空列和空行另一边的数据不会跟着一起变化。2.当选中的数据第一行没有字段名时,则要在“排序”对话框中选择“无标题行”,这时是以列号作关键词,如“列A”、“列B”。3.以上举例是按列排序,也可以按行排序,只要在“排序”对话框中单击“选项”按钮,再在“选项”对话框中选中“按行排序”,单击“确定”后,便可实现按行排列。4.Excel对数据

5、的大小判断按如下规则进行:(1)数值型日期型字符型;(2)字符型中,符号数字字母汉字,作为字符型输入数字时冷面要加西文状态下的引号();(3)字母中,aAbBzZ;(4)汉字一般按照汉语拼音的首字母大小排序,如果首字母一样则按第二个字母大小排序,依此类推。(5)关键词下面的汉字有音同字不同的情况时,Excel排序时将关键词中相同的字(词)的记录连排在一起。,任务三数据筛选,一、数据筛选的含义 数据筛选就是将符合条件的总体单位记录留下来,不符合条件的总体单位记录剔除掉,以掌握有多少总体单位符合条件。二、用Excel进行数据筛选的方法(会计80分以上的同学),任务三数据筛选,第一步:选中需要筛选的

6、区域,即从A1到H16,选中区域出现蓝底色。,任务三数据筛选,第二步:单击菜单栏中“数据”栏,选择“筛选”菜单中“自动筛选”子菜单,于是表格第一行字段名单元格右下方都出现了一个以黑色倒三角箭头标记的下拉框。,任务三数据筛选,第三步:通过下拉框提供的条件进行筛选。单击“会计”下拉框,选择“自定义”菜单,便弹出“自定义自动筛选”对话框。,任务三数据筛选,第四步:在“自定义自动筛选”对话框的左面第一个下拉列表中选择“大于或等于”,在右面第一个下拉列表中键入“80”,然后确定。,任务三数据筛选,第五步:复制筛选结果。三、用Excel进行筛选要注意的问题(1)筛选后不符合条件的记录不再显示,但这些记录还

7、在,不管是显示的还是隐藏的记录,仍然保留原来的行号。如果再单击一下子菜单“自动筛选”或另一个子菜单“全部显示”,全部隐藏的记录又会显示出来。(2)“自动筛选”后,每一字段中的下拉框中包含四种选项:“全部”、“前10个”、“自定义”和该字段中的全部常量(相同的常量只显示一个),这四个选项功能是:“全部”:等于不设条件,一般用在取消已设定的条件;“前10个”:是将最小(升序排列时)或最大(降序排列时)的前n条记录筛选出来,Excel默认的是前10个记录,我们可以根据需要设计前n个;“自定义”:它是给出一个对话框,让你在对话框中设置条件,而且可以同时设置两个限制条件,但两个条件不能矛盾,否则会显示为

8、全空,因为没有符合条件的记录;常量:选出该字段为某一常量的全部记录,例如,将会计成绩为80分的记录全部显示出来,只要点击“会计”下拉框中的常量“80”即可。,任务四数据分组,一、统计分组的概念 统计分组是根据研究的目的,将统计总体按照一定的标志区分为若干组成的一种统计方法。统计分组是在统计总体内部进行的一种特定分类,它同时具有两方面的含义:对总体而言是“分”,即将总体分为性质相异的若干部分;对个体而言是“合”,即将在某些方面性质相同的个体组合起来。所以,组与组之间的性质是不同的,而同一组内性质是相同的。,任务四数据分组,二、统计分组的作用1.可以揭示统计资料的特点与规律2.可以划分现象的类型3

9、.可以分析总体内部结构和总体结构特征4.可以揭示现象之间的依存关系,任务四数据分组,三、统计分组的方法,统计分组中关键的问题在于选择分组标志和各组界限的划分,而选择分组标志则是统计分组的核心问题。(一)选择分组标志1.根据统计研究的目的与任务选择分组标志。如以全国工业企业为总体进行研究时,这个研究对象就有很多标志,如经济类型、固定资产原值、职工人数、所属行业等。如果研究目的是要分析不同经济类型的企业在总体中的构成,那么就要选择经济类型作为分组标志;如研究工业企业规模构成状况,则可以选择产值、固定资产原值等作为分组标志。2.要从众多标志中选择最能反映被研究现象本质特征的标志作为分组标志。研究职工

10、生活水平高低情况,可以用职工的工资水平作为分组标志,也可以用职工家庭成员人均收入水平作为分组标志。相比较而言,职工家庭成员收入水平更能反映职工生活水平的高低,更能反映现象本质特征。3.根据现象所处的历史条件或经济条件来选择标志。在研究企业规模构成状况时,需要对企业按其规模进行分组。一般来说,反映企业规模的标志主要有职工人数、年产值、年产量、固定资产和年利润等。在生产力水平较低的情况下,用职工人数的多少来表示企业规模的大小比较适当;而在技术进步的历史时期或技术装备比较先进的情况下,这时一般使用产值、固定资产等作为反映企业规模的分组标志更为恰当。4.选择分组标志时,还要遵循穷尽和互斥原则。,任务四

11、数据分组,三、统计分组的方法(二)统计分组的种类 根据分组标志的不同特征,统计总体可以按品质标志分组,也可以按数量标志分组,任务四数据分组,三、统计分组的方法(三)统计分组体系,任务五编制分配数列,任务引入小华是班级的学习委员。一次统计测验后,老师拿着成绩单找到小华,让他帮着把同学们的成绩整理一下。大家的成绩情况如下:(单位:分)88 76 99 74 60 82 60 89 8685 70 93 99 94 82 77 79 9795 84 79 63 72 87 84 79 6567 59 83 66 65 73 81 56 77老师告诉小华,他想要知道全班同学成绩的整体分布情况,想要知道

12、每一个分数段的人数和比重。什么是分布呢?分布情况可以怎样来表现呢?成绩的分数段又该如何正确划分呢?每个分数段的人数和比重该如何来计算呢?,任务五编制分配数列,一、分配数列的概念和种类(一)分配数列的概念1.统计分布:在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体单位在各组间的分布。2.次数或频数:分布在各组的总体单位数。3.总频数:各组频数之和。4.频率:各组频数与总频数之比。频率有两个数学性质:其一,各组频率均大于0;其二,各组频率之和等于1或者100%。各组频数与频率可以反映各组标志值水平对总体标志值水平的影响程度。频数越大则该组的标志值水平对于总体标志值水平

13、的影响越大;反之,频数越小则该组的标志值水平对于总体标志值水平的影响越小。5.分配数列或分布数列:将各组的名称与相应的频数或频率,按一定顺序排列起来形成的数列。6.分配数列的两个要素:总体按标志所分的组和各组的次数。分配数列可以反映总体单位在各组间的分布状态和分布特征,是进一步分析总体平均水平和变异程度的基础。,任务五编制分配数列,一、分配数列的概念和种类(二)分配数列的种类1.品质分配数列:按照品质标志分组而形成的分配数列。品质数列的编制比较简单,但要注意分组时应包括分组标志的所有标志表现,不能遗漏,任务五编制分配数列,一、分配数列的概念和种类(二)分配数列的种类2.变量分配数列:按数量标志

14、分组而形成的分配数列。根据变量分组的方法不同,变量数列可分为单项式数列和组距式数列。(1)单项式数列:在单项式分组的基础上形成的数列。单项式数列主要适用于在分组标志为离散型变量,且变量的取值范围较小,可取值较少的情况下反映总体分布。,任务五编制分配数列,一、分配数列的概念和种类(二)分配数列的种类2.变量分配数列:按数量标志分组而形成的分配数列。根据变量分组的方法不同,变量数列可分为单项式数列和组距式数列。(2)组距式数列:在组距式分组的基础上形成的数列。根据各组组距是否相等,组距式数列又可分为等距数列和不等距数列。组距式数列一方面适用于在分组标志为离散变量,且变量的取值范围较大,可取值较多的

15、情况下反映总体分布,另一方面适用于分组标志为连续型变量的情况。,任务五编制分配数列,二、单项式数列的编制,任务引入:某班组20名工人日产量资料如下:16 13 18 15 19 14 17 13 15 1719 15 17 18 14 16 15 16 17 16根据上述资料编制单项数列来反映工人按日产量分布的情况。,编制步骤如下:,1.将所有变量值按大小顺序排列;13 14 14 15 15 15 15 16 1616 16 17 17 17 17 18 18 19 19,2.进行单项式分组,将变量的每个取值单独作为一组,变量有几个取值,就分为几组,组的名称就是变量值。该例中,20名工人按日

16、产量分组,一共分为7组:13、14、15、16、17、18、19。,3.汇总各组频数和频率,编制数列,任务五编制分配数列,三、等距数列的编制任务:小华是班级的学习委员。一次统计测验后,老师拿着成绩单找到华,让他帮着把同学们的成绩整理一下。大家的成绩情况如下:(单位:分)88 76 99 74 60 82 60 89 8685 70 93 99 94 82 77 79 9795 84 79 63 72 87 84 79 6567 59 83 66 65 73 81 56 77老师告诉小华,他想要知道全班同学成绩的整体分布情况,想要知道每一个分数段的人数和比重。(一)确定分配数列的类型:首先应根据

17、原始数据分组标志,根据分组标志的性质确定分组方法,结合变量值的分布情况确定所编制数列的类型。1.该任务中,对学生应该按“考试成绩”进行分组,该分组标志属于连续型变量。2.按连续型变量进行分组,通常情况下应采用组距式分组的方法,即将变量的取值范围划分成若干个区间,每一个区间单独地作为一组,分成几个区间,就将总体分成几组。,任务五编制分配数列,三、等距数列的编制(二)计算全距:全距是指所有变量值中最大变量值和最小变量值的差距。该班学生考试成绩的全距=99-56=43(分)(三)确定组距和组数组距是各组中数据区间的长度。组数是组距式数列中组的个数。全距、组距和组数三者之间关系:全距=组距*组数确定组

18、距和组数遵循的原则:一是要考虑各组的划分是否能区分总体内部各个组成部分的性质差别,如果不能正确反映各部分性质的差异,必须重新分组;二是各组的划分要能准确、清晰地反映总体单位的分布特征。确定组距和组数注意事项:为了避免陷入盲目的境地,可以将组距先确定为一个较小的数(通常取5或10的整倍数),从小组距开始试起,如果发现分组结果不理想,再逐步扩大组距或者是合并相邻的组距,直到寻找到一个较为理想的分组结果。对于等距数列,可以参考经验公式:d=R/(1+3.22InN)d为组距,R为全距,N为总体单位数。通常学生成绩定性为优秀、良好、中等、及格和不及格,其分数段分别为90100,8090,7080,60

19、70,60以下。本次测验学生的成绩也都在这些数据范围内,所以考虑取组距为10,组数为5。,任务五编制分配数列,三、等距数列的编制(四)确定组限 组限就是各组数据区间两端的数值。每组的起点数值称为该组下限,终点数值称为该组上限,而组距其实就等于该组上限减该组下限。离散型变量用间断组限。间断组限是指相邻的两组,较小组的上限和较大组的下限用两个相邻的确定的数值来分别表示。如按学生人数分组可以采用如下方法:99人以下,100199人,200299人,300399人,400人以上。连续型变量用重叠组限。重叠组限是指相邻的两组,较小组的上限和较大组的下限用同一个确定的数值来表示,两者是相重叠的。在组限重叠

20、的情况下,为了明确总体单位的归属,需遵循“上限不在内”原则,即相邻组重叠的组限,只归属于其作为下限的那一组,而不包含在它作为上限的那一组内。如5060,6070,其中60作为两组重叠的组限,应该归属于它作为下限的那一组,即6070这一组,而不属于5060组。在学生成绩分组组限的处理上,由于“考试成绩”属于连续型变量,所以采用重叠组限,最大组的上限定为100,最小组的下限定为50,取较整的数作为组限也是为了方便以后进行平均指标和变异指标计算的方便。根据具体情况恰当使用开口组,有向上开口“.以上”,向下开口“.以下”组中值,是各组上下限之间的中点数值,用来代表各组标志值的一般水平。闭开组组中值=(

21、上限+下限)/2;向上开口组的组中值=(下限+邻组组距)/2;向下开口组的组中值=(上限-邻组组距)/2;,任务五编制分配数列,三、等距数列的编制(五)汇总频数和频率、编制数列,任务五编制分配数列,四、次数分布的主要类型和特征,(一)次数分布的主要类型,任务五编制分配数列,四、次数分布的主要类型和特征(二)次数分布的主要特征,任务六数据汇总,任务引入:期中考试后,老师又给小华一份成绩单,原来这是一份总成绩单,上面记载着这次期中考试班上40名同学每门课程的成绩。但是总分栏是空的。老师的任务:(1)汇总每位同学的总分;(2)汇总每门课程不及格的人数、每位同学不及格的门次。,任务六数据汇总,一、统计

22、汇总的内容(一)总体单位总量方面的汇总(二)总体标志总量的汇总二、统计汇总的组织形式(一)逐级汇总:是按照一定的统计管理体制,将统计调查资料自下而上逐级汇总并逐级上报,直至最高机构的汇总形式。(二)集中汇总:是指将统计调查资料直接集中到组织统计调查的最高机构或某一级的统计机构统一汇总。(三)综合汇总:是将逐级与超级汇总两种形式结合使用的方式,即将各级所需要的最基本的统计指标实行逐级汇总,同时又将全部原始资料集中到最高机构超级汇总。三、统计汇总技术(一)手工汇总技术1.划记法;2.过录法 3.折叠法;4.传票法 5.卡片法(二)计算机汇总技术1.编程序;2.编码 3.数据录入 4.计算与编表,任

23、务六数据汇总,四、利用“分类汇总”进行数据汇总任务:按“部门”汇总员工工资,任务六数据汇总,四、利用“分类汇总”进行数据汇总1.单击表格内“部门”列的任一单元格中,再单击工具栏中的“升序排列”按钮,按”部门”对数据进行排序,排序后的结果。,任务六数据汇总,四、利用“分类汇总”进行数据汇总2.选择“数据”菜单中的“分类汇总”命令,打开“分类汇总”对话框。,任务六数据汇总,四、利用“分类汇总”进行数据汇总3.在“分类汇总”对话框中,选择“部门”为分类字段,汇总方式选择“求和”选项,在“选定汇总项”中选中“工资”复选框。,任务六数据汇总,四、利用“分类汇总”进行数据汇总4.单击“确定”按钮。,任务六

24、数据汇总,四、利用“分类汇总”进行数据汇总5.单击分级显示符号 可创建汇总表。这样可以隐藏明细数据,而只显示汇总,如单击按钮2 可得到以下结果。,任务六数据汇总,五、利用数据透视表进行数据汇总,任务:按“部门”汇总员工的平均工资,1.选择”数据”菜单中的”数据透视表和数据透视图”命令,打开其向导,指定待分析数据的数据源类型及所要创建的报表类型,任务六数据汇总,五、利用数据透视表进行数据汇总2.选定要创建数据透视表的数据所在的区域,点击现有工作表,选定单元格,确定。,任务六数据汇总,五、利用数据透视表进行数据汇总3.将字段拖动至数据透视区域点击”部门”,点击”添加到行区域”,点击”工资”,点击”添加到数据区域”,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号