统计学第3章统计整理.ppt

上传人:牧羊曲112 文档编号:6332816 上传时间:2023-10-17 格式:PPT 页数:53 大小:1.27MB
返回 下载 相关 举报
统计学第3章统计整理.ppt_第1页
第1页 / 共53页
统计学第3章统计整理.ppt_第2页
第2页 / 共53页
统计学第3章统计整理.ppt_第3页
第3页 / 共53页
统计学第3章统计整理.ppt_第4页
第4页 / 共53页
统计学第3章统计整理.ppt_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《统计学第3章统计整理.ppt》由会员分享,可在线阅读,更多相关《统计学第3章统计整理.ppt(53页珍藏版)》请在三一办公上搜索。

1、第三章 统计整理,教 学 目 的 通过本章的学习,要求掌握各种不同类型资料的整理方法、整理原则、以及一些相关的概念,并能够利用所学的方法对所给的实际资料按照研究目的的要求进行整理。,第三章 统计整理,第三章 统计整理,在学习过程中主要解决以下几个问题,统计整理的意义和方法,统计分组的含义和种类,统计分组的方法,统计分布和分配数列的编制,统计表的结构和种类,第三章 统计整理,统计调查搜集上来的资料,不论是哪一种类型的资料都必须经过整理才能进一步进行分析。资料的类型不同,研究的目的不同,资料整理的方法也不同。统计整理是根据统计研究任务的要求,对调查所搜集到的原始资料进行分组、汇总,使其条理化、系统

2、化的工作过程。,一、统计整理的意义和方法,第一节 统计分组,例:,根据某班40名学生统计学考试成绩分析该班学生考试情况。57 89 49 84 86 87 75 73 72 68 75 82 97 81 67 81 54 79 87 95 76 71 60 90 65 76 72 70 86 85 89 89 64 57 83 81 78 87 72 61,第三章 统计整理,第三章 统计整理,第三章 统计整理,再如:通过调查取得100个商业企业某月销售额资料:(单位:万元)20,60,45,90,105,56,250,89,130,30,98,300。将这些数据资料按“销售额”的多少进行整理,

3、得到下列整理结果:,第三章 统计整理,统计整理的方法:分组、汇总、编表,第三章 统计整理,统计分组:,根据研究任务的要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同又有联系的几个部分。,统计分组应达到的要求,同一组内的单位性质相同,不同组所包括的单位性质相异。,工业企业按经济类型分组,可分为以下几组:经济类型 企业数(个)国有企业 1000 合资企业 200 合作经营企业 300 股份制企业 500,工业企业按职工人数分组,可分为以下几组:职工人数 企业数(个)500人以下 50 5001000 200 10001500 100,工业企业按地区分组,可分为以下几组:地区 企业

4、数(个)北京市 10000 天津市 8000 上海市 11000,二、统计分组的概念和作用,2.作用 主要有三个方面:划分现象的类型 揭示现象内部结构 分析现象间依存关系,揭露社会经济现象的类型,反映各类型的特点。,类型分组,单位:亿元,说明社会经济现象的内部结构。,结构分组,“九五”期间我国国内生产总值构成(%),研究经济现象之间的依存关系。,分析分组,某乡某种农作物的耕作深度与收获率的关系,二 选择分组标志的原则,根据研究问题的目的来选择,要选择最能反映被研究现象本质特征的标志,要结合现象所处的具体历史条件或经济条件来选择,选择什么样的分组标志,就会形成什么样的分组结果,因此,分组标志的选

5、择是统计分组的关键。,统计分组的种类,按研究任务和作用不同,按分组标志的多少不同,按分组标志的性质不同,类型分组结构分组分析分组,简单分组复合分组,品质分组变量分组,第三章 统计整理,第三章 统计整理,变量分组方法,以一个变量值代表一组。如:人口按年龄分组1岁一组,学生按报考科目分组等。这种分组适用于离散性变量,且变量值的个数较少的情况。,以变量值变动的一个区间作为一组,区间的距离称为组距。适用于连续型变量和离散型变量的变量值较多的情况。,按品质标志对资料进行分组。这种分组有些比较简单,有些非常复杂,复杂的品质分组称为分类。如:人口按性别分组、按职业分组、企业按经济类型分组、等。,单项式分 组

6、,组距式分 组,三、统计分组方法,品质标志分组,第三章 统计整理,在进行组距分组时,会涉及到一些问题,包括:等距分组和不等距分组、组限、组中值。,第三章 统计整理,等 距 分 组,各组组距均相等。如:1020 2030 3040以上各组组距均为10。这种分组适用于均匀分布的总体。,不等距 分 组,各组组距不一定相等。如:1020 2050 5060 6070 以上分组中,其中第二组与其它各组的组距不同。这种分组适用于资料分布离差较大或者是为了满足特殊的研究目的的需要。,组限,组限就是每一组两端的数值。10 20 20 30 30 40,下限,上限,确定组限的方法有两种:间断式组限和重叠式组限。

7、,职工人数(人)99以下 100199 200299 300399,固定资产额(万元)5060 6070 7080 8090,间断式组限适用于离散变量,重叠式组限适用于连续变量,第三章 统计整理,第三章 统计整理,组中值,每组上限与下限之间的中点数值,是各组的假定平均数。,组中值=(上限值+下限值)2,开口组组中值的计算:缺下限:组中值=本组上限 相邻组组距/2缺上限:组中值=本组下限+相邻组组距/2,产值(万元),50以下50 6060 7070以上,第一组组中值:,50(102)=45,最后一组组中值:,70+(102)=75,第二节 分配数列,一、分配数列的概念和种类,组别(变量)次数(

8、频数)频率(比率),频率:各组的频率大于0,各组的频率总和等于1或100%。,品质分配数列,变量分配数列,单项变量数列,组距变量数列,等距数列,不等距数列,以分组标志特征不同分为:,(这种数列一般比较稳定,只要分组标准定的比较恰当,通常能准确地反映总体的分布特征。),二、分配数列的编制,1、品质分配数列的编制:,只需将品质标志的表现一一排列出来,然后汇总出每一种标志表现出现的次数即可。如下例:,第三章 统计整理,第三章 统计整理,2、变量分配数列的编制:,其基本步骤为:第一步:将原始资料按数值大小依次排列,计 算全距。第二步:确定变量的类型和分组方法(单 项式分组或组距分组)。第三步:确定组数

9、和组距。当组数确定后,组距可计算得到:组距=全距组数 全距=最大变量值最小变量值,第三章 统计整理,第四步:确定组限。注意 第一组的下限要小于或等于最小变量值,最后一组的上限要大于最大变量值。第五步:汇总出各组的单位数,计算频率,并编制统计表。,间断式确定组限:汇总各组单位数时,按照“上下限均 包括在本组内”的原则汇总。,职工人数(人)499以下 500 599 600 699 700 799,重叠式确定组限:汇总各组单位数时,按照“上组限不在 内”的原则汇总。,产值(万元)50 60 60 70 70 80 80 90,单位数(个),单位数(个),因为有了“上组限不在内”的原则,实际工作中,

10、对于离散型变量也经常采用重叠式确定组限的方法。,第三章 统计整理,已知组距为5,组数为7,最大值39,最小值5,怎样分组?,(c),较合适是?,3、累计频数或频率分配数列的编制方法,通过累计频数分配数列可以反映累计到某一组出现的总次数或总频率。想一想:第四组的累计结果说明什么问题?,第三章 统计整理,2,7,21,52,117,169,192,200,1.0,3.5,10.5,26.0,58.5,84.5,96.0,100,8,31,83,148,179,193,198,200,4.0,15.5,41.5,74.0,89.5,96.5,99.0,100,三 次数分布的特征,1.次数分布的表示方

11、法,表示法 即用统计表来表示次数分布。,某班统计学考试成绩次数分配,图示法,即用统计图来表示次数分布,直方图(或次数分配曲线图),仍以上例考试成绩数据,画成如下直方图:,若组距不等的话,用标准组距人数,然后据此画直方图:,直方图,折线图,在直方图的基础上连接各条形顶边的中点成折线图。如下图红笔围成的,即为次数分配曲线图:,折线图还可用来表示累计次数分布(仍以上例数据):,曲线图是组数趋向于无限多时折线图的极限描绘,是一种理论曲线。,向下累计,向上累计,一般次数分布呈正态分布曲线,或称正态曲线,但也有偏态分布曲线,或称偏态曲线,对称型,右偏型(上偏型),左偏型(下偏型),非对称型,Y,Y,X,还

12、有其他形态,J型分配曲线,U型分配曲线,双峰曲线,第三章 统计整理,洛伦茨分布:,专门用以检定社会收入分配的平等程度。,第三节 统计表,一 统计表的结构和内容,从形式上看:统计表由总标题、横行标题、纵栏标题、指标数值构成。,从内容上看:统计表由主词和宾词两部分构成。,说明总体或总体的分组。,用哪些指标数值来说明总体或总体的分组。,2003年某月某公司各企业劳动生产率统计表 单位_,横行标题,主词,宾词,总标题,纵栏标题,数据资料(指标数值),二 统计表的特点,开口式上下有基线编号:主词一般按A、B、C,宾词按1、2、3有计量单位表中不允许有空格:若不需要此资料则用“-”;暂缺某资料则用“”,三

13、 统计表的分类,宾词指标的分组配置,平行配置,层叠配置,四 统计表的编制原则,1.总标题须简明扼要表达出全表的内容;2.各标题要确切反映表的内容,且表格安排合理;3.指标数值要位数对齐,合计或总计一般放在表的尾部;4.对指标内容作必要说明时,可加注在表的下方;5.表的上下边线(基线)用粗实线或双线,表的两边是开口式;6.纵栏较多时编栏号,指标数值栏要注明计量单位和资料表示的时间。总原则:合理、科学、实用、简练、美观。,第三章 统计整理,一、判 断 对 错,1、对统计资料进行分组的目的就是为了区分各组单位之间质的不同。(),2、组中值是根据各组上限和下限计算的平均值,所以它代表了各组的平均分配次

14、数。(),3、分配数列的实质是把总体单位总量按照总体所分的组进行分配。(),4、某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。(),5、对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所以这种分组会使资料的真实性受到损害。(),6、任何一个分布都必须满足:各组的频率大于0,各组的频数总和等于1或100%(),7、统计分组后掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。(),第三章 统计整理,二、单 项 选 择 题,1、统计整理的关键是()A、对调查资料进行审核 B、对调查资料进行统计分组C、对调查资料进行汇总 D、编制统计表,B,2、下列分组中属于按品质标志

15、分组的是()A、学生按考试分数分组 B、产品按品种分组C、企业按计划完成程度分组 D、家庭按年收入分组,B,3、有一个学生考试成绩为80分,在统计分组中,这个变量值应归到()组。A、6070分 B、7080分C、8090分 D、90100分,C,4、某主管局将下属企业先按轻、重工业分组,再按规模分组,这种分组属于()分组。A、简单分组 B、复合分组C、分析分组 D、结构分组,B,第三章 统计整理,三、多项选择题部分,B C D E,2、在次数分配数列中()A、总次数一定,频数和频率成反比B、各组的频数之和等于100C、各组频率大于零,频率之和等于1D、频率越小,则组的标志值所起的作用越小E、频率表明各组标志值对总体的相对作用程度,C D E,、品质分配数列、变量分配数列、组距式变量分配数列、等距变量分配数列、次数分配数列,作 业,P65、三计算题 1、2、,第三章 统计整理,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号