统计学原理课件PPT.ppt

上传人:李司机 文档编号:4104654 上传时间:2023-04-04 格式:PPT 页数:40 大小:979.50KB
返回 下载 相关 举报
统计学原理课件PPT.ppt_第1页
第1页 / 共40页
统计学原理课件PPT.ppt_第2页
第2页 / 共40页
统计学原理课件PPT.ppt_第3页
第3页 / 共40页
统计学原理课件PPT.ppt_第4页
第4页 / 共40页
统计学原理课件PPT.ppt_第5页
第5页 / 共40页
点击查看更多>>
资源描述

《统计学原理课件PPT.ppt》由会员分享,可在线阅读,更多相关《统计学原理课件PPT.ppt(40页珍藏版)》请在三一办公上搜索。

1、,1,第三章 统 计 整 理,教 学 目 的 通过本章的学习,要求掌握各种不同类型资料的整理方法、整理原则、以及一些相关的概念,并能够利用所学的方法对所给的实际资料按照研究目的的要求进行整理。,2,第三章 统 计 整 理,教 学 目 的 通过本章的学习,要求掌握各种不同类型资料的整理方法、整理原则、以及一些相关的概念,并能够利用所学的方法对所给的实际资料按照研究目的的要求进行整理。,3,第三章 统计整理,在学习过程中主要解决以下几个问题,统计整理的方法和意义,统计分组的含义和种类,统计分组的方法,统计分布和分配数列的编制,统计表的结构和种类,4,第三章 统计整理,统计调查搜集上来的资料,不论是

2、哪一种类型的资料都必须经过整理才能进一步进行分析。资料的类型不同,研究的目的不同,资料整理的方法也不同。统计整理是根据统计研究任务的要求,对调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化的工作过程。,一、统计整理的意义和方法,5,统计整理又称数据整理,根据统计研究任务的要求,对调查、搜集到的原始资料进行分组汇总使其条理化、系统化的工作过程,就是统计整理。统计整理的意义:通过统计调查所取得的总体单位的资料,是不系统的、分散的,还只是事物的表象、事物的某一侧面或外部联系的感性材料。统计整理的任务就是对这些资料进行加工处理,借助总量指标,对总体内部规律、相互联系、结构关系,作出概括性的说明

3、。统计整理实现了从个别单位的标志值向说明总体特征的指标值的过度,使人们对社会经济现象的认识从感性认识上升到理性认识的过度阶段,为统计分析提供了基础。它在统计研究中起着承前启后的作用。,6,根据某班40名学生统计学考试成绩分析该班学生考试情况。57 89 49 84 86 87 75 73 72 68 75 82 97 81 67 81 54 79 87 95 76 71 60 90 65 76 72 70 86 85 89 89 64 57 83 81 78 87 72 61,7,按成绩等级分组 人数(人)各组人数占 总人数比重(%)不及格 4 10.0 及 格 6 15.0 中 12 30.

4、0 良 15 37.5 优 3 7.5 合 计 40 100.0,8,第三章 统计整理,再如:通过调查取得100个商业企业某月销售额资料:(单位:万元)20,60,45,90,105,56,250,89,130,30,98,300。将这些数据资料按“销售额”的多少进行整理,得到下列整理结果:,9,第三章 统计整理,统计整理的方法:分组、汇总、编表,10,第三章 统计整理,统计分组的含义和种类(p51),统计分组:,根据研究任务的要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同又有联系的几个部分。,统计分组应达到的要求,同一组内的单位性质相同,不同组所包括的单位性质有差异。,二

5、、,例如:,工业企业按经济类型分组,可分为以下几组:经济类型 企业数(个)国有企业 1000 合资企业 200 合作经营企业 300 股份制企业 500,工业企业按职工人数分组,可分为以下几组:职工人数 企业数(个)500人以下 50 5001000 200 10001500 100,工业企业按地区分组,可分为以下几组:地区 企业数(个)北京市 10000 天津市 8000 上海市 11000,11,统计分组的特点,统计分组是在总体内进行的一种定性分类,它是把总体进一步划分为一个个性质不同的范围更小的总体。这些被称为亚总体的组,同样具有总体的特征(只是变成小一点的总体而已),它们可以继续分组。

6、如在进行工业企业的统计调查时,我们可以按工业企业所在的地域进行分类,一个省的为一组,每一个省的工业企业又可以按不同的市进行分组。,12,分组标志的选择,选择什么样的分组标志,就会形成什么样的分组结果,因此,分组标志的选择是统计分组的关键。,选择分组标志的一般原则,必须根据统计研究的目的,在对现象进行分析的基础上,抓住具有本质性的区别及反映现象内在联系的标志来作为分组标志。(P54)统计分组必须遵循两个原则:穷尽原则和互斥原则 即不重复不遗漏如我们在进行城乡青少年接受教育水平的比较分析,应按城乡进行分组,如果按年龄进行分组或按性别进行分组就不能到达研究分析的目的。,13,统计分组的种类,按研究任

7、务和作用不同,按分组标志的多少不同,按分组标志的性质不同,类型分组结构分组分析分组,简单分组复合分组,品质分组(按品质标志进行分组)变量分组(按数量标志进行分组),通常认为总体按品质标志分组属于类型分组,按数量标志分组属于结构分组,仅按一个标志来进行分组称为简单分组;按两个或两个以上的标志进行分组并且层叠在一起称为复合分组,14,分析分组:为了研究总体的各标志之间的依存关系而进行的分组。即为了研究某个标志表现和另一个标志表现之间有何关系而进行的分组,如要研究在东莞打工的外来劳动者的工资报酬是否与他们的学历有关,则把他们按学历进行分组来进行研究。分析分组的分组标志称为原因标志,与原因标志相对应的

8、叫结果标志。如上例中学历是原因标志,报酬是结果标志。,15,第三章 统计整理,品质分组方法,变量分组方法,以一个变量值代表一组。如:人口按年龄分组1岁一组,学生按报考科目分组等。这种分组适用于离散性变量,且变量值的个数较少的情况。如对家庭构成情况进行分析时,可按家庭人数进行分组,以变量值变动的一个区间作为一组,区间的距离称为组距。适用于连续型变量和离散型变量的变量值较多的情况。如学生成绩、工厂职工数,按品质标志对资料进行分组。这种分组有些比较简单,有些非常复杂,复杂的品质分组称为分类。一般的情况下该品质标志的标志表现有多少就分成多少组,或按统一规定的分组标准进行分组如:人口按性别分组、按职业分

9、组、企业按经济类型分组等。,单项式分 组,组距式分 组,三、统计分组方法,16,第三章 统计整理,等 距 分 组,各组组距均相等。如:1020 2030 3040以上各组组距均为10。这种分组适用于均匀分布的总体。,不等距 分 组,各组组距不一定相等。如:1020 2050 5060 6070 以上分组中,其中第二组与其它各组的组距不同。这种分组适用于资料分布离差较大或者是为了满足特殊的研究目的的需要。,按组距式分组会使资料的真实性受到一些损害,17,组距的计算,对于重叠组距式分组,可以用 组距=上限下限 进行计算如成绩分组中,6070分、70 80分、80 90分,其组距就是10分。对于间断

10、式分组,使用的公式为 组距=本组上限前组上限=本组下限上组下限如商店按职工规模分组分为:1 5人、6 10人11 15人,则组距为105=5而不是4。,18,组限(p57),组限就是每一组两端的数值。10 20 20 30 30 40,下限,上限,确定组限的方法有两种:间断式确定组限和重叠式确定组限。,职工人数(人)99以下 100199 200299 300399,固定资产额(万元)5060 6070 7080 8090,间断式确定组限适用于离散变量(分组时要注意满足不重不漏原则,上、下限都要包含在内,有特殊说明的除外),重叠式确定组限适用于连续变量,上面的60、70、80归于哪一组呢?P5

11、7,一般把此值归并到作为下限的那一组,19,例:某地区对企业按工人人数的多少进行分未两组,下列五种分组方法中正确的是()A.300人以下 300500人 B.300人以下 300500人(不含300)C.300人以下 301500人 D.300人以下 310500人 E.300人以下 300499人注意区分重叠式组限和间断式组限的不同之处,分组时应该做到不重复不遗漏,20,第三章 统计整理,组中值,每组上限与下限之间的中点数值,是各组的假定平均数。,组中值=(上限值+下限值)2,开口组组中值的计算:缺下限:组中值=本组上限 相邻组组距/2缺上限:组中值=本组下限+相邻组组距/2,例如,产值(万

12、元),50以下50 6060 7070以上,第一组组中值:,50(102)=45,最后一组组中值:,70+(102)=75,21,第三章 统计整理,(一)统 计 分 布,统计分布又称分配数列。它是把总体的所有单位按组归并排列后形成总体中各个单位在各组间的分布。这里的单位有个、次的含义,所以分配数列又称此书发布。它由两部分组成:总体所分的各个组和各组所拥有的单位数(次数或频数)。,四、统计分布和分配数列的编制,22,第三章 统计整理,频率:各组的频率大于0,各组的频率总和等于1或100%。,23,(二)分配数列的种类,分配数列是在分组的基础上形成的,根据分组时采用的分组标志不同,分配数列可分为:

13、,品质分配数列(简称品质数列),变量分配数列(简称变量数列),单项式分配数列,组距分配数列,等距数列,不等距数列,分配数列,(这种数列一般比较稳定,只要分组标准定的比较恰当,通常能准确地反映总体的分布特征。),第三章 统计整理,24,(三)分 配 数 列 的 编 制,1、品质分配数列的编制:,只需将品质标志的表现一一排列出来,然后汇总出每一种标志表现出现的次数即可。如下例:,第三章 统计整理,100,250,合 计,40 32 20 8,100 80 50 20,国有企业 股份制企业 合资企业 独资企业,比重(%),企 业 数,经济类型,25,第三章 统计整理,2、变量分配数列的编制:,其基本

14、步骤为:第一步:将原始资料按数值大小依次排列。第二步:确定变量的类型(按什么标志进行 分组)和分组方法(单项式分组或 组距分组)。第三步:确定组数和组距。当组数确定后,组距可计算得到:全距=最大变量值最小变量值 组距=全距组数,26,组数确定经验公式,第三章 统计整理,27,分组组数参考表,第三章 统计整理,28,第三章 统计整理,第四步:确定组限。注意:第一组的下限要小于或等于最小变量值,最后一组的上限要大于最大变量值。)第五步:汇总出各组的单位数,计算频率,(频率=频数/总体单位数)并编制统计表。注意:不同方法确定的组限在汇总各组单位数时不一样(见教材P59例题),29,间断式确定组限:汇

15、总各组单位数时,按照“上下限均 包括在本组内”的原则汇总。,职工人数(人)499以下 500 599 600 699 700 799,重叠式确定组限:汇总各组单位数时,按照“上组限不在内”的原则汇总。,产值(万元)50 60 60 70 70 80 80 90,单位数(个),单位数(个),因为有了“上组限不在内”的原则,实际工作中,对于离散型变量也经常采用重叠式确定组限的方法。,30,3、累计频数或频率分配数列的编制方法,通过累计频数分配数列可以反映累计到某一组出现的总次数或总频率。,第三章 统计整理,2,7,21,52,117,169,192,200,1.0,3.5,10.5,26.0,58

16、.5,84.5,96.0,100,8,31,83,148,179,193,198,200,4.0,15.5,41.5,74.0,89.5,96.5,99.0,100,31,第三章 统计整理,(四)统计分布的类型,钟型分布、U型分布、J型分布、洛伦茨分布,钟型分布:,特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少,其形状宛如一口古钟。(见教材P62),U型分布:,特征是靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,其形状宛如英文字母U。(见教材P62),J型分布:,特征是次数随着变量值的增大而增多或随变量值的增大而减少,其形状宛如英文大写字母

17、J。(见教材P63),洛伦茨分布:,专门用以检定社会收入分配的平等程度。,32,频率分布的类型,第三章 统计整理,33,第三章 统计整理,(五)统计表的结构和种类,从表的内容上看:由主词和宾词组成。主词指总 体所分的各个组,宾词用来说 明主词的各个指标。,统计表是表现统计资料整理结果的表格,从表的形式看:由标题、横行和纵栏、数字资料 等部分组成。,统计表的结构,统计表的种类,按照主词是否分组和分组的程度分为:,简单表:主词未经分组的统计表。,分组表:主词按某一标志进行分组的统计表。,34,统计表的结构,行标题,列标题,数字资料,表头,附加,第三章 统计整理,35,合理安排统计表的结构总标题内容

18、应满足3W要求(when、who、what)(如P66页表3-16)数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明表中的上下两条横线一般用粗线,其他线用细线通常情况下,统计表的左右两边不封口表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一对于没有数字的表格单元,一般用“”表示必要时可在表的下方加上注释,统计表的设计,第三章 统计整理,36,统计表的设计,第三章 统计整理,37,一、判断(2006.01)统计分组以后,掩盖了各组内部各单位的差异。()(2007.01)按数量标志分组形成的分配数列和按品质标志分组形成的分配数列,都可称为次数

19、分布。()(中央2005.07)1、按数量标志分组形成的分配数列和按品质标志分组形成的分配数列,都可称为次数分布。()2、统计分组以后,掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。()(中央2006.07)2、统计分组的关键是确定组限和组距。(,38,二、单选(2005.07)简单分组和复合分组合的区别在于()。A.选择的分组标志的性质不同 B.选择的分组标志多少不同 C.组数的多少不同 D.组距的大小不同(2007.01)1、统计分组的关键在于()。A、分组标志的正确选择 B、分组形式 C、平均指标 D、变异指标2、对总体按某个标志进行分组,得到的统计表属于()。A、分组表 B、

20、复合表 C、简单表 D、整理表(中央2005.07)次数分配数列是()A、按数量标志分组开成的数列 B、按品质标志分组开成的数列 C、按统计指标分组所形成的数列 D、按数量标志和品质标志分组所形成的数列,39,(中央2006.07)3、简单分组和复合分组的区别在于()A、选择的分组标志性质不同 B、选择的分组标志多少不同 C、组数的多少不同 D、组距的大小不同(中央2007.01)4、下列分组中属于按品质标志分组的是()A、学生按考试分数分组 B、产品按品种分组 C、企业按计划完成程度分组 D、家庭按年收入分组,40,三、多选(2005.07)统计整理是()。A统计调查的继续 B.统计设计的继续 C.统计调查的基础 D.统计分析的前提 E.统计分析的基础(2006.07)统计表按主词是否分组及分组的程度,可分为()。A、简单表 B、一览表 C、分组表 D、复合表 E、单一表(中央2007.01)9、在组距数列中,组中值()A、上限和下限之间的中点数值 B、用来代表各组标志值的平均水平 C、在开放式分组中无法确定 D、就是组平均数 E、在开放式分组中,可以参照相邻组的组距来确定,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号