统计数据的收集和整理.ppt

上传人:小飞机 文档编号:6015860 上传时间:2023-09-14 格式:PPT 页数:120 大小:3.35MB
返回 下载 相关 举报
统计数据的收集和整理.ppt_第1页
第1页 / 共120页
统计数据的收集和整理.ppt_第2页
第2页 / 共120页
统计数据的收集和整理.ppt_第3页
第3页 / 共120页
统计数据的收集和整理.ppt_第4页
第4页 / 共120页
统计数据的收集和整理.ppt_第5页
第5页 / 共120页
点击查看更多>>
资源描述

《统计数据的收集和整理.ppt》由会员分享,可在线阅读,更多相关《统计数据的收集和整理.ppt(120页珍藏版)》请在三一办公上搜索。

1、第二章 统计数据的收集和整理,第一节、统计数据的收集第二节、统计分组第三节、次数分布及其显示,学习目的:了解统计工作的两个重要步骤,即数据收集和整理的基本思想和方法。重难点:统计调查的种类;普查、重点调查、典型调查的方法;调查方案和问卷。统计分组方法;分布数列的相关概念和编制方法;统计图的绘制。,第一节 统计数据的收集,一、数据来源二、统计调查设计三、统计调查种类四、调查方法五、统计调查误差,一、数据来源,从统计数据本身的来源看,统计数据都来源于直接的调查或实验;从使用者的角度看,统计数据主要来源于两种渠道:直接的调查和科学实验(直接数据或一手数据);别人调查或实验的数据(间接数据或二手数据)

2、实验法是在所设定的特殊实验场所、特殊状态下,对研究对象进行实验以获取数据资料的方法。直接调查法包括直接观察法、访问法、问卷法、电脑辅助调查法等。,指直接从各调查单位收集的用来反映个体特征的数据资料,统计调查是整个统计认识活动的基础,决定着统计认识过程及其结果的成败,二、统计调查设计,调查方案设计,调查方案的内容,1、调查目的,1.调查要达到的具体目标回答“为什么调查?”调查之前必须明确,2、调查对象、调查单位、报告单位,调查对象:调查研究的总体或调查范围调查单位:需要对之进行调查的单位。可以是调查对象的全部单位(全面调查),也可以是调查对象中的一部分单位(非全面调查)回答“向谁调查?”,第五次

3、全国人口普查办法第六条规定,“人口普查的对象是具有中华人民共和国国籍并在中华人民共和国境内常住的人”。第七条规定,“人口普查,采用按常住人口登记的原则。每个人必须在常住地进行登记。一个人只能在一个地方登记”。人口普查以户为单位进行登记。以家庭成员关系为主的人口,居住一处共同生活的作为一个家庭户;单身居住独自生活的,也作为一个家庭户。相互之间没有家庭成员关系,集体居住在单位内集体宿舍及其他住所、共同生活的人口,作为集体户。集体户以一个居住房间为一户进行普查登记。,报告单位是负责向上级报告资料的单位。,注意:调查单位与报告单位的区别。,调查目的:了解武汉市国有工业企业经营效益状况调查对象:武汉市国

4、有工业企业调查单位:武汉市每一家国有工业企业填报单位:武汉市每一家国有工业企业,调查目的:了解武汉市私家车使用状况调查对象:武汉市私家车调查单位:武汉市每一辆私家车填报单位:武汉市每一个私家车主,3、确定调查项目,拟订调查表 即调查哪些内容,调查项目是调查的具体内容,即要登记哪些标志?,它可以是调查单位的数量特征,如一个人的年龄、收入,一个企业的职工人数、产值;,可以是调查单位的某种属性特征如一个人的性别、职业,一个企业的经济类型等。,调查表是用于登记调查数据的一种表格。调查表一般分为一览表和单一表。,把许多调查单位和相应的项目按次序登记在一张表格里。这便于汇总,但缺点是分不开,故调查深度不够

5、。,将一个调查单位的项目登记在一张表或一种卡片上。这便于容纳较多的项目,且便于整理、分类,缺点是繁琐。,第五次全国人口普查表共有:普查表短表、普查表长表、死亡人口调查表和暂住人口调查表。,(一)姓名(二)与户主关系(三)性别(四)年龄(五)民族(六)户口登记状况(七)户口性质(八)出生地(九)何时来本乡镇街道居住(十)从何地来本乡镇街道居住(十一)迁出地类型(十二)迁移原因(十三)五年前常住地,(十四)是否识字(十五)受教育程度(十六)学业完成情况(十七)是否有工作(十八)工作时间(十九)行业(二十)职业(二十一)未工作者状况(二十二)未工作者主要生活来源(二十三)婚姻状况(二十四)初婚年月(

6、二十五)生育子女数(二十六)的生育状况,普查表长表(按人填报的项目),普查表长表(按户填报的项目),第一部分(一)户编号(二)户别(三)本户普查登记人数(四)本户户籍人口中外出不满半年人数(五)本户户籍人口中外出半年以上人数(六)暂住本乡、镇、街道,离开户口登记地不满半年人数(七)本户 1999.11.1-2000.10.31 出生人数(八)本户 1999.11.1-2000.10.31 死亡人数,第二部分(九)本户住房间数(十)本户住房建筑面积(十一)住房用途(十二)本住房中是否有其他合住户(十三)住房建成时间(十四)建筑层数(十五)住宅外墙墙体材料(十六)住房内有无厨房(十七)主要炊事燃料

7、(十八)是否饮用自来水(十九)住房内有无洗澡设施(二十)住房内有无厕所(二十一)住房来源(H21)(二十二)购建住房费用(二十三)月租房费用,4、调查时间和调查工作的期限,1.调查时间:调查资料所属的时间2.工作期限:调查工作的起止时间例如:第六次人口普查规定的标准时间是“2010年11月1日0时”,并要求在“2010年11月1日至10日完成普查的登记工作”。2010年11月1日0时就是调查时间,2010年11月1日至10日就是调查期限。,5.制定调查的组织实施计划,(1)调查工作完成的期限和工作进度。(2)确定调查的方式与汇总的方法。(3)组织领导。(4)调查前的其他准备工作,统计调查方案的

8、内 容,调查对象和调查单位,调查项目和调查表,调查时间和期限,调查目的,调查工作 的组织实施计划,按调查单位的范围大小分为,三、统计调查的种类,按调查时间是否连续分为,按调查的组织方式不同分为,指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查,特点,普查,统计调查的组织方式,作用,局限,由于需要大量的人力、物力和财力,不宜经常进行,普查,普查应注意的问题:,统一规定调查资料所属的标准时点。,正确选择普查时期。,普查范围和期限。,普查项目的确定。,标准时点?,(二)统计报表制度,1、概念和特点,统计报表是按国家统一规定的表式、统一的指标项目、统一的报送时间,自下而上定期提供统计资料的

9、一种报告制度。,特点:,统一性,全面性,可靠性,统计报表制度,优点,局限,按实施范围分为:国家统计报表 部门统计报表 地方统计报表,2、统计报表的种类:,按填报单位分为:基层统计报表 综合统计报表,按报送方式分为:电讯统计报表 邮寄统计报表,按报送周期长短不同分为:,4、统计报表的资料来源,(1)原始记录(2)统计台账,()表式报表的具体形式,()填表说明填报范围 分类目录 指标解释,按照 随机原则 从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式,抽样调查,指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会,

10、特点,优点,统计调查的组织方式,抽样调查研究Sampling Study,为什么要抽样?1.涉及破坏受试对象质量控制2.取得精确可靠的结果3.实际情况的约束时间,成本等,抽样调查方法 第五章介绍,为了解总体基本情况,在调查对象中只选择一部分重点单位 进行调查的一种非全面调查组织方式,作用,局限,能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料,只适用于客观存在着重点单位的情况不能推断,重点调查,这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况,统计调查的组织方式,重点调查应注意的问题:,一般不能由重点单位的调查结果从数量上推断总体。,重点单位的确定。,3

11、、典型调查:,特点:,能取得详细的资料。,能取得代表性较高的资料。,调查方式灵活。,先对总体进行分析,然后有意识地选取若干具有典型意义的或具有代表性的单位进行非全面调查。,方法:1、“解剖麻雀式”的典型调查。直接对个别典型单位进行调查。2、“划类选典式”的典型调查。在分类的基础上,选择一部分典型单位调查。作用:了解事物的一般情况和发展规律。补充和验证全面调查的不足。,典型调查应注意的问题:,典型单位的选择。,根据不同的选典方法来反映总体的情况。,庭院深深空几许?,五、统计调查误差,抽样误差即指随机误差,这是抽样调查固有的误差,是无法避免的。,六、次级资料的收集,常用的统计数据来源,中国统计年鉴

12、中国统计摘要中国统计信息网(国家统计局网站),常用的统计数据来源,美国经济分析局美国人口普查局美国劳工统计局美联储经济数据库美国联邦统计世界银行国际货币基金组织OECD,第二节 统计分组,一、统计整理的意义和步骤 二、统计分组的方法,制定统计整理方案,对原始资料进行审核,数 据 处 理(分组和汇总),制作统计表或统计图,统计整理的步骤,总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的差异,使数据变得条理化,便于进一步分析研究。,对个体是“合”,对总体是“分”,两层含义,统计分组有什么作用?,1.划分现象的类型,男人,女人,婴儿,青年,老人,2.揭示现象的内部结构,3.分析现象间的

13、依存关系,身高与体重有关系吗?,哇!,咦!,“十五”期间某地区国内生产总值构成(%),某乡某种农作物的耕作深度与收获率的关系,要根据研究问题的目的和要求来选择,要选择最能反映被研究现象本质特征的标志,要结合现象所处的具体历史条件或经济条件来选择,1、分组标志的选择,统计分组的关键:选择分组标志和划定各组界限,品质标志分组 反映事物属性差异,2、分组的种类,按标志的表现形式不同有:,按存款种类分组 活期存款 定期存款,关键:选择分组标志,数量标志分组 反映事物数量差异,工人按月工资分组(元)1000-2000 2000-3000 3000-4000,关键:选择分组标志和划定各组数量界限,工人平均

14、日产量(件)5 6 7 8 9,单项式分组 一个变量值对应一组;组距式分组把整个变量值依次划分为几个区间,一 个区间对应一组,按数量标志进行分组,可能有两种情况:,对于离散变量,如果变量值的变动幅度小,就可以一个变量值对应一组,如居民家庭按儿童数或人口数分组,均可采用单项式分组。如果变量值的变动幅度很大,变量值的个数很多,则把整个变量值依次划分为几个区间,进行组距式分组。对于连续变量,由于不能一一列举其变量值,只能采用组距式的分组方式,且相邻的组限必须重叠。如以总产值、商品销售额、劳动生产率、工资等为标志进行分组,就只能是相邻组限重叠的组距式分组。,按分组标志的多少有:,简单分组 按一个标志对

15、总体进行分组。,按存款性质分组 企业存款 储蓄存款 财政性存款,再如:人口性别分组、人口年龄分组等。,复合分组 按两个或两个以上标志对总体进行分组。,存款同时按其性质及期限分组 企业存款 活期 定期 储蓄存款 活期 定期 财政性存款 活期 定期,复合分组的特点:,1、总体选择两个或两个以上标志进行重叠分组,可以从几个不同角度了解总体内部的差别和关系,研究问题更全面、更深入。2、复合分组的组数随分组标志的增加而成倍增加,因而在采用复合分组时,选择的分组标志的数量要适量,并且要考虑只有在总体包括的单位数较多时,才宜于采用复合分组。,我国工业企业复合分组表,各分组标志并列使用,各分组标志交叉结合使用

16、,平行分组体系,对教师的分类,按性别分类,男性,女性,按职称分类,按年龄分类,高级,中级,初级,青年,中年,共计7组 2+3+2,复合分组体系,按性别分类,按职称分类,按年龄分类,男,女,高级,中级,初级,青年,中年,共计12组232,对教师的分类,第三节 次数分布及其显示,一、分布数列的定义及种类二、变量数列的编制三、累计次数与累计频率四、统计图,分布数列包括两个要素:一是总体按某标志所分的组;二是各组所占有的总体单位数,意义:分配数列是统计分组结果的主要表现形式,也是统计分析的一种重要方法。它可以表明总体单位在各组的分布特征、结构状况,并在这个基础上来进一步研究标志的构成、平均水平及其变动

17、规律性。,各组的单位数叫次数(频数),记为f。各组的单位数与总体单位总数之比叫 频率,记为,组别(变量)次数(频数)频率,分类,品质标志的频数分布,表3.1 中国人口受教育程度,练习 中国名人榜100强,表3.2 中国名人30强职业,运动员演员运动员演员歌手导演演员歌手演员演员,演员演员歌手演员演员运动员运动员导演演员演员,演员组合组合演员歌手歌手演员演员歌手导演,表3.2 中国名人30强职业,职业,运动员演员歌手导演组合,合计,划记,频数,415632,30,单项数列,指每个组值只用一个具体的变量值表现的数列,同时具备,变量数列的编制,【例】己知某车间有24名工人,他们的日产量(件)分别是:

18、20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。,编制结果如下:,变量值变动区间的长度相等,变量值变动区间的长度不完全相等,相关概念,组距的上限、下限都齐全的叫闭口组,,在闭口组中,组距=上限下限,编制组距数列时,为了避免出现空组,同时又能使个别极大或极小的数据不至于无组可归,常使用“x x 以上”或“x x 以下”这种不确定具体组限的组,称为开口组,在开口组中,某地区100个百货商店月销售额与流通费用情况,上限U,下限L,如:组距d=U-L=100-50=50(万元)

19、,如:组中值x=(U+L)/2=(100+200)/2=150(万元),编制等距数列,适用于总体单位的标志值变动比较均匀的情况,实例,己知某地区某年50个商店商品销售额的资料如下(单位:百万元):7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12.0 3.5 6.8 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 13.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 21.0 16.0 13.6

20、 10.0 13.9 5.0 5.8 10.5 16.3 22.0要求编制组距数列。,编制步骤:,求变异全距,确定组距及组数,R组距(d)组数(m),编制等距数列,计算组数(组数不宜过多,也不宜太少),上例中,取d=5,则有,编制等距数列,确定组限,计算次数,编制结果:,(5+(5-5))/2=2.5,(25+(25+5))/2=27.5,练习:现有10名工人日产量资料(件):45、46、52、56、58、60、62、64、69、70。,全距:70 45=25,等距,组数 3,组距10,同限,练习:现有10名工人日产量资料(件):45、46、52、56、58、60、62、64、69、70。,累

21、计次数(频率),从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。,从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。,例中国体育代表团在雅典奥运会上获金牌的项目,1、条形图(Bar chart)是用宽度相同的条形的高度或长短来表示数据变动的图形,一般用于对单值数列的描述。,2、饼形图(Pie chart)是用圆形及圆内扇形的面积来表示数之大小的图形,研究结构性问题。,3、直方图(histogram)用矩形面积来表示频数分布的图形,一般适用于组距数列。直方图和条形图的区别:条形图:条形的

22、宽度表示类别,是固定的且无实际意义,用长度来反映频数 直方图:条形的宽度表示各组的组距,有实际意义,用长度来表示频数 由于分组数据具有连续性,直方图各矩形连续排列,而条形图分开排列,直方图,条形图,频率直方图,表 汽车销售频数分布表,图 汽车销售频数分布图,20 40 60 80,10066.733.3,4、折线图(Frequency polygon)在直方图的基础上,把直方图顶部的中点(组中值)用直线联结起来,它与直方图所围面积相等。(见课本P39图2-3),曲线图:当变量的取值非常多,变量数列的组数无限增多时,折线便趋于一条平滑的曲线,这是一种概括描述变量数列分布特征的理论曲线。,5、茎叶

23、图既能给出数据的分布状况,又能给出每一个原始数据。由“茎”和“叶”两部分组成。,树茎,405060708090,树叶,562236890022335,某班学生成绩茎叶图,6、象形图:是用形象直观并且与显示内容相似的物体来表示统计指标数值的一种图形。,三、次数分布的主要类型,钟型分布:,对称型,对称分布:中间变量值分布的次数最多,两侧变量值分布的次数随着与中间变量值距离的增大而渐次减少,并且围绕中心变量值两侧呈对称分布。,正态分布,Y,Y,右偏型(上偏型),左偏型(下偏型),X,X,偏态分布曲线,或称偏态曲线。,U型分布 J型分布,J型分配曲线,U型分配曲线,J,J,双峰曲线,本章小结,1、统计

24、数据搜集研究的起点,统计数据来源于两个渠道:一是调查,通过调查收集到的是原始数据;而数二是源于已经存在的数据,即二手数据或间接数据。2、统计调查的方法有普查、重点调查、典型调查和抽样调查。分别适用于不同研究目的的需要。3、统计分组是统计整理的关键环节、统计分组的关键是选择格局研究目的选择分组标志。4、次数分布是分组以后,形成的按一定顺序排列总体单位的分布,可以采用统计表或统计图显示。,一、名词解释,二、简答题,普查 统计分组 变量数列,1、统计调查方案的内容有哪些?2、重点调查和典型调查是如何选取调查单位的?3、什么是统计分组?它有哪些作用?,练习题,三、判 断 题,1、全面调查和非全面调查是

25、根据调查结果所得到的 资料是否全面来划分的。(),2、对某市去年下岗职工生活状况进行调查,要求在一个月内报送调查结果。所规定的一个月时间是调查时间。(),3、采用重点调查搜集资料时,选择的调查单位是标志值较大的单位。(),4、重点调查与抽样调查的目的是一致的,即都是通过部分单位的调查,来达到对总体数量特征的认识。(),5、当调查项目较多时,可以选择一览表。(),6、全面调查包括普查和统计报表。()7、统计分组的关键是确定组限和组距。()8、统计分组的关键是分组标志的选择和划分分组界限。其核心问题是分组标志的选择。()9、要了解现象随时间不断变化的完整过程,宜采用全面调查。()10、调查时间是调

26、查工作所需的时间。()11、调查方案的首要问题是确定调查对象。()12、在进行统计分组时,总体中的任何一个单位有可能同时归属于两个或两个以上的组。(),四、选 择 题,1、对一批商品进行质量检验,最适宜采用的方法()。A、全面调查 B、抽样调查 C、典型调查 D、重点调查,2、下列调查中,调查单位与填报单位一致的是()。A、企业设备调查 B、人口普查 C、农村耕地调查 D、工业企业现状调查,3、抽样调查的主要目的是()。A、计算和控制抽样误差 B、推断总体总量 C、对调查单位作深入研究 D、广泛运用数学方法,4、下述各项调查中属于全面调查的是()。A、对某种连续生产的产品质量进行检验 B、某地

27、区对工业企业设备进行普查 C、对全面钢铁生产中的重点单位进行调查 D、抽选部分地块进行农产量调查,6、统计分组的组数和组距是互相制约的,表现有()。A、组数越多,组距也越大 B、组数越多,组距就越小 C、组距越小,组数也越少 D、组数与组距不存在关系,7、某年某村农民收入最高为4260元,最低为2700元,据此分为六个组,形成闭口式等距数列,则组距应为(()。A、260 B、710 C、2000 D、3480,8、在工业设备普查中()。、全部工业企业是调查对象 B、每个工业企业是填报单位、工业企业的全部设备是调查对象 D、每台设备是调查单位,9、关于抽样调查和重点调查,下列说法正确的是()。、

28、两者都是非全面调查、两者选取单位都不受主观因素的影响、两者都按随机原则选取单位、一种可以用来推断总体指标,一种可以用来 了解总体基本情况。,10、调查单位是()。、需要调查的总体、需要调查的总体单位负责人、调查项目的承担者、调查对象所包含的具体单位,11、我国工业企业基本情况普查中()。A、统计总体是每一个工业企业 B、报告单位是每一个工业企业 C、每一个企业的“职工人数”是数量标志 D、每一个企业的“工业总产值”是统计指标,12、制定一个周密的调查方案,应确定()A、调查目的与调查对象 B、调查单位与填报单位 C、调查项目与调查表或问卷 D、调查资料的使用范围 E、调查时间与调查期限,13、

29、下列属变量数列的有()。A、大学生按所学专业分配 B、大学生按年龄分配 C、商店按商品销售额大小分配 D、工人按生产每一零件时间消耗的分配,14、某集团公司对下属各企业按计划完成程度不同分为三组:第一组为80%100%;第二组为100%120%;第三组为120%以上。这种分组中()。A、各组的上限分别为80%,100%,120%B、第一组的上限为100%,第二组的上限为120%C、某企业计划完成100%应归第一组 D、某企业计划完成100%应归第二组,15、在组距数列中,组中值是()A 上限和下限之间的中点数值B 用来代表各组标志值的平均水平C 在开放式分组中无法确定D 在开放式分组中,可以参照邻组组距来确定,End of Chapter 2,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号