《大学统计学第2章统计数据的搜集、整理与显.ppt》由会员分享,可在线阅读,更多相关《大学统计学第2章统计数据的搜集、整理与显.ppt(49页珍藏版)》请在三一办公上搜索。
1、统计学,xxx 主讲,2,第二章 统计数据的搜集、整理与显示,第一节 统计数据的搜集第二节 统计数据的整理 第三节 统计数据的显示,3,第一节 统计数据的搜集,一、统计数据的搜集方法1.统计数据搜集的概念根据统计研究预定的目的和任务,运用科学的方法与手段,有计划、有组织地向客观实际采集数据的过程2.统计数据来源:原始资料(第一手资料);次级资料(第二手资料)3.统计数据的分类按其性质不同分为调查数据和试验数据 4.统计数据的搜集方法对搜集原始资料而言,常用的方法有:直接观察法、报告法(通讯法)、采访法、实验调查设计等。,4,二、统计调查组织形式,1普查 2抽样调查 3重点调查 4典型调查5统计
2、报表制度,5,1.普查,普查:是专门组织的一种全面调查,它主要是用以搜集某些不能或不宜用定期报表搜集的统计资料。对国情国力的调查一般采用普查。普查的特点:一是一种非经常性的全面调查;二比任何一种调查形式更能掌握大量、详细、全面的统计资料。,6,第一次53年目的:为全国人大及地方人大的选举做好选民登记工作;为国家的经济、社会发展提供准确的人口数字。项目:六项(与户主的关系,姓名,性别,年龄,民族,本户住址)第二次64年目的:为编制国民经济建设的第三个五年计划和长远规划提供依据。项目:九项(增加三项,文化程度,本人成份,职业,但后两项只登记不统计)第三次82年目的:为进行社会主义现代化建设,统筹安
3、排人民的物质和文化生活,制定人口政策和规划,提供人口资料。项目:19项(又增加了常住人口的户口登记状况,在业人口 的行业,职业和不在业人口状况,婚姻状况,生育子女数,存活子女数等。第四次90年目的:为准备查清我国人口在数量、地区分布、结构和素质方面的变化;为国家进一步实行改革开放,科学地制定国民经济和社会发展战略与规划,统筹安排人民的物质和文化生活,检查人口政策的执行情况,提供可靠的资料。项目:二十一项(又增加常住地状况,迁移原因),7,第五次2000年目的:为查清十年来我国人口在数量、结构、分布和居住环境等方面的变化情况,全面检查“九五”计划的执行情况,为科学地制定国民经济和社会发展“十五”
4、计划以及年远景规划提供可靠的依据,统筹安排人民的物质和文化生活,实现可持续发展战略。项目:49项,其中:按人填报项目为26项,即姓名、与户主关系、年龄、民族、户口登记状况、户口性质、出生地、何时来本乡镇街道居住、从何地来本乡镇街道居住、迁出地类型、迁移原因、5岁及以上的人五年前常住地、6岁及以上的人填:是否识字、受教育程度、学业完成情况、15岁及以上的人填:是否有工作、工作时间、行业、职业、未工作情况、未工作者主要生活来源、婚姻状况、初婚年月、15-50岁妇女填:生育子女数、生育状况;按户填报的有23项,即户编号、户别、本户普查登记人数、本户户籍人口中外出不满半年人数、本户户籍人口中外出半年以
5、上人数等,8,中国的人口总量 大陆2000年第五次人口普查结果现有人口数的126583万;香港特别行政区政府于2000年6月30日公布的香港现有人口数为678万;澳门特别行政区政府于2000年9月30日公布的澳门现有人口数为44万;台湾当局于2000年12月公布的中国台湾省和金门、马祖等岛屿的人口数为2228万;所以,2000年年底中国的人口总量应是129533万人。性别构成 中国当前的人口性别比为106.74,男性占总人口的51.63%;女性占总人口的48.37%。,9,2抽样调查,抽样调查:是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据样本数据去推算调查对象的总体特征。概
6、率抽样的特点:一样本单位按随机原则抽取,排除了主观因素对选样的影响。二根据部分调查的实际资料对调查对象总体的数量特征作出估计。三抽样误差可以事先计算并加以控制。抽样调查的适用场合:一不可能或不必要进行全面调查的社会现象,二对普查资料进行必要的修正。,10,3重点调查,重点调查:在调查对象中,只选择一部分重点单位进行的非全面调查。重点单位:它们在所研究现象的标志总量中却占有绝大的比重,在总体中具有举足轻重的作用。特点:可以了解较详细的情况,但无法对现象总体的数量特征作出准确的推算,也无法测算调查误差。适用场合:当调查任务只要求掌握基本情况,而部分单位又能比较集中地反映研究的项目,宜采用重点调查。
7、,11,4典型调查,1)定义:是根据调查目的,在对总体进行全面分析的基础上,从中有意识地选择具有代表性的若干单位进行调查。2)目的:进行深入细致的研究,以掌握有关现象的具体情况。3)典型调查的关键是选择典型单位二种方式:A、划类选典式B、解剖麻雀式特点:由点到面,个别到一般;机动灵活,省时省力,提高调查效率;是一种深入细致的调查方式;可以研究新生事物。,12,5统计报表制度,统计报表制度:依照国家有关法规,自上而下地统一布置,以一定的原始记录为依据,按照统一的表式,统一的指标项目,统一的报送时间和报送程序,自下而上地逐级地定期提供统计资料的一种调查方式。统计报表的主要特点:一报表资料的来源是建
8、立在各个基层单位的原始记的基础上;二由于统计报表是逐级上报和汇总的,各级领导部门能获得管辖范围内的报表资料;三是一种经常性的(连续性)调查,调查项目相对稳定,有利于积累资料,并进行动态对比分析。,13,统计调查形式示意图,普 查,全面报表,抽样调查,重点调查,典型调查,周期性调查,一次性调查,普 查,抽样调查,重点调查,典型调查,全面调查,非全面调查,连续(经常性)调查,不连续调查,定期报表,专门调查,调查范 围,调查时 间,组织形 式,统计调查形式,14,三、统计调查体系,统计调查体系:一个国家开展统计调查方法和制度的总称。我国的统计调查体系:建立以必要的周期性的普查为基础,经常性的抽样调查
9、为主体,同时辅之以重点调查、科学推算和部分全面报表综合运用的统计调查方法体系。,15,四、统计调查方案的设计,一明确调查目的。二确定调查对象和调查单位。调查对象,是指需要调查的现象总体。调查单位,是指所要调查的具体单位。报告单位亦称填报单位,它是负责向上报告调查内容、提交统计资料的单位。报告单位一般是在行政上、经济上具有一定独立性的单位。三设计调查项目。四设计调查表格和问卷,16,五确定调查时间。调查时间是指调查资料所属的时间,在统计调查中,如果所调查的是时期现象,就要明确规定调查资料所反映的起止日期。如果所要调查的是时点现象,调查时间就是规定的统一标准时点。调查期限是进行调查工作的时限,包括
10、搜集资料和报送资料的工作所需的时间。六组织实施调查计划。七调查报告的撰写。,17,五、二手资料的主要来源渠道,1统计年鉴2有关期刊3有关网站:http:/,18,第二节 统计数据的整理,一、数据整理概述 1数据整理的含义:对统计调查所搜集到的各种数据进行分类和汇总,又称为汇总性整理。2统计数据整理的内容:(1)如何对所要研究的总体进行统计分组;(2)确定描述总体数量特征的统计指标体系。,19,二、统计分组基本理论,1.统计分组的概念根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。2.分组的性质兼有分和合双重含义,对于现象总体
11、,是“分”,对于单位,是“合”。3.统计分组的目的:组内同质性,组间差异性4.统计分组的种类(1)按分组标志的多少,分为简单分组和复合分组(2)按分组的标志的性质不同,分为品质分组(或称属 性分组)和数量分组(或称变量分组)。,20,三、统计分组的原则和方法,1统计分组的原则:穷尽原则、互斥原则2统计分组的方法(1)品质分组:按品质标志分组(2)数量分组:按数量标志分组(A)单项式分组与组距式分组(B)间断组距式分组和连续组距式分组“上限不在内”原则(C)等距分组与异距分组,21,3组距式分组的相关概念,(1)组距连续组距分组的组距=本组上限本组下限 间断式组距且等距分组的条件下:组距=本组上
12、限前组上限 或=本组下限前组下限 或=本组上限本组下限+1(2)组数(3)(4)开口组的组距与组中值,22,四、频数分布,1频数分布的基本理论(1)频数分布的定义(2)分布数列的两个要素总体按某标志所分的组,若总体按数量标志分组,分组标志在各组有不同的数量表现,形成标志值数列,亦称变量,一般用x 表示;各组所出现的单位数,即频数,亦称次数,用f 表示。,23,(3)相关的概念:频率 fi:第i组频数 频率的性质(A);(B)。频数密度与频率密度:(A)频数密度=频数/组距(B)频率密度=频率/组距,24,例:某班36名同学统计学考试成绩如下:56,79,86,56,80,86,86,80,64
13、,65,81,87,87,82,67,68,83,88,90,84,71,73,84,92,74,85,92,93,85,76,76,85,94,79,97,86。试编制变量数列。,2变量数列的编制方法,25,解:1)排队:2)求全距R=9756=41 3)确定组数:m取整为6。4)求组距:h取整为10(实际情况是分数的档次是10分)5)确定上、下限和次数:,26,27,例:某班组40名工人日产量资料如下:54,85,83,79,78,92,80,95,62,68,72,83,85,64,73,60,84,108,81,78,99,74,81,70,77,66,71,83,75,34,78,8
14、3,88,86,83,74,89,68,74,87。试编制变量数列。,28,1)排队:2)求全距R=10834=743)确定组数:m取整为74)求组距:h取整为105)确定组限及次数(最终结果),29,合并成一组60以下,次数为2 可合并也可不合并,视具体情况定,若合并,则为90以上,次数为4,30,(最终结果),31,【例】某电脑公司2007年前四个月各天的销售量数据(单位:台)。试对数据进行分组,32,等距分组表(上下组限重叠),33,等距分组表(上下组限间断),34,等距分组表(使用开口组),35,书上P31案例,36,五、累计频数与累计频率,1向上累计频数(或频率)分布2向下累计频数(
15、或频率)分布,37,38,第三节 统计数据的显示,一、统计表1统计表的定义和结构(1)统计表的定义(2)统计表的结构(A)从表式上看,表格包括总标题、横行标题、纵栏标题和指标数值四个部分。(B)从内容上看,统计表由主词栏和宾词栏两个部分组成。,39,2统计表的分类,(1)按主词的结构分类,根据主词是否分组和分组的程度,分为简单表、分组表和复合表。(2)按宾词设计分类,可分为宾词简单排列、分组平行排列和分组层叠排列等三种。3统计表的设计(1)开口式(2)标题(3)合计拦(4)数据(5)计量单位(6)注释或资料来源。,40,二、统计图,1直方图2折线图3曲线图4累计曲线图洛伦茨曲线图基尼系数,用以
16、衡量收入分配的平等与否。,41,分组数据的图示(直方图的绘制),某电脑公司销售量分布的直方图,我一眼就看出来了,销售量在170180之间的天数最多!,180,42,某班组日产量分组的直方图,43,44,45,例:某企业工人的工资分组如下:要求:1)工人工资在65元以下的约占百分之几?2)50%的工人工资在多少元以内?,46,解:前提条件人数在各组中是均匀分布 方法内插法,1)76.40+15.80/2=84.3%2)50+(6050)/825*(1000268435)=53.6元。,47,三、频(次)数分布图的类型,1钟型分布 钟型分布示意图,48,2U型分布,图2-7 U型分布示意图,49,3J型分布,J型分布示意图,