统计学-调查与整理.ppt

上传人:小飞机 文档编号:6599248 上传时间:2023-11-16 格式:PPT 页数:45 大小:212.50KB
返回 下载 相关 举报
统计学-调查与整理.ppt_第1页
第1页 / 共45页
统计学-调查与整理.ppt_第2页
第2页 / 共45页
统计学-调查与整理.ppt_第3页
第3页 / 共45页
统计学-调查与整理.ppt_第4页
第4页 / 共45页
统计学-调查与整理.ppt_第5页
第5页 / 共45页
点击查看更多>>
资源描述

《统计学-调查与整理.ppt》由会员分享,可在线阅读,更多相关《统计学-调查与整理.ppt(45页珍藏版)》请在三一办公上搜索。

1、1,第二章 统计数据的搜集与整理,STAT,本章重点提示:1、统计调查的种类;2、统计调查方案的设计;3、现阶段统计调查体制改革的趋势及发展方向;4、专门调查概述;5、统计分组的意义和分组方法;6、变量数列的编制及应用;次数分布的类型。本章难点提示:重点调查、典型调查与抽样调查的区别与联系 变量数列的编制,2,第二章 统计数据的搜集与整理,STAT,第一节 数据的计量尺度与类型一、数据的计量尺度(一)定类尺度(最粗略、计量层次最低)分类 按事物的某种属性对其进行平行的分类或分组。(只能测度事物之间的类别差,其他差别无法得知)例:按照性别将人口分为男、女两类。(二)定序尺度(计量层次次低)分类、

2、排序 又称顺序尺度,是对事物之间等级差别和顺序差别的一种测度。它不仅可以测度类别差,还可以测度次序差。(不能测量类别之间的准确差值,只能比较大小,不能进行加、减、乘、除数学运算)例:考试成绩可分为优、良、中、及格、不及格。(三)定距尺度(计量层次高于定序尺度)分类、排序、差距 又称间隔尺度,是对事物类别或次序之间距离的测度。例:,3,第二章 统计数据的搜集与整理,STAT,考试成绩80分与90分之间相差10分。定距数据可以进行加、减运算,不能进行乘、除运算。其原因为定距尺度中没有绝对零点(定距尺度中的“0”表示水平,不表示没有)。(四)定比尺度(计量层次最高)分类、排序、差距、比率 又称比率尺

3、度,由于定比尺度有绝对零点(定比尺度中的“0”表示没有,不存在)。因此,不仅可以加减运算,还可以乘除运算。例如,甲工资为600元,乙工资为1200元,则乙的工资为甲的2倍。二、数据的类型 定性数据(品质数据):反映品质特征,不能用数值表示,由定类尺度和定序尺度计量形成。定量数据(数量数据):反映数量特征,能用数值表示,有定距尺度和定比尺度计量形成。,4,第二节 统计数据的搜集(统计调查)一、统计数据的来源 直接来源:专门组织的调查、科学试验;间接来源:第二手数据,主要有公开出版或公开报道的数据。二、统计调查的概念与种类(一)统计调查的概念 统计调查是具体搜集统计资料的工作过程。既包括对原始资料

4、 的搜集,也包括对次级资料的搜集。对统计调查的基本要求是:准确、及时、完整。(二)统计调查的种类 1、按调查对象所包括的范围分,可分为 全面调查:对所有调查单位全部进行调查,包括普查和全面统计报表。非全面调查:只对一部分调查单位进行调查,如重点调查、抽样调查和典型调查。,5,第二章 统计数据的搜集与整理,STAT,2、按登记时间是否连续分,可分为:经常性调查:随被研究现象的变化而进行连续不断的登记(调查对象一般为时期现象)。如对产值、产量、原材料消耗等的调查。时期现象:现象随着时间的发展而发生连续不断地变化,是反映一个过程的现象。特点:量变与间隔时间长短有直接关系。一次性调查:每隔一段时间对被

5、研究现象进行一次性的登记(调查对象一般为时点现象)。如月初(末)职工人数调查、季初(末)商业网点数调查。时点现象:现象表现为某一时点(瞬间)的状态。特点:量变与间隔时间长短没有直接关系,6,第二章 统计数据的搜集与整理,STAT,3、按调查的组织形式分,可分为:统计报表制度:自上而下布置任务,自下而上上报资料的统计制度或调查方法。专门调查:为某一特定目的而专门组织的调查。包括普查、重点调查、抽样调查和典型调查。(三)、我国统计调查方法改革的目标模式 建立一个以必要的周期性普查为基础,以经常性的抽样调查为主体,同时辅之以重点调查、科学推算和全面报表综合运用的统计方法体系。,7,第二章 统计数据的

6、搜集与整理,STAT,三、统计调查方案的设计(一)、确定调查目的(Why)(二)、确定调查对象与调查单位(Who)1、调查对象:被研究现象的总体(即调查范围)。2、调查单位:需要对它的标志进行登记的总体单位 3、填报单位:填写、上报统计资料的单位。注:调查单位与填报单位有时一致,有时不一致。(三)、确定调查项目和调查表(What)1、调查项目:调查时应进行登记的标志。2、调查表:具体可区分为单一表与一览表。单一表:一个调查单位用一张表;一览表:多个调查单位共一张表。,8,第二章 统计数据的搜集与整理,STAT,城市住户基本情况调查表 户主姓名 199 年度 季度,9,第二章 统计数据的搜集与整

7、理,STAT,城市住户现金收支调查表 199 年度 季度,10,第二章 统计数据的搜集与整理,STAT,(四)、确定调查时间(When)1、调查时间:资料所属时间(一段时期、某个时点)。时期现象:资料所反映的起止时间。时点现象:调查规定的时点。2、调查期限:调查工作进行的起止时间。(五)、组织实施计划(How),11,第二章 统计数据的搜集与整理,STAT,课堂练习1、下列各项调查中,调查单位和填报单位可能一致的有()A、工业企业普查 B、工业企业设备普查 C、商业职工工资调查 D、工业产品产值调查 E、职工出勤调查答案:A、C、E2、确定调查单位是指确定由哪些单位来进行调查。()答案:错。3

8、、统计调查方案中首要的问题是()A、确定调查对象 B、确定调查单位 C、确定调查项目 D、明确调查目的和任务答案:D,12,第二章 统计数据的搜集与整理,STAT,四、统计调查方法(一)、普查:专门组织的一次性的全面调查。特点:1、一次性调查(一次性的同时又具有周期性。逢“0”进行人口普查,逢“5”进行经济普查);2、全面性调查;3、是国情、国力的调查(为国家制定有关政策或措施提供依据)。注意的问题:标准时点:对调查对象登记时所依据的统一时点。,13,第二章 统计数据的搜集与整理,STAT,例如:我国第四次人口普查的标准时点为1990年7月1日零时,第五次为2000年11月1日零时。标准时点的

9、作用:(1)避免调查数据的重复或遗漏,确保数据的准确性。(2)反映现象在该时点上的状况。例如:2000年10月31日23时出生,11月1日凌晨2时死亡的婴儿,应记入我国的人口数。()答案:对。又如,2000年10月31日23:55逝世的人,应记入人口数()答案:错。,14,第二章 统计数据的搜集与整理,STAT,假定人口普查的标准时间为7月1日零时,某乡在6月28日进行人口登记数为5080人,如6月29日该乡死亡2人,7月2日出生5人,则人口普查表上该乡人口数为()A、5080人 B、5078人 C、5083人 D、5075人答案:B普查的组织方式 1、通过专门组织的普查机构进行。如人口普查

10、2、利用企事业单位日常核算资料和报表资料进行。如物资库存普查、快速普查等,15,第二章 统计数据的搜集与整理,STAT,(二)、重点调查:从调查对象中选择一部分重点单位进行调查。重点单位:调查的标志值在总体标志总量中占有绝大比重的单位。特点:1、调查目的是了解总体的基本情况;2、重点单位的重点位置是客观存在的;3、不可推断总体数量特征。(三)、典型调查:在对调查对象初步分析的基础上,选择几个有代表性的单位进行深入细致的调查。特点:1、是深入细致的调查;2、典型单位的选择带有明显的主观因素;3、可以据以估算总体数值,但不能计算和控制调查误差。,16,第二章 统计数据的搜集与整理,STAT,(四)

11、、抽样调查:从调查总体中按随机原则抽取部分单位进行调查,并根据其结果推断总体数量特征。特点:1、根据样本资料推断总体数量特征;2、按随机原则抽取调查单位;3、抽样误差可以计算和控制。(五)、统计报表制度 五、统计数据采集的方法 观察法 采访法 报告法 问卷法 文献法,17,第二章 统计数据的搜集与整理,STAT,六、统计调查误差的种类及成因 1、登记性误差:调查过程中因主观或客观的原因而产生的误差。主观原因:调查者的思想素质和业务技能等;客观原因:测量仪器等。2、代表性误差:但由于样本的结构与总体结构不一致而产生的偶然误差。(1)系统性误差:未遵守随机原则而产生的误差。(2)随机性误差:完全遵

12、守了随机原则,但由于样本的结构与总体结构不一致而产生的偶然误差。,18,第二章 统计数据的搜集与整理,STAT,第三节 统计数据的整理 一、统计整理的意义和内容 1、统计整理的概念:根据研究的目的和要求,对调查资料进行科学的加工处理,使之条理化、系统化,以反映总体特征的工作过程。2、统计整理方案的内容:统计审核 统计分组 统计汇总 编统计表 中心内容 二、统计资料的审核 准确性审核(包括逻辑检查和计算检查)及时性审核 完整性审核(调查单位是否全包括?调查项目是否都回 答?),19,第二章 统计数据的搜集与整理,STAT,三、统计分组 1、统计分组的概念和作用 概念:将总体按照一定的分组标志区分

13、为若干个性质不同的组成部分的一种统计方法。作用:(1)、划分现象的不同类型;(2)、揭示现象的内部结构;(3)、分析现象之间的依存关系。2、统计分组的原则和关键 原则:保持组内的同质性与组与组之间的差异性 关键:选择分组标志和划分各组界限,20,第二章 统计数据的搜集与整理,STAT,例如对某班同学按成绩进行分组,结果如下,何种正确()A、成绩 B、成绩 55以下 60以下 5565 6070 6575 7080 C、成绩 D、成绩 60以下 58以下 6068 5870 7080 6580 答案:B,21,第二章 统计数据的搜集与整理,STAT,3、统计分组的方法(1)、按分组标志的性质分类

14、 按品质标志分组:按事物的属性分组,突出事物的品质上的差异。按数量标志分组:按事物的数量属性分组,显示现象的数量上的差异。,22,第二章 统计数据的搜集与整理,STAT,(2)、按分组标志的多少分类 简单分组:对总体只按一个标志进行的分组。例如对中国人口进行分组平行分组体系(并列分组):对同一总体进行若干次简单分组所形成的分组体系。,23,第二章 统计数据的搜集与整理,STAT,复合分组:对同一总体按两个或两个以上的标志层叠起来进行分组。例 如:对人口按性别、文化程度进行复合分组形成的复合分组体系 人口,24,第二章 统计数据的搜集与整理,STAT,第四节 次(频)数分布一、次数分布的概念及类

15、型(一)概念1、次数:分布在各组的单位数(f);2、频率:各组次数与总次数的比重 用f/f表示;3、次数分布:反映总体单位数在各 组间的分布(表、图)。(二)类型1、属性分布数列:按品质标志分组所形成的分布数列。体现现象质上的差别且较稳定。,25,第二章 统计数据的搜集与整理,STAT,2、变量分布数列:按数量标志分组所形成的分布数列。体现现象量上的差别且有多种编制方法。作用:显示现象的分布规律和分布特征。变量数列的构成(1)变量及变量值;(2)次数或频率。,26,第二章 统计数据的搜集与整理,STAT,二、变量数列的种类1、单项数列:一个变量值代表一组。适用于变量的变异幅度不大的情况。2、组

16、距数列:由表示一定变动范围的两个变量值代表一个组。适用于变量值个数较多、变异幅度 较大的资料。具体可分为等距数列与不等距数列。,27,第二章 统计数据的搜集与整理,STAT,三、变量数列的编制 1、组限:一组的数量界限。组限的确定原则:确保组内的同质性,组间的差异性。2、组距(i)=本组上限本组下限3、4、组数(n)全距组距R/I5、组中值=(上限十下限)/2 组中值用来代表各组变量值=下限十组距/2 的平均水平具有一定的假定=上限一组距/2 性,28,第二章 统计数据的搜集与整理,STAT,开口组:缺上限或缺下限的组 开口组组距以邻组组距代替闭口组:上下限均完整的组 开口组首组组中值=上限一

17、邻组组距/2 开口组末组组中值=下限+邻组组距/2,29,第二章 统计数据的搜集与整理,STAT,6、次数密度=本组次数/本组组距 反映次数在各组分布的密集程度。适用于异距数列。7、对连续型变量,只可编制组距数列,且相邻的组限必须重叠。记住:“上组限不在内”对离散型变量,可编制单项数列和组距数列。编制组距数列时采用不重叠组限 依据:遵循不重复、不遗漏的原则。,30,第二章 统计数据的搜集与整理,STAT,8、变量数列的编制。例:30名同龄儿童身高(cm):106,99,85,121,84,94,106,105,110,119,101,95,91,87,105,106,109,118,96,12

18、8,91,97,105,111,111,107,103,101,107,106。(1)将变量值按大小次序排列;84,85,87,91,91,94,95,96,97,99,101,101,103,105,105,105,106,106,106,106,107,107,109,110,111,111,118,119,121,128。(2)计算全距:R=12884=44(cm);(3)确定组数与组距;令i=10cm,则组数n=44/10=4.4,取5组。,31,第二章 统计数据的搜集与整理,STAT,84,85,87,91,91,94,95,96,97,99,101,101,103,105,105,

19、105,106,106,106,106,107,107,109,110,111,111,118,119,121,128。(4)编制变量数列。,32,第二章 统计数据的搜集与整理,STAT,课堂练习1、按学生考试成绩分组所形成的变量数列中,学生人数是变量()答案:错,次数。2、如果要反映某单位职工的文化水平情况,可编制()A、单项数列 B、品质数列 C、组距数列 D、等距数列答案:B3、企业按职工人数分组时,可采用()A、连续组距数列 B、不连续组距数列 C、品质数列 D、连续或不连续组距数列答案:B,33,第二章 统计数据的搜集与整理,STAT,4、对某局所属企业按生产计划完成程度分组,何种正

20、确()A B C 100%以下 99%以下 99%以下 100110%100109%99.1100%110%以上 110%以上 100.1%以上 D E 90%以下 95%以下 90%100%95105%100110%105110%110%以上 110%以上答案:A、D,34,第二章 统计数据的搜集与整理,STAT,5、对同一总体以两个或两个以上的标志进行简单分组()A、简单分组 B、平行分组体系 C、复合分组 D、复合分组体系答案:B6、连续变量数列其末组为开口组,下限为1000,其相邻组的组中值为950,则末组的组中值为()A、1025 B、1050 C、1100 D、1150答案:B7、

21、组距数列中,计算组中值的方法有()A、(上限+下限)/2 B、上限邻组组距/2 C、下限+邻组组距/2 D、上限+邻组组距/2 E、(上限下限)/2,35,第二章 统计数据的搜集与整理,STAT,答案:A、B、C8、次数分布数列由变量和次数两部分构成()答案:错。9、组中值就是各组变量值的实际平均水平()答案:错。10、从理论上说,在等距数列中全距等于()和()的乘积。答案:组数、组距。11、某生产小组有10名工人,每人某日生产量如下(件):450,480,540,550,580,600,620,640,700,660。利用分组法,对上述10人的日产量分为高中低三档,并说明该小组工人日产量的特

22、征。,36,第二章 统计数据的搜集与整理,STAT,四、统计数据的显示(一)统计数据的显示 人数1、表式法2、图示法(1)直方图横轴:表示变量;纵轴:表示次数。在直方图中,宽表示组距高表示次数。身高(2)折线图 将组中值用折线连接而成。,1512963,80 90 100 110 120 130,37,第三章 统计数据的描述,STAT,(3)曲线图 当组数无限增多,则组距无限减小,此时折线趋近于曲线。(二)次数分布的类型1、钟形分布分布特征:中间大、两头小。钟形分布进一步区分为(1)对称分布(2)偏态分布 正偏:又称右偏,有极大值;左偏:又称负偏,有极小值。,38,第二章 统计数据的搜集与整理

23、,STAT,3、J形分布分布特征:一边大、一边小。(1)正J分布:右大左小;次数随变量值的增大而增多(2)反J分布:左大右小;次数随变量值的增大而减少,死亡率,年龄,2、U形分布分布特征:两头大、中间小。,39,第二章 统计数据的搜集与整理,STAT,第五节 统计汇总一、统计汇总的组织形式 逐级汇总 集中汇总二、统计汇总的技术 手工汇总 计算机汇总,40,第二章 统计数据的搜集与整理,STAT,第六节 统计表一、概念:容纳与表现统计资料的表格。二、制作:上下粗线、中间细线、两边开口。三、统计表的结构(一)从外表形式看,由四部分构成:1、总标题:表的名称,包括:时间、空间、经济内容;,横行标题,

24、纵栏标题,指标数值,41,第二章 统计数据的搜集与整理,STAT,2、横行标题:反映总体及其分组的名称;3、纵栏标题:统计指标名称;4、指标数值:列在横行与纵栏的交叉处。(二)从统计表的内容来看1、主词:统计表所要说明的对象;2、宾词:统计指标及其数值。主词 宾词,横行标题,纵栏标题,指标数值,42,第二章 统计数据的搜集与整理,STAT,四、统计表的种类(一)按用途分,可分为调查表、整理表、分析表(二)按主词的分组情况分,可分为:1、简单表:对主词(总体)未经任何分组的表,其主词只有两种表现形式:总体单位名称的排列、时间顺序的排列;,43,第二章 统计数据的搜集与整理,STAT,44,第二章 统计数据的搜集与整理,STAT,2、分组表:对主词进行简单分组后所形成的表。,45,第二章 统计数据的搜集与整理,STAT,3、复合表:对主词进行复合分组后所形成的表。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号