《《资料处理》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《资料处理》PPT课件.ppt(58页珍藏版)》请在三一办公上搜索。
1、2023/8/1,1,第十章 资料处理与分析第一节 数据处理与分析的基本程序第二节 SPSS简介及数据的编码和录入 第三节 数据清理第四节 统计表与统计图第五节 SPSS应用:简单统计分析,2023/8/1,2,第一节 数据处理与分析的基本程序,一 资料的审核二 资料的复查三 资料处理的基本程序,2023/8/1,3,一 资料的审核,1.资料审核的含义 是资料处理的第一步工作 指研究者对调查所回收的原始资料(主要是问卷)一 资料的审核进行初步的审查和核实,校正错填、误填,提出乱填、空白和严重缺答的废卷,是原始资料具有教好的准确性、完整性和真实性,从而为后续资料整理录入与统计分析工作打下较好的基
2、础。,2023/8/1,4,2.审核的内容,检查问卷(填写的完整性和数据质量)重新向被调查者核实3.审核的方式实地审核(边调查边审核)集中审核(问卷全部回收后集中审核),2023/8/1,5,二 资料的复查,1.含义(回访)指研究者在回收调查资料后又由其他人对所调查的样本中的一部分个案进行第二次调查,以检查和核实第一次的调查的质量。2.对不合格问卷的处理(1)复查(重新调查)(2)填补缺省值(3)丢弃不合格问卷(作为废卷处理),2023/8/1,6,三 资料处理的基本程序,编码,问卷审核与复查,建库、数据录入,清理数据,统计分析,2023/8/1,7,第二节 问卷编码和数据录入,一 问卷编码
3、1.答案代码的确定 2.问题栏码的确定 3.编码手册二 数据录入 1.建立数据库 2.录入的方式 3.录入工作的安排与组织,2023/8/1,8,二 问卷编码,编码就是给每个问题及答案一个数字作为它的代码,将问卷中的文字转化成数字的过程1.答案代码的确定(1)填空题和单项选择题,答案的预编码就是答案代码(2)多项选择则采取0、1编码(3)矩阵式或表格式则按方向性赋值编码(4)习惯上以“0”作为缺省值,“9”作为特殊值,比如“不知道”或“其他”,2023/8/1,9,问题025:您认为打工的外地人对北京市的社会秩序是否有影响?(单选)1有很大影响 2有较大影响 3没有影响 4不好说,4,编码,答
4、案,2023/8/1,10,问题001:您的性别是:1 男 2 女 2 问题002:您的年龄是34岁:3 4问题011:您家中是否有下列物品:(可多选)1电话 2传真机 3电脑 4电视 5手机 6其他 1 0 0 1 1 0,2023/8/1,11,2.问题栏码的确定,(1)分配栏码,指定该问题的编码值的位数(宽度)及在整个数据文件中所处的位置(一般在建数据库的时候确定)(2)栏码一般在问卷设计时就印在问卷上,也有在问卷回收后指定的(3)对于年龄、工资收入、时间、人数等等距变量,在分配栏码时要根据实际情况确定合适的宽度,2023/8/1,12,3.编码手册,(1)编码手册要将编码的项目和问题一
5、一列出,逐一规定它的代码、宽度、栏码、简要名称、答案赋值方式及其他特殊规定等(2)有了编码手册,不同的调查员或编码员就可以按同样的标准和方法对问卷进行编码,2023/8/1,13,1.建立数据库(1)SPSS简介 SPSS是Statistical Program for Social Sciences 的简称,即社会科学统计程序,由美国SPSS公司1970年代推出,迄今已有30多年的历史。是国际著名三大社会科学统计软件包之一(SAS、SPSS、Statis)。我们现在使用的是SPSS for Windows 13.0版。(2)Foxpro,三 数据录入,2023/8/1,14,2.建立数据库的
6、演示(以SPSS为例)(1)打开SPSS软件(2)点开“Variable View”(3)开始建库:Name:变量名 Type:数据类型 Decimal:小数点 Missing:缺省值 Lable:变量简称,2023/8/1,15,2023/8/1,16,2023/8/1,17,3.数据录入,录入的方式:(1)直接将编好的码录入(2)先将数据转录,再录入到数据库中录入工作的组织:(1)挑选和培训录入人员(2)统一规定数据录入格式和数据文件名(3)每个输入人员的问卷独立(4)由研究者合成,2023/8/1,18,第三节 数据清理,一 有效范围清理二 逻辑一致性清理三 数据质量清理,2023/8/
7、1,19,一 有效范围清理,1.指数据中的数据超出了编码值的范围这种错误发生的情况有:原始数据本身的问题编码的错误录入人员的错误2.检查的方法 在SPSS软件中执行一条统计各统计变量频数分布的命令,当我们发现频数分布表中的变量的取值超出了编码手册所规定的赋值范围,就需要将这些问卷找出同原始问卷核对,2023/8/1,20,二 逻辑一致性清理 对于相倚问题适用 IF命令 COMPUTE命令三 数据质量抽查 抽取样本的25的个案进行校对,2023/8/1,21,第四节 统计表与统计图,一 统计表1.统计表的构成2.统计表的制作二 统计图1.统计图的特点2.统计图的类型,2023/8/1,22,1.
8、统计表的构成,1.表号:便于指示和查找2.总标题:表的名称,简要说明表中资料的内容3.横标题:在表的左侧(1)频数表,一般用来统计所要说明的主题(2)交互分类表,放因变量4.纵标题:在表的最上一格(1)频数表,指示调查指标或统计指标的主题(2)交互分类表,放自变量5.数字:统计表的实质性内容6.表注:对统计表的资料来源和有关内容的说明,2023/8/1,23,2.统计表的制作,统计表制作的原则:科学、规范、简明、实用、美观(1)表的标题要简短明了(2)纵标题和横标题要准确反映变量取值的含义,它们的排列顺序要符合逻辑(3)表中的数据资料必须注明计量单位(4)对于一般频数表,应列出合计栏,以便获得
9、整体情况(5)各种表格均应以横线为主,能不用竖线就不用,即使要用竖线,也应是开口式,上下画粗线,其余细线,2023/8/1,24,二 统计图,1.统计图的特点:与统计表相比,统计图直观、形象、通俗易懂 2.统计图的适用范围:统计图一般应用于调查资料的初级统计接、结果的描述,特别适合对调查总体的内部构成进行描述,对不同现象的分布进行比较,以及对现象变化的趋势进行展示等。,2023/8/1,25,3.统计图的分类,条形图(1)简单条形图(2)复合条形图扇形图折线图(1)单式折线图(2)复式折线图,2023/8/1,26,图8-1 网民每月实际花费的上网费用分布(%),2023/8/1,27,图8-
10、2 历次调查网民每月实际花费的上网费用分布(%),2023/8/1,28,图8-3 网民年龄分布,2023/8/1,29,图8-4 历次调查网民每周上网小时数(小时),2023/8/1,30,图8-5 历次调查网民拥有E-mail帐号及免费E-mail帐号平均值(个),2023/8/1,31,第五节 SPSS基本应用,一 单变量描述统计二 数据转化与调整,2023/8/1,32,一 单变量描述统计,1.单选题的描述统计分析(1)在菜单栏中打开Analyze(2)选中Descriptive Statistics(3)选中Frequency的statistic对话框 中的quartiles选项,2
11、023/8/1,33,单选题频数分析,2023/8/1,34,对话框,2023/8/1,35,2023/8/1,36,2.平均值的计算,(1)在菜单栏中打开Analyze(2)选中Descriptive Statistics 选项(3)选中Descriptive 3.多选题的描述统计分析(1)在菜单栏中打开Analyze(2)选中Multiple Response 中定义设置(3)如是两分变量(0,1编码的)则输入1,如是多元答案则输入有效范围(4)定义新变量名和代号,2023/8/1,37,2023/8/1,38,2023/8/1,39,2023/8/1,40,2023/8/1,41,Gro
12、up$XB8 上站动机(Value tabulated=1)Pct of Pct ofDichotomy label Name Count Responses Cases上站动机-社会交往 B81 34 9.9 23.4上站动机-自我肯定 B82 5 1.5 3.4上站动机-休闲娱乐 B83 117 34.0 80.7上站动机-学习需要 B84 28 8.1 19.3上站动机-兴趣爱好 B85 51 14.8 35.2上站动机-获取信息 B86 109 31.7 75.2-Total responses 344 100.0 237.20 missing cases;145 valid case
13、s,2023/8/1,42,排序题的分析,排序题定义对话框,2023/8/1,43,2023/8/1,44,排序题分析:频数分析结果,2023/8/1,45,排序题分析:交互分类结果,2023/8/1,46,一 数据重新分组(1)在菜单栏中打开Transform(2)选中Record 选项(3)选中Into Different Valuable,第二节 数据转化与调整,2023/8/1,47,菜单选择,2023/8/1,48,对话框,2023/8/1,49,2023/8/1,50,2023/8/1,51,对话框,2023/8/1,52,2023/8/1,53,2023/8/1,54,二 生成新的变量(1)在菜单栏中打开Transform(2)选中Compute 选项(3)定义新的变量,2023/8/1,55,2023/8/1,56,2023/8/1,57,2023/8/1,58,