《调查数据的录入软件(EpiData).ppt》由会员分享,可在线阅读,更多相关《调查数据的录入软件(EpiData).ppt(71页珍藏版)》请在三一办公上搜索。
1、调查数据录入技术(调查数据输入软件EpiData),成都信息工程学院统计学院刘 全,第一节、EpiData软件简介EpiData是丹麦的一个非盈利组织编写的用以数据输入的免费软件,要获得该软件,需要通过Internet网登录http:/www.epidata.dk主页,根据相应的提示可下载。EpiData最早的版本Version 1.01发布于2000年10月,目前运用得较多的是EpiData version 3.0版,发布于2003年8月。下面简单介绍如何用EpiData3.0输入数据,并转换成SPSS能够分析的数据。简单、方便、功能强大、适用面广,非常适合于基层调查队和各类调查咨询公司使用
2、。,1、EpiData的用途 EpiData是一个用于各种调查问卷数据输入及相关信息处理的计算机程序。EpiData既适合单一问卷的数据处理,也可应用于多问卷的数据处理工作。2、EpiData的使用方法 它的基本使用方法是基于文本编辑窗口下,先书写一些简单的文本行,并使它自动转换成数据输入格式命令,然后再添加数据输入控制功能即可实现问卷输入界面的编程。3、EpiData的安装 EpiData系统的安装可按照系统安装文件的提示很方便地进行。4、EpiData的系统组成 EpiData系统有一个主文件和一个帮助文件组成。用户文件则有存在于同一目录下的几个主名相同的独立文件所组成。,一、EpiDat
3、a界面打开EpiData程序文件,可以见到其最基本的窗口(见下图)。,从EpiData的基本窗口来看,数据输入主要有6个步骤。(1)制作调查表描述文件(Define Data);建立数据录入源程序(.qes),主要包括:确定变量、内容提示、确定录入格式等;(2)生成数据文件(Make Data);由数据描述文件自动生成数据文件,从而可使用本文件进行数据录入(.rec);(3)建立数据质量控制文件(Checks);编写检验程序,从而可以实现:自动审核、过程控制等功能;(4)数据输入(Enter Data);利用上面自动生成的数据文件进行数据录入;(5)浏览数据及统计资料(Document);(6
4、)输出及转换数据(Export Data)。可将录入的数据转换成各种软件(如SPSS、SAS、EXCEL等)能够使用的数据文件。,制作调查表描述文件.qes,自动生产数据记录文件.rec,建立录入数据质量控制文件.chk,录入数据到数据记录文件.rec中去,浏览数据及统计,对数据记录文件.rec中的数据输出及转换,从EpiData的操作过程:6个步骤。,第二节、基本操作说明 第一步、制作调查表描述文件(1)新建一个调查表描述文件 单击“文件”、“生成调查表文件(QES文件)”,则自动建立一个名字为“EpiData文件1”的空的数据描述文件(见下图),数据描述文件的扩展名为QES,QES是que
5、stion的缩写。,(2)把空白的“EpiData文件1”文件存储成想要的文件名(如民意调查.qes)方法是:单击“文件”、“另存为”命令,弹出一个对话框后,指定新的文件名(如民意调查.qes),然后选“保存”即可。,(3)输入语句格式 变量名 变量提示符 变量域 注释 或 变量提示符变量名 变量域 注释其中,方括号项目为可选项。命令举例:name 姓名 _ sex 性别#(1)男(2)女 year 年龄#edu 文化程度#(1)大学及以上(2)大专(3)高中(4)初中(5)小学及以下注意:第一必须有一个变量的名字,如id,v1等;第二要对变量进行描述,如id“个案号”,v1“您的性别”等;第
6、三要用#号键定义输入的变量。变量有几个码,就打几个#键。,(4)EpiData中变量的类型,(5)预览输入变量的格式单击“REC文件”、“数据表预览”或用Ctrl+T键,则可预览所设计的数据表录入界面。,“数据表预览”的最大优点是:在不必建立数据文件的情况下,提前对数据输入格式进行检查,可以输入数据,看是否有问题,一旦发现问题,可以及时修正。,(6)输入完毕要存盘。方法:单击“文件”、“存盘”命令存盘,或用Ctrl+S键也一样可以存盘。,案例1、“中国股民投资状况抽样调查”设计,表2.2.2 股民投资状况问卷调查表,程序如下:provin 省市编码#id 调查表编号#sex 性别#男 女age
7、 年龄#周岁result 目前为止您做股票的结果是#赚钱 不赔不赚 赔钱method1 依据方法:基本因素#method2 技术#method3 跟风#method4 凭感觉#risk 您对投资股票风险有无充分认识#有 无invester 您是专职还是业余投资者#专职 业余,对应的调查项目编码如下,录入界面,(7)自动建立数据记录文件待数据表录入格式文件符合要求后,应生成数据记录文件。数据记录文件的扩展名是rec(recoder的缩写),建立的方法如下。单击“生成REC文件”图标命令,弹出“根据QES文件生成REC文件”对话框,其中有两个选项,一个是“根据QES文件”(说明调查表描述文件的路径
8、与名字),另一个是“生成REC文件”(说明数据文件的路径与名字),然后单击“确定”,即可自动生成数据文件(如“股票投资.REC”)。,至此,问卷输入编程基本完成,打开自动生成的数据文件即可进行数据录入工作!,*调查表 项目编码no#姓名name _ 性别sex#1男 2女 出生年月日birth 年龄age#1.婚姻状况marriage#未婚 在婚,与配偶共同生活了year#年 离婚或分居 丧偶2.是否在业occup:#在业,就业性质是occup1:#国有经济单位 城镇集体经济类型单位 其他经济类型单位 城镇个体或私营业主 城镇个体或私营企业被雇佣者 离退休再就业人员 其它other1:_ 不在
9、业occup2:#1)离退修,离退修前最长职业是occup3:#工人 专业技术 行政管理 商业服务 机关干部 军人或警察 其它other2:_ 2)失业人员 3)家务劳动者 4)丧失劳动力者 5)待就业者 6)其它other3:_,案例2、“XX调查”设计,录入界面,第三节、数据核查文件,EpiData软件的强大功能是在数据输入过程中可以限制输入范围、控制问项的输入顺序、进行计算、给出输入提示、维持上一记录的数据,还可为输入的数字给出文本描述等。数据核查文件(.chk)就是实现以上目的的专门文件。,一、建立数据核查文件 在关闭所有文件情况下,选择“建立CHK文件”图标命令,打开前已建立的数据文
10、件(如“股票投资.rec”),从而将为所选择的数据文件建立数据核查控制文件。,二、控制界面说明:在其话框中,可以对变量标签、范围、是否跳答、数据标签等进行设定。对话框中某些选择项的意义如下:Range/legal规定变量值的范围(如10-80,99)Jumps跳答 如输入1S2,则如果输入1 则跳到变量S2Must enter是否必须输入某个值(yes、no)Repeat 一般选择NO,若选“YES”则对上次输入的值进行复制(即内定值的设置)。Value label添加数值标签(注:数据录入时可以用F9或+查看合法值。),如选Value label,则可对其变量设置标识。,Jumps跳转举例:
11、如下调查表中,在输入“1婚姻状况”栏目,可输入如下内容:1education,2education,4education 则可实现有关跳转操作。,三、常用控制命令1、变量录入后执行命令,AFTER ENTRY 设置一个命令块,其中的命令是在当前变量录入完毕后/或光标移到另一个变量时执行。AFTER ENTRY是一个块命令,必须以END结束。格式如下:AFTER ENTRYEND,2、变量录入前执行命令,BEFORE ENTRY 设置一个命令块,其中的命令是在当前变量激活,但尚未录入时执行。BEFORE ENTRY是一个命令块,必须以END结束。格式如下:BEFORE ENTRYEND,3、新记
12、录开始时的执行命令(常用于赋初值),4、录入限制及提示命令,5、移动光标命令,6、条件命令,条件命令的结构是:IF THEN ENDIF或者是:IF THEN ELSE ENDIF,例如1:IF field1o then GOTO field10ENDIF例如2:IF(Cos(field1)*Sin(field1)0)THEN IF field2field3 THEN HELP Something is wrong.GOTO ENDIFELSE Field4=Tan(field1)GOTO field23ENDIF例如3:IF field10=.THEN Field11=.Field12=0
13、Date1=”12/03/2001”ENDIF,7、赋值命令,8、函数 利用出生日期变量数值计算个体年龄命令。LET AGE=ROUND(TODAY-D1)/365.25)其中TODAY和ROUND()分别是日期和取整函数,D1为出生日期变量。9、终止命令,四、核查文件应用举例如本例,对股民的“性别”进行控制。操作:1、“建立CHK文件”,则弹出对话框,指定相应的REC文件(如“股民投资。REC”)2、光标制定在“性别”位置,选择“Value label”出的“+”,输入相应标记,选“确定并关闭”即可。,核查文件其它例子,VAR1;指定对VAR1的检验 RANGE 1 5;指定var1的输入范
14、围15 MUSTENTER;要求本变量必须输入 JUMPS 1 VAR4;若输入的是1,则转VAR4变量域去输入 2 VAR5;若输入的是2,则转VAR5变量域去输入 3 VAR10;若输入的是3,则转VAR10变量域去输入 END;JUMPS结束 BEFORE ENTRY;在对VAR1输入前,执行VAR1=F1+2 VAR1=F1+2 END AFTER ENTRY IF(VAR1=2)AND(F2=1)THEN HELP“如果F2有值1,则VAR1 不能有值 2。请检验您的输入!GOTO VAR1 ENDIF ENDEND;整体检验程序以END结束 注:本程序在CHK程序中产生。,要求在质
15、量控制编程界面下,光标对应VAR1,然后选择“编辑”,则可输入如右质量控制程序。,又例:,BEFORE ENTRY IF k1=.THEN&如果变量K1的值缺失,则显示 TYPE k1值缺失!HIDE K2-K10&隐含变量K2-K10,UNHIDE K2 可恢复K2 GOTO name&转name 变量处输入 ENDIF END,案例1:“XX调查表”中“年龄”的处理技术,“XX调查表”中“婚姻状况”的处理技术,“XX调查表”中“是否在业”的处理技术,“XX调查表”中“就业性质”的处理技术,“XX调查表”中“其它”的处理技术,“XX调查表”中“不在业”的处理技术,“XX调查表”中“不在业,其
16、它”的处理技术,案例2:,变量设计,问卷描述文件程序设计,*-龙泉驿区机关事业单位非在编后勤人员统计表id*-注意:您正在录入第 张表!*类别 1、总数 2、本区城镇户籍人数 3、本区农村户籍人数 4、区外城镇户籍人数 5、区外农村户籍人数*-total1 合计总数#total2 本区城镇户#total3 本区农村户#total4 区外城镇户#total5 区外农村户#manage1 管理总数#manage2 本区城镇户#manage3 本区农村户#manage4 区外城镇户#manage5 区外农村户#busine1 业务总数#busine2 本区城镇户#busine3 本区农村户#busi
17、ne4 区外城镇户#busine5 区外农村户#supply1 工勤总数#supply2 本区城镇户#supply3 本区农村户#supply4 区外城镇户#supply5 区外农村户#*-空岗情况及岗位要求 工种为0则退出!-work1 工种 _ sex1 性别#age1 年龄#skill1 技能#time1 时间(月数)#need1 人数#othe1 备注 _work2 工种 _ sex2 性别#age2 年龄#skill2 技能#time2 时间(月数)#need2 人数#othe2 备注 _work3 工种 _ sex3 性别#age3 年龄#skill3 技能#time3 时间(月数
18、)#need3 人数#othe3 备注 _work4 工种 _ sex4 性别#age4 年龄#skill4 技能#time4 时间(月数)#need4 人数#othe4 备注 _work5 工种 _ sex5 性别#age5 年龄#skill5 技能#time5 时间(月数)#need5 人数#othe5 备注 _,核查文件,1、在supply1supply4处,分别设置:2、在supply5处设置:,录入界面,数据内容,第四节、数据输入(在核查文件.chk的控制下,用数据文件.rec实现数据录入。)方法:单击图中的“数据录入”图标命令,出现对话框后,选择欲录入的数据文件名.rec,从而可以
19、进行数据录入。,应用案例,“成都市龙泉驿区企业用工情况调查”,编写的录入程序,输入界面,生成的SPSS数据文件,第五节、其它操作一、浏览数据文件的信息单击图中的Document,可以对数据文件资料的相关信息进行浏览,这些信息包括了数据文件的相关信息、数据输入注意事项、数据文件标记、数据清单、编码表、逻辑检查等。二、数据转换单击图中的“数据导入/导出”、“数据导出”图标命令,出现对话框后,选择欲导出的数据文件格式,再选择欲导出的数据记录文件.rec,从而可以进行数据导出。,1、输出数据操作 单击图中的导出为SPSS文件,打开对话框,在图中寻找需导出的数据记录文件.rec,然后单击“打开”按钮,出
20、现对话框(见左下图)后单击OK按钮,出现对话框(见右下图)后单击OK按钮,输出的数据以指定的文件为名。,三、继续录入数据或修改数据,选择“数据录入/导出”、“数据录入/编辑”,指定欲追加记录的文件名,即可进行追加记录或修改记录。,出现追加界面如左所示。最后存盘即可。,四、记录文件(REC)的合并,选择“数据导入/导出”,“纵向追加记录/横向合并记录”,则出现界面:选择欲合并的两个记录(REC)文件名,确定即可实现多人录入操作。,指定目标文件名,再选“追加:即可。用“数据处理”,“数据一览表”,再指定文件名即可查看追加后的结果文件。,1、纵向追加,2、横向合并在进行调查表描述文件设计中,当调查项
21、目很多时,一般可采用分段设计的方式。即第一部分调查项目由第一录入程序承担,第二部分调查项目由第二录入程序承担,依此类推。这样一来,数据录入完成后就需要将字段横向合并,以得到完整的REC文件。合并操作:选择“数据导入/导出”,“纵向追加记录/横向合并记录”,则出现如下界面:(横向添加字段)选择文件对话框,五、数据检验,1、静态数据检验数据录入后的检验“数据处理”、“一致性检验(对调查表双录入后的差异对比)”操作如下:选择菜单“数据处理”、“一致性检验(对调查表双录入后的差异对比)”,则出现如下窗口:,2、动态数据检验实时检验。“工具”、“准备双录入实时检验”动态数据检验可以在数据双录入过程中及时
22、对录入数据进行检验,这样可以对错误进行及时改正。为了进行双录入实时检验,在第一遍录入数据完成后,要在其REC文件基础上建立双工备份文件。其操作如下:选择菜单“工具”、“准备双录入实时检验”,则出现如下界面(图2.6.3):,指定第一遍录入数据所产生的REC文件名(如:人口调查.rec),系统将自动产生其主名相同,但扩展名为“_dbl.rec”的供双录入的新REC文件(图2.6.4):,六、参数设置,“文件”、“选项”,可实现对各种文件的参数设置。1、改变QES、REC等文件的界面2、生成变量的选择,在新REC文件中设置ID启始号:注意:此功能是在新的REC文件中设置ID号,一旦REC文件建立,以后再设置ID起始号则在此文件中不会起作用了。,七、相关操作,1、修改QES文件,并保留原REC文件已有的记录:“工具”、“根据修改的QES文件更新REC文件”2、文件记录过滤 在CHK文件中设置KEY变量,如 光标定位在相应关键字变量位置,选择“过滤器”、“定义过滤器”,输入数据即可。,八、文件记录排序显示及修改记录,选择“数据处理”、“数据一栏表”,输入REC记录文件名,则进入相应记录文件的“数据编辑”显示窗口。选择“编辑”(或显示值或显示标签)、“根据记录号排序”即可。,基本CHECK的设置,忽略缺失值,跳转,在记录之间转换,录入过程不能用鼠标,录入过程中的翻页,