第2讲问卷数据的录入与清理ppt课件.ppt

上传人:牧羊曲112 文档编号:2104355 上传时间:2023-01-10 格式:PPT 页数:50 大小:352KB
返回 下载 相关 举报
第2讲问卷数据的录入与清理ppt课件.ppt_第1页
第1页 / 共50页
第2讲问卷数据的录入与清理ppt课件.ppt_第2页
第2页 / 共50页
第2讲问卷数据的录入与清理ppt课件.ppt_第3页
第3页 / 共50页
第2讲问卷数据的录入与清理ppt课件.ppt_第4页
第4页 / 共50页
第2讲问卷数据的录入与清理ppt课件.ppt_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《第2讲问卷数据的录入与清理ppt课件.ppt》由会员分享,可在线阅读,更多相关《第2讲问卷数据的录入与清理ppt课件.ppt(50页珍藏版)》请在三一办公上搜索。

1、第1部分 数据获得,调查问卷设计及数据收集问卷数据的录入与清理,调查问卷结构,问卷一般包含:封面信、指导语、问题、答案、编码等几个部分。,几种典型的问卷题型(填空题),1填空题 在问题后划一短横线,让回答者直接在空白处填写。例2-1 请问您家有几口人?口人例2-2 您的年龄多大?周岁例2-3 您有几个孩子?个例2-4 您每天上班在路上需要多少时间?分钟,几种典型的问卷题型(单选题),2二项单选题 问题的答案只有是和不是(或其他肯定形式和否定形式)两种,回答者根据自己的情况选择其一。例2-5 您是共青团员吗?1.是 2.不是例2-6 您是否住在本市?1.是 2.否例2-7 您家有电视机吗?1.有

2、2.没有例2-8 您是否同意民主选举厂长?1.同意2.不同意例2-9 您是否同意“主观为自己,客观为他人”的说法?1.同意2.不同意,几种典型的问卷题型(单选题),3多项单选题 给出的答案至少在两个以上,回答者根据自己的情况选择其一作为回答。这是各种社会调查问卷中采用得最多的一种问题形式,其答案特别适合于进行频率分析和交叉分析。在设计上,这种问题形式的关键之处是要保证答案的穷尽性和互斥性。例2-10 您的文化程度是:1.小学及以下2.初中3.高中4.大专5.大学本科及以上例2-11 您的婚姻状况是:1.未婚2.已婚3.离婚4.丧偶例2-12 您最喜欢看哪一类电视节目?1.新闻节目2.电视剧3.

3、体育节目 4.广告节目5.其他节目(请写明),几种典型的问卷题型(多选题),4多项限选题 多项限选也称限选不排序,与多项选一(多项单选题)有所不同的是,可以在所列举的多个答案中,要求回答者根据自己的情况从中选择若干个。例2-13 您最喜欢看哪些电视节目?(可多选,最多3项)1.新闻节目2.电视剧3.体育节目4.广告节目5.教育节目6.歌舞节目7.少儿节目8.其他节目(请写明)例2-14 您生育孩子的主要动机是什么?(可多选,最多3项)1.传宗接代2.完善人生3.增加夫妻感情4.养儿防老5.扩大家族势力6.体验做父母的乐趣7.增加劳动力8.没考虑过9.其他(请写明),几种典型的问卷题型(多选题)

4、,5多项排序题 多项排序也称限选排序。这种题目可以说是针对多项限选题(限选不排序)的不足而出现的一种问题类型,在一定程度上可以看成是多项单选题和多项限选题的一种结合。例2-15 您认为作为一名企业领导最重要的三条素质是什么?(请将答案号码填入下表中)1.大公无私 2.坚持原则 3.敢想敢干 4.以身作则5.团结群众 6.思想敏锐7.业务熟悉 8.文化程度高9.其他(请写明),几种典型的问卷题型(多选题),6多项任选题 多项任选也称不限选。多项任选题是在所提供的答案中,被调查者可以任意选择各种不同答案的一种问题形式。例2-16 在以下各种家用物品中,您家有哪些?(可多选,不限选)1.彩电2.录像

5、机3.影碟机4.空调5.洗衣机 6.冰箱7.计算机8.微波炉9.电话,几种典型的问卷题型(矩阵题),7矩阵题(表格题)经常采用矩阵(表格)的形式将同一类型的若干个问题集中在一起,构成一个“大”问题。矩阵题通常采用李克特量表。例2-17 您觉得下列现象在你们学校是否严重?(请在每一行适当的方框内打),几种典型的问卷题型(量表),量表 量表主要用来测量人们的感觉或主观判断,它的测量逻辑是假定有相同主观感觉的人,会在一个由弱到强的连续线段(维度)的相同位置,标出自己的感觉。(1)李克特量表(2)博加德斯社会距离量表(3)语义差异量表,几种典型的问卷题型(李克特量表),李克特量表 20世纪30年代美国

6、心理学家李克特(R.A.Likert),将答案从2种选择,扩展成了4种:“非常同意”、“同意”、“不同意”和“非常不同意”。例2-23 对“统计数据分析基础”这门课的教学质量,您的总体评价是:1.优秀 2.良好 3.一般 4.较差 5.很差李克特量表的答案类别应保持在48个之间,最好能提供类似“无所谓”、“不知道”、“未决定”、“一般”和“没意见”等中性类别。,几种典型的问卷题型(语义差异量表),语义差异量表语义差异量表是20世纪50年代发展起来的,主要用来测量人们对观念、事物或他人的感觉。人们通常愿意用形容词来描述自己的感觉,而形容词又多具有反义词,如好与坏、快与慢、多与少等,因此,以形容词

7、正反语义为基础建立的量表,被称为语义差异量表。从语义上看,形容词大致分为三大类:评价(好与坏)、力度(强与弱)和行动(主动与被动)。其中,最经常使用的是评价。语义差异量表的形式由处于两端的两组意义相反的形容词构成,每一对反义形容词中间分为七个等级,每一等级的分数从左至右分别为1、2、3、4、5、6、7,也可以为7、6、5、4、3、2、l。,几种典型的问卷题型(子题),8相倚问题(子题)在问卷设计中,常常会遇到这样的情况:有些问题只适用于样本中的一部分调查对象。比如,“您有几个孩子”这一问题,就只适合于那些已结婚的调查对象。为了使设计的问卷适合每一个调查对象,在设计时必须采取相倚问题(或称子题)

8、的办法。所谓相倚问题,指的是在前后两个(或多个)相连的问题中,被调查者是否应当回答后一个(或后几个)问题,要由他对前一个问题的回答结果来决定。前一个问题称作过滤性问题,后一个问题则称作相倚问题(子题)。,几种典型的问卷题型(子题),例2-19 请问您的婚姻情况是:1.未婚请跳过问题28,直接从问题9开始回答。2.已婚3.离婚4.丧偶,几种典型的问卷题型(答案的设计),答案的设计 由于社会调查中的大多数问卷主要由封闭式问题构成,而答案又是封闭式问题非常重要的一部分。因此,答案设计的好坏就直接影响到调查的成功与否。关于答案的设计,除了要与所提的问题协调一致以外,特别要注意做到使答案具有穷尽性和互斥

9、性。所谓答案的穷尽性,指的是答案包括了所有可能的情况。例2-20 您的性别是:1.男2.女例2-21 您最喜欢看哪类电视节目?1.新闻节目2.体育节目3.电视剧4.教育节目,不穷尽,穷尽,几种典型的问卷题型(答案的设计),答案的设计 所谓答案的互斥性,指的是答案之间不能交叉重叠或相互包含。例2-22 您的职业是什么?1.工人2.农民3.教师4.商业人员5.干部6.医生7.售货员8.专业人员9.其他 因为答案中的“商业人员”与“售货员”、“专业人员”与“教师”和“医生”都是不互斥的。,答案不互斥,2.4 编辑问卷的技巧,各答案项目前加方框给各答案项目加上编号各答案项目上下对齐用Tab键和“制表位

10、”实现上下对齐用Word的“制表位”功能实现调查问卷选项的上下对齐,2.5 收集问卷数据,按照调查设计的具体要求,进行问卷填写收集数据。收集数据是整个社会调查工作中最复杂、最辛苦,投入的时间、人力、财力相对较多的工作,同时也是最吸引人的工作。数据的收集工作要按照严格的程序与科学的方法进行,回收的问卷一定要编号,以便核对。根据调查问卷由谁来填写,社会调查中的数据收集方法可分为两种类型:一是自填问卷法,二是结构访问法。,调查问卷实例,1999年关于外商投资企业雇员的调查问卷,第3章 问卷数据的录入与清理,3.1 问卷数据的录入3.2 在Excel中录入数据3.3 核对和清理数据3.4 在Excel

11、中核对数据3.5 在SPSS中录入数据3.6 在SPSS中核对数据,问卷数据的录入与清理,进行数据统计分析之前,必须先将问卷数据录入计算机。为了保证不“GIGO,Garbage In Garbage Out”(垃圾进垃圾出),在统计分析之前,需要对录入的数据进行核对和清理。,3.1 问卷数据的录入,数据输入就是将问卷数据所对应的编码通过扫描或用键盘输入计算机,建立数据文件的过程。目前,数据输入的方式主要有三种:人工输入计算机辅助系统转换:当调查采用“计算机辅助面谈系统”(CAPIS)或“计算机辅助电话调查系统”(CATIS)搜集数据时,将每个调查员计算机中的数据转换成数据文件的过程。光电输入:

12、包括光电扫描和条形码判读两种方式。,3.1问卷数据的录入(人工输入),人工输入的注意事项:要规定统一的输入内容和输入格式。挑选和培训数据输入人员。数据输入过程中需要注意:第一,统一规定数据文件名。第二,数据输入时要为每一个输入人员提供一份有关输入内容和格式的手册。第三,要为每个输入人员提供足够的空间摆放问卷,避免不同输入人员的问卷或者同一输入人员已输入和未输入的问卷发生混淆,造成漏输或重复输入,影响问卷的质量。第四,每个输入人员在完成各自负责的问卷的输入任务后,由研究者把他们的数据合并成一个总的数据文件,以供统计分析使用。为了避免数据丢失,要把每个输入人员输入的数据单独存档,以备查找。,3.2

13、 在Excel中录入数据(单选题),1.确定取得单一答案2.尽可能使用单选题3.单选题如何编码和输入Q1.请问您现在是否拥有手机?1.有2.没有(跳至Q12题)例3-1 在Excel中录入单选题Q1的数据单选题的编码和输入(用文字当列名,图3-1)单选题的编码和输入(用题号当列名,图3-2),3.2 在Excel中录入数据(单选题),例3-1 在Excel中录入单选题Q1的数据单选题的编码和输入(用文字当列名,图3-1)单选题的编码和输入(用题号当列名,图3-2),3.2 在Excel中录入数据(多选题),多选题分为多项限选题、多项排序题、多项任选题。Q2.请问您当初购买手机的原因是什么?(可

14、多选,最多3项)1.方便与家人联络 2.方便与朋友同学联络 3.追求流行4.工作需要 5.同学间比较的心理 6.别人赠送7.手机价格下降 8.厂商推出的促销方案 9.网内互打较便宜 10.其他例3-2 在Excel中录入多选题Q2的数据多选题的编码有2种:分类法和二分法。“分类法”编码和输入(图3-3)“二分法”编码和输入冻结窗格(比较图3-4和图3-5),3.2 在Excel中录入数据(多选题),二分法(Multiple Dichotomies Method):将每个可能的答案设为一个变量,变量的取值最多有两个(1和0),分别表示“选”或“不选”(在实际应用中,经常只有一个取值1,代表“选”

15、,而用空值代表不选)。这种方法的缺点是需要的变量个数比较多;优点是比较简单。二分法常用于“不限选”和“限选不排名”。分类法(Multiple Category Method):分类法常用于“限选”(很少用于“不限选”),包括“限选不排名”和“限选排名”。按照限选的最多答案设置变量个数,每个变量的取值为选项值。比如,一个多选题,如果最多可选3个答案,那就设置3个变量,分别用来存放3个可能的答案。如果某受访者只填答两个,那么第3个变量的取值为缺失值;如果某受访者只填答一个,那么第2、3个变量的取值均为缺失值。分类法的优点是需要的变量个数比较少。,3.2 在Excel中录入数据(多选题),例3-2

16、在Excel中录入多选题Q2的数据“分类法”编码和输入(图3-3),3.2 在Excel中录入数据(多选题),例3-2 在Excel中录入多选题Q2的数据冻结窗格(比较图3-4和图3-5),3.2 在Excel中录入数据(填空题),填空题也称开放题,不提示任何答案,要求使用者直接填写。对数值型的数据,为了取得其真正的数字(如:55),而非只取得区间(如:4160),会采用填空题的方式取得数据(定量数据,数值型数据),例如:请问您平均每个月手机的话费约 元?定量数据可不经任何转换,即可计算各种统计量:均值、标准差、最大值、最小值等,而且也可以直接进行均值比较与检验,甚至可以作为回归分析的因变量或

17、自变量。如果为了取得数据的方便,就设计成选择题(单选题):请问您平均每个月手机的话费约多少钱?1.20元及以下2.2140元3.4160元 4.6180元5.81100元6.101元及以上,3.2 在Excel中录入数据(填空题),例3-3 在Excel中录入填空题的数据(图3-6),3.2 在Excel中录入数据(量表),量表其实是一种顺序尺度(有序变量),只有大小先后的关系,无倍数关系。,3.2 在Excel中录入数据(量表),量表有多种编码方式,表3-2是量表常用的三种编码方式。为了方便,研究上,经常将其视为连续的数字数据(定量数据),直接求其均值、标准差等统计量。,3.2 在Excel

18、中录入数据(量表),例3-4 在Excel中录入量表的数据(图3-7),3.2 在Excel中录入数据(排名题),排名(多项排序)是一种衡量的方式。如:下列几种手机的入网方式,请问您认为哪一种的收费最便宜?请依排名顺序,填入1、2、3、4、5:全球通 神州行 如意通 动感地带 新时空 分此种类型的问卷,作为被排名的对象也不宜太多。否则,受访者也无法排列好。排个5、6项基本就是上限了。例3-5 在Excel中录入排名题的数据(图3-8)可将排名题改为单选题,将来用出现次数的多少来排名即可。,3.2 在Excel中录入数据(排名题),例3-5 在Excel中录入排名题的数据(图3-8),3.3 核

19、对和清理数据,数据有效范围的清理对数据中的奇异值进行清理。数据逻辑一致性的清理依据问卷中的问题相互之间所存在的某种内在的逻辑联系,来检查前后数据之间的合理性,主要针对的是相倚问题和多项限选题。数据质量的抽查:研究者往往抽取2%-5%的个案进行核对。,3.4 在Excel中核对数据,筛选出范围不合理的单列用自动筛选找出不合理的关联题用高级筛选找出重复的记录,3.4 在Excel中核对数据,筛选出范围不合理的单列例3-6 在Excel中核对“大小适中”的数据:小于1大于5的值是否存在,3.4 在Excel中核对数据,用自动筛选找出不合理的关联题例3-7 在Excel中核对关联题“是否有手机”与“平

20、均月费”的数据:2无手机,平均月费非空白;1有手机,平均月费空白。,没有手机但有手机话费,有手机但没有手机话费,3.4 在Excel中核对数据,用高级筛选找出重复的记录例3-8 用Excel处理重复的记录,SPSS软件介绍(Statistical Program for Social Sciences):社会科学统计程序。该软件是公认的最优秀的统计分析软件包之一。数据编辑窗口:变量视图和数据视图,数据文件后缀.sav。输出窗口:统计分析结果显示窗口。,3.5 在SPSS中录入数据,3.5 在SPSS中录入数据,手工建立数据文件例3-9 在SPSS中,手工建立调查问卷的数据文件(.sav文件)1

21、.居民收入与生活状况的调查问卷2.确定变量的个数3.在SPSS中定义变量变量名:一般用英文,也可以用中文,问卷经常用问题编号数据类型、变量名标签、变量值标签、缺失值(系统缺失值和用户缺失值)、计量尺度(定量数据、定序数据和定性数据),3.5 在SPSS中录入数据,4.单选题的变量定义5.多选题的变量定义:二分法和分类法,3.5 在SPSS中录入数据,从Excel获取数据文件例3-10 将Excel中的数据导入到SPSS数据文件中方法一:先在SPSS中定义好变量,然后通过“复制粘贴”方式将数据从Excel复制到SPSS中。方法二:利用打开数据文件的方法直接把Excel中的数据导入到SPSS中,然

22、后再定义变量属性。具体如下:在SPSS中,单击菜单“File”-“Open”-“Data”,进入“Open File”对话框,在最下面的“文件类型”中选择“Excel(*.xls)”,然后选择录入好数据的Excel文件(要求该文件暂时没有被Excel打开),单击“打开”,进入“Opening Excel Data Source”对话框,单击“OK”。定义变量属性:对每个变量进行进一步的定义(如变量名标签、变量值标签等),以期达到SPSS分析所要求的目的,3.6 在SPSS中核对数据,利用SPSS的一维频率分析Frequencies命令可以发现单变量范围不合理的数据。例:检查性别(Q2)是否有不

23、符合要求的特殊编码值。一维频率分析命令。查找有问题的个案:找到有问题的变量栏,运用“Edit”“Find(查找)”命令,或者“Data”“Sort Cases(排序)”命令,找到这一变量栏中编码超出范围的数值。,3.6 在SPSS中核对数据,利用SPSS的交叉表分析Crosstabs命令可以发现两个变量之间的逻辑一致性问题。例:检查Q6选择“1.没有”存款,却在存款的三个主要目的中填了选项的错误。交叉表分析命令。查找有问题的个案:找到Q6变量栏,运用“Edit”“Find(查找)”命令,找到Q6_1、Q6_2、Q6_3变量栏中有选项的错误。,上机安排,上机时间:7周周三第四大节8、12、14-16周周五第一大节上机地点:商务D204第7周周三实验内容:实验1下次上机收本次实验的实验报告,作业:设计调查问卷,针对有实践环节(上机)课程的考核方式,向同学们进行调查。设计一份相关的调查问卷(尽量包含课上所讲的题型),并进行抽样调查、发放问卷(填写问卷)、回收问卷(收集数据)。,要求:,问卷应包含:封面信、指导语、问题、答案、编码等几部分。设计调查方案,包括调查目的与内容、调查对象、调查实施方法、进度安排等说明。5个人一组,要求每组至少回收30份问卷。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号