数据的编码、录入与整理.ppt

上传人:小飞机 文档编号:6050232 上传时间:2023-09-18 格式:PPT 页数:56 大小:1.27MB
返回 下载 相关 举报
数据的编码、录入与整理.ppt_第1页
第1页 / 共56页
数据的编码、录入与整理.ppt_第2页
第2页 / 共56页
数据的编码、录入与整理.ppt_第3页
第3页 / 共56页
数据的编码、录入与整理.ppt_第4页
第4页 / 共56页
数据的编码、录入与整理.ppt_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《数据的编码、录入与整理.ppt》由会员分享,可在线阅读,更多相关《数据的编码、录入与整理.ppt(56页珍藏版)》请在三一办公上搜索。

1、SPSS基础与Access数据库,姓 名:郑戟明电 话:67703855答疑时间:答疑地点:学院楼B421,商务信息学院计算机教学部,SPSS的名称,1968年美国斯坦福大学两名研究生研制,原名SPSS,英文名称社会科学统计软件包(Statistical Package for the Social Sciences)首字母的缩写。1994-1998年间陆续并购SYSTAT等公司,统计软件的3S指的就是SPSS、SAS、SYSTAT2000年改名为“Statistical Product and Service Solutions”,即“统计产品与服务解决方案”2010年SPSS公司被IBM并

2、购。,SPSS软件应用行业,SPSS软件是一款在很多行业的数据分析应用中久享盛名的统计分析工具,是世界上最早的统计分析软件。应用领域经济学教育学商业金融营销研究行业电子商务数据统计政府机构其它,SPSS的影响力,在国际学术界有一条不成文的规定:凡是用SPSS完成的计算和统计分析,可以不必说明算法。,SPSS发展,1968年:斯坦福大学三位学生创建了SPSS,诞生了第一个用于大型机的统计软件 1975年:在芝加哥成立SPSS总部 1984年:首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SP

3、SS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。1992年:推出Windows版本2000年:SPSS 11.0起,SPSS全称为“Statistical Product and Service Solutions”,即“统计产品和服务解决方案”,标志着SPSS的战略方向正在做出重大调整。,2009年:SPSS公司宣布重新包装旗下的SPSS产品线,定位为预测统计分析软件(Predictive Analytics Software)PASW,包括四部分:PASW Statistics(formerly SPSS Statistics):统计分析 PASW Mo

4、deler(formerly Clementine):数据挖掘 Data Collection family(formerly Dimensions):数据采集 PASW Collaboration and Deployment Services(formerly Predictive Enterprise Services):企业应用服务 2010年:随着2009年7月28日,IBM以12亿美元现金收购SPSS之后,各子产品家族名称前面不再以PASW为名,修改为统一加上IBM SPSS字样:IBM SPSS Statistics:统计分析产品;IBM SPSS Modeler:数据挖掘产品;

5、IBM SPSS Data Collection family:数据采集产品;IBM SPSS Collaboration and Deployment Services:企业应用服务,SPSS发展,SPSS发展,SPSS发展,SPSS认证简介:,认证考试要求参加者回答一系列问题,然后应用SPSS软件完成一些任务。目前SPSS Statistics认证和SPSS Modeler认证系列各有三个考试等级,如下:一、SPSS Statistics Certification 1.SPSS Statistics初级认证:考试费1000元,(学生500元)2.SPSS Statistics中级认证:考

6、试费1500元,(学生750元);3.SPSS Statistics高级认证:考试费2000元;,SPSS认证简介:,二、SPSS Modeler Certification 1.SPSS Modeler初级认证:考试费1000元,(学生500元);2.SPSS Modeler中级认证:考试费2000元,(学生1000元);3.SPSS Modeler高级认证:考试费3000元;,SPSS认证简介:,通过 SPSS 专业认证的好处 1.认证证书 获得认可的专家证书和赠品。有权将付给您的认证证书用于广告和商务宣传。2.专业人才 增强您的职业潜能,帮助您不断提高技术支持水平。成为行业公认的技术人才

7、。3.技术领先 不定期获得最近计算机产品资料和技术信息,这些资料将以期刊、技术文件或CD方式寄送给您。被SPSS邀请参加技术研讨会以及展览会。从SPSS提供的技术支持中得到优惠。,SPSS基础内容:,第7讲 SPSS数据的编码、录入与整理第8讲 统计报告第9讲 描述性统计第10讲 均值比较第11讲 散点图、相关系数 第12讲 回归概念、回归系数 第13讲 SPSS综述,SPSS数据分析步骤,建立数据文件,数据加工整理,统计分析,解释分析结果,第7讲数据的编码、录入与整理,一、数据的编码、录入与整理,原理 是研究者利用SPSS进行统计分析的必要前提。就是把通过问卷调查获得的资料转变为SPSS能够

8、识别的数据文件,为各种统计分析做好准备。数据编码概念 数据编码是指把需要加工处理的数据库信息,用特定的数字来表示的一种技术。根据一定数据结构和目标的定性特征,将数据转换为代码或编码字符,在数据传输中表示数据的组成,并作为传送、接受和处理的一组规则和约定。,二、数据问卷与编码(举例),问卷量表,二、数据问卷与编码(举例),问卷编码方案,三、编码类型,数值型数据的编码 数值型数据的编码就是根据调查问卷的评分标准对变量赋予分值。通常采用三点计分、四点计分和五点计分等方式进行评分 如选项A、B、C计分为1、2、3 如选项A、B、C、D计分为1、2、3、4 编码示例中的第5、6题就是属于数值型编码第5题

9、是正向数值型(被选项的程度越高,分值越大)第6题是反向数值型(被选项的程度越高,分值越小),三、编码类型,非数值型数据的编码 非数值型数据的编码,首先要确定编码规则,然后根据规则对变量赋予分值。双值型变量的编码多采用“0、1”或“1、2”来赋值;如编码示例中的第1题 多值型变量的编码采用“1、2、3、”来赋值;如编码示例中的第2题 通常对非数值型数据编码,主要起到分组的作用,不能进行各种算术运算,三、编码类型,多项选择题 多项选择题就是题目答案的选项是多选项限定多选项分类法 限定了一次最多可以选择项目的个数;不能直接对题目进行编码,必须先确定最多选择,并给每个选项建立一个变量;如编码示例中的第

10、3题任意多项二分法 表示每一次可以任选几个选项;编码方法把每一个被选项作为一个变量来定义,每个变量只能选择“1或0”;如编码示例中的第4题,四、缺失值的处理,概念 缺失值是指在数据采集与整理过程中丢失的内容,往往会给统计分析带来一些麻烦和误差。类型 用户缺失值在问卷调查中把不回答的选项当作缺失值来处理缺失值可用研究者能识别的数字来表示如“0、9、99”系统缺失值指计算机默认的缺失方式,如输入数据空缺、输入非法字符等通常把缺失值标记为“.”,四、缺失值的处理,缺失值处理方法 替代法:采用统计命令或在相关统计功能中利用参数替代 Transform Replace Missing Values 剔出

11、法:剔除有缺失值的题目或剔除有缺失值的整份问卷,五、数据处理中的操作术语,个案(Cases)一个研究对象就是一个个案;一个个案就是一条记录;在数据表格中表示为“一行”每一个个案记录的是一个研究对象各个属性的具体数值,如学生信息(姓名、性别、年龄等)个案,每一行为一条记录每一列为一个字段每个记录只能对应一个对象且仅为一个,字段,学生表,五、数据处理中的操作术语,样本(Sample)是指具有共同属性的所有研究对象,如学生的所有信息 样本包含多个个案,在数据表格中表示为“n行”变量(Variable)是指问卷中每一个问题,数据库里字段,数据表格中表示为“一列”量值(Value)是指问卷中的答案,也称

12、为观测值,在SPSS系统里,单元格中的数值就是变量值,六、定义变量,启动SPSS后进入数据编辑窗口,显示为一个空文件,输入数据前首先要定义变量。,六、定义变量,定义变量所包含的内容:变量名(Name):变量的名称变量类型(Type):变量的类型宽度(Width):存储变量值的最大值(1可存储1个字节的字符,2可存储1个汉字)小数位数(Decimals):变量为数值类型时,小数后的位数变量标签(Label):对变量名的注释。光标在变量名上时,会显示该标签变量值标签(Values):变量标签的取值缺失值(Missing Values):定义缺失的值,例如,当定义99为缺失值时,当该变量的值为99时

13、,把它认为是缺失值显示数据的列宽(Colums):与上面“宽度”不同,它只管显示对齐方式(Align):左对齐、右对齐、居中量度类型(Measure):定比变量(Scale)、定序变量(Ordinal)、定类变量(Nominal)。只用于统计制图时坐标轴变量的区分和SPSS决策树模块的变量定义。,六、定义变量,单击数据编辑窗口左下方的“Variable View”标签或双击列的题头(Var),打开变量定义窗口,进行变量定义。,六、定义变量,定义变量名 在定义变量窗口中Name下的单元格中输入变量名 变量名必须以字母开头,长度不超过8个 SPSS保留的关键词不能作为变量名 AND、OR、NOT、

14、WITH、TO、BY、GT、GE、LT、LE、EQ、NE、ALL等 SPSS中允许使用中文变量名,但尽量不要使用,以免出现兼容性问题,六、定义变量,定义变量类型、宽度及小数位数 在Type下单击单元格,打开变量类型窗口,选择变量类型常用变量类型有:数值型(Numeric)日期型(Date)货币型(Dollar)字符型(String)在Width、Decimal下单元格,选择宽度和小数位数,系统默认为“8”和“2”;或者在变量类型窗口中设置,六、定义变量,定义变量标签 在Label下单击单元格,输入变量标签 SPSS允许变量标签长度为255字节定义变量值标签 变量值标签是对变量的每一可能取值进一

15、步描述,当变量是定类或定序变量时,非常有用。变量值标签系统默认为None 在Values下单击单元格,打开变量值标签窗口,输入变量值标签,六、定义变量,定义缺失值 在Missing下单击单元格,打开缺失值窗口,输入缺失值 No missing values:没有缺失值 Discrete missing values:定义13个单一数为缺失值 Range plus one optional discrete missing values:定义指定范围为缺失值,同时指定另外一个不在这一范围的单一数为缺失值,六、定义变量,变量定义的信息复制 如果有多个变量的类型相同,可以先定义一个变量,然后把该变量

16、定义的信息复制给新变量 操作步骤:先定义一个变量 在该变量行号上单击右键,在快捷菜单中选择“Copy”选择同类型新变量所在行,单击右键,在快捷菜单中选择“Paste”,七、数据的录入,定义完所有变量后,单击“Data View”标签,在数据编辑窗口输入数据。数据录入如果按逐行进行,按Tab键改变行 数据录入如果按逐列进行,按Enter键改变列 也可以通过方向键改变行或列 系统默认的数据文件保存类型为“.sav”,八、数据的导入,SPSS具有强大的与其他软件共享数据文件的功能,所以能够导入多种格式的数据能够导入SPSS的数据文件:*.sys、*.por、*.xls、*.slk、*.w*、*.db

17、f、*.dat、*.syd、*.sas7dbat等导入数据文件的操作步骤:执行菜单命令File Open Data”选择导入数据文件的类型 通过复制粘贴导入数据 在原系统中打开需要导入的数据文件 复制粘贴到SPSS中(但要注意数据类型,可能出很多问题),八、数据的导入,例一(1):把Access中shift-MIS.mdb中的“学生表”信息导入到SPSS中.a).打开shift-MIS.mdb文件,选中“表”对象,再选中“学生表”。,八、数据的导入,例一(1):把Access中shift-MIS.mdb中的“学生表”信息导入到SPSS中.b).菜单上,文件导出,“保存类型”选择“Microso

18、ft Excel 97-2003(.xls)”,文件名自动为“学生表”“导出”,八、数据的导入,例一(1):把Access中shift-MIS.mdb中的“学生表”信息导入到SPSS中.c).启动SPSS,FileOpenData,“文件类型”选择“Excel(*.xls)”,找到“学生表.xls”文件后“打开”d).保存为:学生表.sav,八、数据的导入,例一(2):数据的导入 将EXCEL文件2-recode.xls导入到SPSS中启动SPSS;方法一:FileOpenData.数据导入后,查看“Variable View”标签中的字段名、类型、宽度等。方法二:练习通过复制、粘帖的办法 把

19、2-recode.xls中的数据通过复制,在SPSS中粘帖的办法导入到SPSS中,但可能会遇到一些问题,请思考如何解决这些问题?把导入后的数据文件保存为2-recode.sav,九、数据的整理,概念 数据整理是对录入的数据进行转换、检测、量表统分、个案选择、文件拆分与合并等操作,使原始数据生成后续研究所需要的数据。操作 SPSS实现数据整理的功能主要集中在“Data”和“Transform”两个菜单,九、数据的整理,例二:数据分值的转换 数据分值的转换是通过对数据进行重新编码来实现的。在SPSS中主要通过“Transform”菜单中的“Recode”命令来实现Into Same Variabl

20、es:编码后数据存放在原变量中,覆盖原数据Into Different Variables:编码后数据存放在新定义的变量中,保留原数据,九、数据的整理,例二:数据分值的转换 假设一套量表共10题,每题有A、B、C三个选项,现有10个被试作答。要求根据评分规则,将被试的原始数据选择转换为量表分数注意:1、2、4、7、8、10:正向题3、5、6、9:反向题,九、数据的整理,例二:数据分值的转换,原数据,转换后数据,九、数据的整理,例二:数据分值的转换 数据输入:打开数据文件(2-recode.sav)Transform Recode Into Different Variables 打开“Reco

21、de”对话框,定义新变量名 打开“Old and New Value”对话框,定义转换规则 以原文件名保存,九、数据的整理,例三:量表的统分 在数据录入过程中,输入的是最原始、最稳定的反应选项,但在后续的统计分析中通常需要对量表的总分进行推断统计。量表的统分工作包括分量表的统分和总量表的统分,SPSS中通常用“Transform”菜单中的“Compute”命令实现量表的统分工作,九、数据的整理,例三:量表的统分 以分值转化后的数据文件2-recode.sav为例。假定该量表由2个分量表构成,其中1个量表由第1、2、5、8、9题组成,另一个量表由第3、4、6、7、10题组成。计算出每一个被试的分

22、量表分和总量表分。,九、数据的整理,例三:量表的统分 打开数据文件2-recode.sav。Transform Compute(计算分量表分flb1、flb2和总量表分zlb)统分结果保存为2-lb.sav,九、数据的整理,例四:数据的限选 在数据统计分析中,通常需要限定选择部分个案进行研究,如抽取40%个案来研究 在SPSS中,主要通过Data Sort Cases 或 Data Select Cases 来实现数据的限选,九、数据的整理,例四:数据的限选 以数据文件2-lb.sav为例,找出变量zlb的高低分组的分组 如以总个案的40%为界限确定高低分,九、数据的整理,例五:数据的限选 打

23、开数据文件2-lb.sav Data Sort Cases 将分数排序,确定高分组和低分组的起点分数值 将变量zlb转换为变量zlb1;将高分组和低分组进行分组。因为以总个案的40%为界限确定高低分,所以高分组和低分组各取4个个案 10*40%=4(4个个案)根据排序可以确定高分组和低分组的起点分数值分别为22和20,九、数据的整理,例五:数据的限选,九、数据的整理,例五:数据的限选 以SPSS系统随带数据文件Anxiety.sav为例 要求限选前20个个案进行后续统计分析。,九、数据的整理,选择所有个案按指定条件选择个案对个案进行随机抽样按比例大概抽样精确抽样按范围选择个案,例五:数据的限选,多余数据保留在原表中,多余数据被删除,九、数据的整理,例五:数据的限选 打开数据文件Anxiety.sav。Data Select Cases 设置前20个个案。,作业,1.完成课堂示例2.课后思考题P24(1-5)第3题结果保存为xscj.sav 第4题的原始文件为score.sav,下节展望,统计报告 在进行数据处理之前,了解样本数据的基本特征。在线分析处理报告个案摘要报告行形式摘要报告列形式摘要报告,谢,结束,谢,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号