SPSS的数据采集和整理.ppt

上传人:牧羊曲112 文档编号:6520437 上传时间:2023-11-08 格式:PPT 页数:44 大小:311.49KB
返回 下载 相关 举报
SPSS的数据采集和整理.ppt_第1页
第1页 / 共44页
SPSS的数据采集和整理.ppt_第2页
第2页 / 共44页
SPSS的数据采集和整理.ppt_第3页
第3页 / 共44页
SPSS的数据采集和整理.ppt_第4页
第4页 / 共44页
SPSS的数据采集和整理.ppt_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《SPSS的数据采集和整理.ppt》由会员分享,可在线阅读,更多相关《SPSS的数据采集和整理.ppt(44页珍藏版)》请在三一办公上搜索。

1、SPSS的数据采集和整理,本讲主要内容:SPSS数据采集数据格式与问卷题目类型数据录入数据获取SPSS数据整理变量级数据整理文件级数据整理,数据类型,SPSS统计分析要求的数据格式,问题的类型,单选题-3,5字符串型开放题-2数字型开放题-1,4,7多选题-6,问卷示例:1、调查序号。2、您的姓名。3、性别。1)男 2)女4、您的出生年月日。5、您的职业。1)工人 2)农民 3)教师 4)其他6、获取新闻的主要方式有。1)报纸 2)杂志 3)电视 4)收音机 5)网络7、每天收看新闻的小时数。,Back,数据的录入,数据编辑器包括两个视图:1.变量视图:定义变量10个属性2.数据视图:录入数据

2、,定义变量属性-变量名,变量名命名要求:变量名的第一个字符必须为字母,后面可跟任意字母、数字、句点或、#或$等符号;变量名不能以句点结尾;最后一个字符可以为下划线但应避免(可能会与分析过程中自动产生的变量造成冲突);,12版之前变量名的长度一般不能超过8个字符;空格和特殊字符(如!、-、?、和*等)不能用于变量名;每个变量名必须保证是唯一的,不区分大小写;下面的关键词不能用作变量名:ALL NE EQ TO LE LT GE BY OR GT AND NOT WITH,定义变量属性-变量类型type,数字型数值型(Numeric):是默认的形式逗号型(Comma):小数点前数据每三位数用逗点分

3、开小数点型(Dot):小数点前数据每三位数用句点分开科学计数型(Scientific notation)美元型(Dollar),定制货币型(Custom currency):SPSS只提供美元型变量作为现成的货币描述量。若为人民币型变量则必须进行定义。方法如下:进入data editor窗口-edit-option-currency-在prefix选项中输入¥等即可 一次可定义5个不同的货币类型。日期格式型(Date)字符串型(String),定义变量属性-变量标签label,变量标签:对变量的含义解释,定义变量属性-值标签value,值标签:对变量值进行说明。例如对性别变量标注值标签:1=男

4、 2=女(若变量为数值型)或:m=男 f=女(若变量为字符串型),定义变量属性-测量尺度measure,变量测量尺度:定类变量(Nominal):名义变量定(/有)序变量(Ordinal):有序变量定距和定比变量(Scale):尺度变量,定义变量属性-缺失值missing,定义缺失值的类型:没有缺失值:默认方式定义离散缺失值定义连续范围内的缺失值和离散缺失值,Back,录入数据-开放题的录入,数据录入时每行对应一个记录(case)、每列对应一个变量。开放题的录入:1、序号 2、姓名 3、出生年月日 mm/dd/YYYY,录入数据-单选题的录入,不含其它单选题,如:性别。1)男 2)女数据录入三

5、种方式:字符字符加值标签数值加值标签。便于后续分析,推荐采用。,含其它单选题,如:您的职业。1)工人 2)农民 3)教师 4)其他可通过设置两个变量来处理,第一个变量为单选题,若选择“其他”的纪录,则通过第二个开放型变量进行说明。,录入数据-多选题的录入,如:您通常获取新闻方式有。1)报纸 2)杂志 3)电视 4)收音机 5)网络 case 1:杂志、网络 case 2:报纸、电视、收音机,多选题两种录入方法多重二分法(multiple dichotomy method):每个选项作为一个只有两个取值(选为1、未选为0)的变量。该方法会出现很多数据为0的现象,录入数据工作量大。,多重分类法(m

6、ultiple category method):选项最多的记录有几个选项就设置几个变量。设上题最多有四种获取新闻的方式,在变量视图中:,在数据视图中:,适用于:选项较多、可用于需要排序的回答、常出现数据缺失的情况。多选题变量集的定义:Multiple response(多重响应)菜单:Table 模块,Back,数据的获取,用SPSS可获取的数据:读取SPSS格式的数据 读取Excel等格式的数据 读取文本数据(“分隔”和“固定宽度”)读取数据库格式数据(1)配置ODBC(2)在SPSS中通过ODBC和数据库进行连接,并读取数据,数据的获取-读取EXCEL数据,将数据文件个人工资.xls,读

7、入SPSS中,并保存,以备进一步数据整理和分析。注意以下问题:第一行是否是变量名 从哪张工作表(worksheet)中读取数据 读取数据的范围(如 D1:E6),与“复制+粘贴”不同:第一行可自动定义为变量名,软件会自动识别变量的属性。字符串原样再现(若采用“复制+粘贴”方法,则出现缺失值),但视为字符型变量。(注意:excel应用软件关闭,SPSS才能读取数据),数据的获取-读取文本格式数据,如何读取固定宽度的文本格式数据:以文件demo.txt为例。在此例中,我们读入年龄、婚否、收入等变量数据,可以用记事本打开文件进行观察数据排列形式,再在SPSS中读入相关数据。在软件上分六步实现(略)。

8、,数据的获取-读取数据库数据,SPSS通过菜单File-Open-Data可以直接打开16种外部数据文件格式,如文本文件、EXCEL、Lotus、dBase、SAS文件等。,其他数据文件格式,SPSS可以利用通用数据库ODBC接口读取数据。例:通过SPSS读取Access 2000数据库中数据northwind.mdb,把Access数据库中的如下数据表转化为SPSS文件:产品.sav;订单.Sav;订单明细.sav。,方法是:先设置ODBC数据源配置:文件打开数据库新建查询添加数据源选中MS Access Database配置选择 选中northwind.mdb确定(3次)读取数据:File

9、-open database-new query-选中配置好的文件northwind-下一步-将左边数据库拖到右边-下一步-完成,数据的保存,SPSS获得的数据可以保存为:SPSS格式的文件*.sav(最常见)。其他格式文件,如excel、dbase、sas等22种不同格式的文件。,Back,SPSS的数据整理,数据整理包括两个级别的整理:变量级数据整理:对变量进行操作,如计算新变量、变量编码等,这些功能主要集中在transform(转换)菜单上。文件级数据整理:对文件结构进行处理,如文件行列互换、结构变换、文件拆分、合并等。这些功能主要集中在data(数据)菜单上。,变量级数据整理,Comp

10、ute(计算)Rank Cases(个案排序/编秩)Recode(重新编码)Automatic Recode(自动重新编码)Visual Bander(可视化分段)Count(计数),变量级数据整理-新变量生成(Compute),利用算术符号和函数生成新变量(Compute),举例:销售总额=单价*数量*(1一折扣)(订单明细.sav)平均成绩=(语文成绩+数学成绩+英语成绩)/3(transfer.sav)计算英语成绩高于70分的平均成绩计算上海学生的平均成绩 注意:1)在英文输入状态下输入函数式 2)利用if按钮设定计算条件 3)字符串条件加“”号,如city=上海,姓名-姓+名,对数据雇

11、员.sav利用函数concat(姓氏,名字)生成新变量“姓名”,注意:1)在变量视图中调整姓氏和名字变量宽度(4位);2)生成新变量的种类改为字符串型。,变量级数据整理-新变量生成(Rank),Rank Cases(编秩)就是对记录按某个变量排序,并生成代表名次的新变量“R+原变量名”,举例:transfer.sav按英语成绩排名,分数最高的为第一名。注意以下问题:相同分数(ties)的名次处理:同小、同中、同大、不间断若按多个变量排序,只能按相同的升降方向排序,Date菜单中的Sort Cases过程也可对数据进行排序,Rank与Sort不同在于:Sort不会生成反映排名序列号的新变量Sor

12、t对多个变量排序时可采用升序、降序、混合序例1:个人工资模拟数据.xls,请按工资对个人排序,最高的放在第一行。如果两个人的工资相同,男性排在前。例2:个人工资模拟数据.xls,请在性别内按工资对个人进行降序排列。,变量级数据整理-新变量生成(Recode),将数值型变量转换为字符型,例:将成绩60-100分-记为及格 0-59分-记为不及格将字符型变量转换为数值型,例:及格-记为1 不及格-记为2将几个小类别合为一个类别。例:“A”+“B”-“优良”,“C”+“D”-“中等”“E”-“差”,变量级数据整理-新变量生成(visual bander),Recode过程可进行准确分组,visual

13、 bander 过程可进行有规律分组,如:等组距分组。例:按成绩分组90100为A,8090为B,70 80为C,60 70为D,60以下为E等比例分组 例:A级人数占总人数的25%B级占25%C级占25%,D级占25%按平均数和标准差作分割点,Back,文件级数据整理,Merge file(合并文件)Split file(记录拆分)Select cases(记录筛选)Weight cases(记录加权)Aggregate(数据汇总)Transpose(数据转置)Restructure(数据重新构造),文件级数据整理-合并文件(merge file),合并相同变量数据的不同个体-增加记录(sa

14、mple3.sav,sample4.sav)合并相同个体的不同变量数据-增加变量。注意应先排序(transfer.sav,transfer3.sav)用菜单可以一次合并两个文件,一个是SPSS格式,另一个可以用SPSS直接打开用Syntax可以合并多个文件,文件级数据整理-文件拆分(Split file),例如对文件transfer.sav按学生所在城市拆分四组。便于以后分组分析。拆分状态在窗口右下角显示”split on”,文件级数据整理-记录筛选(Select cases),将符合条件的数据筛选出来进行分析,相当于transform菜单某些功能中的if按钮筛选状态在窗口右下角显示”filt

15、er on”,文件级数据整理-记录加权(Weight cases),若各记录出现频数不同,则必须给出加权变量加权状态在窗口右下角显示”weight on”,文件级数据整理-数据分类汇总(aggregate),将记录组合并到单个摘要记录中,并创建新的分类汇总数据文件。基于一个或多个分组变量的值分类汇总记录。新数据文件包含每个组的记录。例如,可按省聚合县数据,并创建一个新的数据文件,其中省是分析单位。以transfer.sav 为例,统计各地语文平均成绩。,文件级数据整理-数据转置(transpose),创建一个新的数据文件,原文件中的行列被转置,使个案(行)成为变量,变量(列)成为个案。转置自动创建新的变量名称,并显示新的变量名称列表。自动创建包含原变量名称 case_lbl 的新字符串变量。,文件级数据整理-数据重新构造(restructure),第一种:一条记录变成多条记录第二种:多条记录变成一条记录第三种:n行*m列变成m行*n列(功能与transpose相同),

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号