SPSS的数据采集和整理.ppt_三一办公31ppt.com

资源描述

《SPSS的数据采集和整理.ppt》由会员分享，可在线阅读，更多相关《SPSS的数据采集和整理.ppt（44页珍藏版）》请在三一办公上搜索。

1、SPSS的数据采集和整理,本讲主要内容：SPSS数据采集数据格式与问卷题目类型数据录入数据获取SPSS数据整理变量级数据整理文件级数据整理,数据类型,SPSS统计分析要求的数据格式,问题的类型,单选题-3,5字符串型开放题-2数字型开放题-1,4,7多选题-6,问卷示例：1、调查序号。2、您的姓名。3、性别。1）男 2）女4、您的出生年月日。5、您的职业。1）工人 2）农民 3）教师 4）其他6、获取新闻的主要方式有。1）报纸 2）杂志 3）电视 4）收音机 5）网络7、每天收看新闻的小时数。,Back,数据的录入,数据编辑器包括两个视图：1.变量视图：定义变量10个属性2.数据视图：录入数据

2、,定义变量属性-变量名,变量名命名要求：变量名的第一个字符必须为字母，后面可跟任意字母、数字、句点或、#或$等符号；变量名不能以句点结尾；最后一个字符可以为下划线但应避免（可能会与分析过程中自动产生的变量造成冲突)；,12版之前变量名的长度一般不能超过8个字符；空格和特殊字符(如！、-、?、和*等)不能用于变量名；每个变量名必须保证是唯一的，不区分大小写；下面的关键词不能用作变量名：ALL NE EQ TO LE LT GE BY OR GT AND NOT WITH,定义变量属性-变量类型type,数字型数值型(Numeric):是默认的形式逗号型(Comma)：小数点前数据每三位数用逗点分

3、开小数点型(Dot)：小数点前数据每三位数用句点分开科学计数型(Scientific notation)美元型(Dollar),定制货币型(Custom currency)：SPSS只提供美元型变量作为现成的货币描述量。若为人民币型变量则必须进行定义。方法如下：进入data editor窗口-edit-option-currency-在prefix选项中输入￥等即可一次可定义5个不同的货币类型。日期格式型(Date)字符串型(String),定义变量属性-变量标签label,变量标签：对变量的含义解释,定义变量属性-值标签value,值标签：对变量值进行说明。例如对性别变量标注值标签:1=男

4、 2=女（若变量为数值型）或：m=男 f=女（若变量为字符串型）,定义变量属性-测量尺度measure,变量测量尺度：定类变量（Nominal）：名义变量定(/有)序变量(Ordinal)：有序变量定距和定比变量(Scale)：尺度变量,定义变量属性-缺失值missing,定义缺失值的类型：没有缺失值：默认方式定义离散缺失值定义连续范围内的缺失值和离散缺失值,Back,录入数据-开放题的录入,数据录入时每行对应一个记录（case）、每列对应一个变量。开放题的录入：1、序号 2、姓名 3、出生年月日 mm/dd/YYYY,录入数据-单选题的录入,不含其它单选题，如：性别。1）男 2）女数据录入三

5、种方式：字符字符加值标签数值加值标签。便于后续分析，推荐采用。,含其它单选题，如：您的职业。1）工人 2）农民 3）教师 4）其他可通过设置两个变量来处理，第一个变量为单选题，若选择“其他”的纪录，则通过第二个开放型变量进行说明。,录入数据-多选题的录入,如：您通常获取新闻方式有。1）报纸 2）杂志 3）电视 4）收音机 5）网络 case 1：杂志、网络 case 2：报纸、电视、收音机,多选题两种录入方法多重二分法(multiple dichotomy method)：每个选项作为一个只有两个取值（选为1、未选为0）的变量。该方法会出现很多数据为0的现象，录入数据工作量大。,多重分类法(m

6、ultiple category method)：选项最多的记录有几个选项就设置几个变量。设上题最多有四种获取新闻的方式，在变量视图中：,在数据视图中：,适用于：选项较多、可用于需要排序的回答、常出现数据缺失的情况。多选题变量集的定义：Multiple response（多重响应）菜单：Table 模块,Back,数据的获取,用SPSS可获取的数据:读取SPSS格式的数据读取Excel等格式的数据读取文本数据(“分隔”和“固定宽度”)读取数据库格式数据(1)配置ODBC(2)在SPSS中通过ODBC和数据库进行连接，并读取数据,数据的获取-读取EXCEL数据,将数据文件个人工资.xls，读

7、入SPSS中，并保存，以备进一步数据整理和分析。注意以下问题：第一行是否是变量名从哪张工作表（worksheet）中读取数据读取数据的范围（如 D1:E6）,与“复制+粘贴”不同：第一行可自动定义为变量名，软件会自动识别变量的属性。字符串原样再现（若采用“复制+粘贴”方法，则出现缺失值），但视为字符型变量。（注意：excel应用软件关闭，SPSS才能读取数据）,数据的获取-读取文本格式数据,如何读取固定宽度的文本格式数据：以文件demo.txt为例。在此例中，我们读入年龄、婚否、收入等变量数据，可以用记事本打开文件进行观察数据排列形式，再在SPSS中读入相关数据。在软件上分六步实现（略）。

8、,数据的获取-读取数据库数据,SPSS通过菜单File-Open-Data可以直接打开16种外部数据文件格式，如文本文件、EXCEL、Lotus、dBase、SAS文件等。,其他数据文件格式，SPSS可以利用通用数据库ODBC接口读取数据。例：通过SPSS读取Access 2000数据库中数据northwind.mdb，把Access数据库中的如下数据表转化为SPSS文件：产品.sav；订单.Sav；订单明细.sav。,方法是：先设置ODBC数据源配置：文件打开数据库新建查询添加数据源选中MS Access Database配置选择选中northwind.mdb确定（3次）读取数据：File

9、-open database-new query-选中配置好的文件northwind-下一步-将左边数据库拖到右边-下一步-完成,数据的保存,SPSS获得的数据可以保存为：SPSS格式的文件*.sav（最常见）。其他格式文件，如excel、dbase、sas等22种不同格式的文件。,Back,SPSS的数据整理,数据整理包括两个级别的整理：变量级数据整理：对变量进行操作，如计算新变量、变量编码等，这些功能主要集中在transform（转换）菜单上。文件级数据整理：对文件结构进行处理，如文件行列互换、结构变换、文件拆分、合并等。这些功能主要集中在data（数据）菜单上。,变量级数据整理,Comp

10、ute（计算）Rank Cases（个案排序/编秩）Recode（重新编码）Automatic Recode（自动重新编码）Visual Bander（可视化分段）Count（计数）,变量级数据整理-新变量生成(Compute),利用算术符号和函数生成新变量(Compute),举例:销售总额=单价*数量*(1一折扣)（订单明细.sav）平均成绩=(语文成绩+数学成绩+英语成绩)/3（transfer.sav）计算英语成绩高于70分的平均成绩计算上海学生的平均成绩注意:1)在英文输入状态下输入函数式 2)利用if按钮设定计算条件 3)字符串条件加“”号，如city=上海,姓名-姓+名，对数据雇

11、员.sav利用函数concat(姓氏，名字)生成新变量“姓名”，注意：1）在变量视图中调整姓氏和名字变量宽度（4位）;2）生成新变量的种类改为字符串型。,变量级数据整理-新变量生成(Rank),Rank Cases（编秩）就是对记录按某个变量排序，并生成代表名次的新变量“R+原变量名”,举例：transfer.sav按英语成绩排名，分数最高的为第一名。注意以下问题：相同分数（ties）的名次处理：同小、同中、同大、不间断若按多个变量排序，只能按相同的升降方向排序,Date菜单中的Sort Cases过程也可对数据进行排序，Rank与Sort不同在于：Sort不会生成反映排名序列号的新变量Sor

12、t对多个变量排序时可采用升序、降序、混合序例1：个人工资模拟数据.xls，请按工资对个人排序，最高的放在第一行。如果两个人的工资相同，男性排在前。例2：个人工资模拟数据.xls，请在性别内按工资对个人进行降序排列。,变量级数据整理-新变量生成(Recode),将数值型变量转换为字符型，例：将成绩60-100分-记为及格 0-59分-记为不及格将字符型变量转换为数值型，例：及格-记为1 不及格-记为2将几个小类别合为一个类别。例:“A”+“B”-“优良”，“C”+“D”-“中等”“E”-“差”,变量级数据整理-新变量生成(visual bander),Recode过程可进行准确分组，visual

13、 bander 过程可进行有规律分组，如：等组距分组。例：按成绩分组90100为A,8090为B,70 80为C,60 70为D,60以下为E等比例分组例:A级人数占总人数的25%B级占25%C级占25%,D级占25%按平均数和标准差作分割点,Back,文件级数据整理,Merge file（合并文件）Split file(记录拆分)Select cases(记录筛选)Weight cases(记录加权)Aggregate（数据汇总）Transpose（数据转置）Restructure（数据重新构造）,文件级数据整理-合并文件(merge file),合并相同变量数据的不同个体-增加记录(sa

14、mple3.sav,sample4.sav)合并相同个体的不同变量数据-增加变量。注意应先排序(transfer.sav,transfer3.sav)用菜单可以一次合并两个文件，一个是SPSS格式，另一个可以用SPSS直接打开用Syntax可以合并多个文件,文件级数据整理-文件拆分(Split file),例如对文件transfer.sav按学生所在城市拆分四组。便于以后分组分析。拆分状态在窗口右下角显示”split on”,文件级数据整理-记录筛选(Select cases),将符合条件的数据筛选出来进行分析，相当于transform菜单某些功能中的if按钮筛选状态在窗口右下角显示”filt

15、er on”,文件级数据整理-记录加权(Weight cases),若各记录出现频数不同，则必须给出加权变量加权状态在窗口右下角显示”weight on”,文件级数据整理-数据分类汇总（aggregate）,将记录组合并到单个摘要记录中，并创建新的分类汇总数据文件。基于一个或多个分组变量的值分类汇总记录。新数据文件包含每个组的记录。例如，可按省聚合县数据，并创建一个新的数据文件，其中省是分析单位。以transfer.sav 为例，统计各地语文平均成绩。,文件级数据整理-数据转置（transpose）,创建一个新的数据文件，原文件中的行列被转置，使个案（行）成为变量，变量（列）成为个案。转置自动创建新的变量名称，并显示新的变量名称列表。自动创建包含原变量名称 case_lbl 的新字符串变量。,文件级数据整理-数据重新构造（restructure）,第一种:一条记录变成多条记录第二种:多条记录变成一条记录第三种:n行*m列变成m行*n列（功能与transpose相同）,

展开阅读全文