《第三章-SPSS数据的预处理ppt课件.ppt》由会员分享,可在线阅读,更多相关《第三章-SPSS数据的预处理ppt课件.ppt(53页珍藏版)》请在三一办公上搜索。
1、第三章 SPSS数据的预处理,本章主要内容,1.数据文件的合并2.数据的排序3.数据的排秩4.变量计算5.数据选取6.变量重编码7.加权8.数据拆分,一、数据文件合并,合并数据文件是指将外部数据中的个案或变量合并到当前的数据文件中去。合并数据文件包括两种方式:从外部数据文件增加个案到当前数据文件中。纵向合并或称追加个案。从外部数据文件增加变量到当前数据文件中。横向合并。,纵 向 合 并,首先打开一个数据文件。按数据 合并文件 添加个案顺序逐一单击鼠标,打开:将个案添加到文件对话框,依据需要选择文件,然后进入添加个案对话框,选择相应的选项或做适当的修改即可。,纵 向 合 并,纵 向 合 并,纵向
2、合并,纵向合并,纵向合并需注意的问题,两个待合并数据文件的内容合并起来是要有实际意义的。为方便spss数据文件的纵向合并,在不同数据文件中数据含义相同的数据项最好取相同的变量名,其数据类型也最好相同。,横 向 合 并,横向合并有两种方式:从一个指定的外部数据文件中取得一个或几个变量的数据(包括变量名称)增加到 当前工作数据文件中,实际上相当于两个数据文件的横向合并。按关键变量合并,即要求两个数据文件必须有一个共同的关键变量,而且这两个文件中的关键变量还存在一定数量的相同值的个案。,横向合并的具体操作,首先打开一个数据文件。按数据 合并文件 增加变量顺序逐一单击鼠标,打开各对话框,依据需要选择相
3、应的选项或做适当的修改即可。,横向合并需注意的问题,两个数据文件至少有一个名称相同的变量,该变量是两个数据文件横向合并的依据,称为关键变量。例如:职工号、姓名等。为方便spss数据文件的横向合并,不同数据文件中数据含义不同的数据项,变量名应该不同。,二、数据的排序,首先在数据窗中建立或读入一个数据文件。按数据 排序个案顺序逐一单击鼠标键,打开个案排序对话框。依据需要进行选择,然后单击OK按纽即可。,数据的排序,在左边的源变量框中选择排序变量进入Sort by框。如果选择2个以上的变量,个案的排序结果与排序变量在Sort by框中的顺序有关。列于首位的为第一排序变量。,在Sort Order 栏
4、内选择排序方式升序与降序,三、数据的排秩,运用转换(Transform)命令实现。求得的秩在数据窗中建立一个新变量来保存。具体操作方法:按转换(Transform)个案排秩(Rank Cases)顺序逐一单击鼠标键,打开个案排秩对话框。依据需要进行选择,然后单击确定按纽即可。新生成的秩变量的名称以原变量名称前加字母“R”的形式出现在数据文件中。,变量值排秩,变量值排秩的选项说明,在Assign rank 1 to 栏中可选择秩的排列方式。如选择一个或多个分组变量进入By栏,系统将按By变量分组排秩。当所选择的变量具有相同值时称为Tie(结),其秩次的决定原则可以在Rank Cases:Ties
5、对话框中指定。在Rank Type中可以选择获得秩次的其他方法。Display summary Tables 复选项为默认选择,表示要在输出结果窗中显示新变量的名称、标签、秩类型等总结性信息。,四、变量计算,利用菜单“Transform”下的“Compute”命令实现数据的变换和计算利用菜单“Transform”下的“Compute”命令,可以完成以下工作:1.计算数值或字符型变量的值2.创建新的变量或取代已存在的变量,对于新的变量,依然可以定义3.可以利用已建立的函数进行变量的计算和转换,变量计算的作用,在原有数据的基础上,计算产生一些更丰富信息的新数据。例如:根据职工的基本工资、失业保险、
6、奖金等数据项,计算实际月收入。,创建新的变量对话框,创建新的变量,五、数据选取,目的:选择需要进行分析的个案方法:1.按指定条件选取(If condition is satisfied)2.随机选取(Random sample of cases)3.选取某一区域内的个案(Based on time or case range)4.通过过滤变量选取(Use filter variable),六、变量重编码,重编码的步骤及两种方式:(1)Into Same Variables;(2)Into Different Variables.,重编码的应用,定距层次的变量,希望输出频次分布表时,常常需要进行
7、分组,这时可以利用重编码。当采用量表来进行测量,而量表中变量取值有正反两种方向的设置,需要转化为同一方向时,常常需要重编码。,第一种方式重编码,If Case 对话框,用于设置变量重编码的条件,Old and New Values对话框,设置旧变量转变为新变量的对应方式,第二种方式重编码,第二种重编码方式需要在Output Values中定义新变量的变量名与变量标签。第二种重编码方式中 If 和 Old and New Values按钮展开的对话框形式与结构、内容是一样的。,七、对变量加权处理,在计算的过程中需要利用变量对数据进行加权处理时采用。加权处理的具体方法:按DataWeight Ca
8、ses,打开Weight Cases对话框,依据需要进行适当的选择即可。,对变量进行加权处理,对个案加权处理,在选择加权变量时应注意:加权变量中含有零、负数或缺省值的个案将被排除在分析之外。分数值有效。一旦对数据进行了加权处理,那么在以后的分析中加权处理一直有效,直到关闭加权处理过程或选择其他的加权变量进行加权处理。,八、数据拆分,在进行数据处理时经常要对数据文件中的变量进行分组分析,如分性别的平均分数。进行分析之前必须对 数据文件进行拆分。拆分分件并不是将一个数据文件分为两个或几个独立的数据文件,而是在同一个数据文件中按某个条件分组。这种拆分在以后的运算中一直有效直到取消或更改拆分变量。,拆分数据文件的具体操作,读取一个数据文件。按Data Split Files顺序逐一单击鼠标,打开Split Files对话框。根据对数据的具体需要选择相应的选项。按Ok完成。,拆分数据文件,上机作业3,要求能对数据进行各种处理:1.掌握数据的排序与排秩;2.掌握数据文件的拆分与合并;3.掌握数据的重编码与计算变换;4.掌握数据的选取与加权。,