数据管理(TransformData).ppt_三一办公31ppt.com

资源描述

《数据管理(TransformData).ppt》由会员分享，可在线阅读，更多相关《数据管理(TransformData).ppt（22页珍藏版）》请在三一办公上搜索。

1、Chap3 数据管理（Transform&Data),SPSS对话框元素介绍Transform菜单详解Data菜单详解Transform/Data菜单命令高级应用技巧,3.1 SPSS对话框元素介绍,一级对话框元素介绍二级对话框元素介绍对话框常用操作技巧,3.1.1 一级对话框元素介绍,候选变量列表框：显示格式为“标签变量名”；选入变量列表框：Test Variable 框；变量移动按钮：会转向；五个标准按钮：总在一起；其他按钮：如Options 和 Grouping Variable等；,3.1.2 二级对话框元素介绍,单选框：显示格式为“标签变量名”；复选框：Test Variable 框

2、；下拉列表框：会转向；文本框：总在一起；,3.1.3 对话框常用操作技巧,同时选入多个变量：1.Control：选中多个不连续变量；2.Shift或拖动：选中多个连续变量善于使用无处不在的帮助：1.对话框界面中的帮助；2.单击右键，选“Whats this?”在操作对话框的同时浏览数据:设定对话框参数时参考原始数据，可在结果窗口中调用分析对话框。,3.2 Transform菜单详解,Compute 过程Count 过程Recode 过程Categorize Variables 过程Rank Cases 过程Transform 菜单中的其他命令,3.2.1 Compute 过程,用途：用于对

3、目标变量赋值；目标变量：可以是已有变量或新变量，需确认；目标变量的赋值：常数或从已有变量或系统函数（70余种）计算而来的值；操作记录集：所有记录或满足某一条件的记录；,3.2.2 Count 过程,用途：用于标示某个值或某些值在某个变量的取值中是否出现 Target Variable：用于指定记录变量值是否出现的变量名；注意：当需要计算同时满足两个变量取值条件的记录数有多少时，直接利用对话框会得出完全错误的结果，需对对话框生成的程序加以修改.,3.2.3 Recode 过程,用途（编码）：用于从原变量值按照某种一一对应的关系生成新变量值（码字）；Output Variable：可以是原变量或生

4、成一个新变量；Automatic Recode 与 Recode：前者的码字为正整数，后者的码字用户可以根据实际需要定义；,3.2.4 Categorize Variables 过程,用途：用于将连续型变量自动按要求分成等间距的几组；Number of Categories：输入变量的等级数，默认4；,3.2.5 Rank Cases 过程,用途：用于按某（些）变量的大小将各个记录排序；适用情况：复杂的非参数检验方法无法直接用对话框来完成，需要先计算秩次在进行分析；Rank Types：1.Rank普通排序（系统默认）,新变量的值就是秩；2.Fractional rank as%累计百分数排

5、序；3.Savage score以指数分布为基础的原始分排序；4.Sum of Case weights 以分组例数之和的权重排序；5.Fractional rank以秩变量除以分组例数之和排序；6.Ntile先给定一个大于1 的整数，系统按照此数的范围确定秩。Ties：两个或两个以上的数据相等时的处理方式：对应秩的Mean平均值、Low最小值和high最大值。,3.2.6 Transform菜单中的其他命令,Random Number seed：用于设定伪随机函数的随机种子，默认情况下随机种子随着时间在不停改变，计算机计算的随机数值无法重复，在临床的情况是不符合要求的；也可指定一个初始

6、种子，可重现；对真随机函数没有任何影响；Creat Time Series：用于自动生成时间序列变量，专业，时间序列模型；Replace Missing Value：用于时间序列模型数据的预处理，当序列中存在缺失值时采用适当的方法进行填充，并将结果存入一个新变量；,3.3 Data菜单详解,Sort Cases 过程Transpose 过程Restructure 过程Merge File 过程Aggregate 过程Split File 过程Select 过程Weight Cases 过程Data中的其他命令,3.4 Transform/Data菜单命令高级应用技巧,二项分布/Poisso

7、n分布累计概率的计算抽奖问题随机分配/抽样问题从原始数据生成简易频数表按字符型变量取值筛选记录,Data View界面,菜单功能简介,File：文件操作。Edit：文件编辑。View：视图编辑。Data：数据操作。Transform：数据转换。Analyze：统计分析方法。Graphs：图形编辑。Utilities：实用程序。Windows：窗口控制。Help：帮助。,File菜单功能,新建数据文件打开其它格式数据文件 1.直接打开：File Open Data；2.使用数据库查询打开：File Open Database New Query，目前用处不是很大；3.使用文本导入向导读入文本文件

8、：File Read Text Data，6步；保存数据文件（Save和Save as）Display Data Info 显示数据信息，如建立时间、标签设置、记录数、变量设置等。Apply Data Dictionary 可以直接在新数据集中套用以前定义好的变量设置（格式、标签等，不包括数据类型）Cache Data 如果从远程用SQL调用数据库，可以将数据全部读入暂存盘，建立数据缓冲区，加快数据处理速度，对处理本机数据效果不明显。Print和Print Preview（SPSS 10.0）Switch Server 主要用于使用SPSS服务器（SPSS Server）的客户端计算机，当机

9、器需要从一台Server切换到另一台Server，或和Server结束联络时使用。Stop Processor 停止执行当前的SPSS命令。,Edit菜单功能,Undo：取消前一次操作Cut：剪切选定的数据、文本、图形等Copy：拷贝选定的数据、文本、图形等；Paste：将剪贴版内的数据粘贴到选定的区域；Clear：清除选定的数据、文本、图形等Find：用于查找特定的数据；Options 用于定制SPSS中的各种数据格式及一些界面特征。一般使用其缺省设定即可。1）Genaral用于设置一些常规性选项，需要修改的内容如下：VaribaleLists：选中Alphabetica 即在对话框中变量

10、按字母顺序排列；Outputtypeat start-up：请根据所用计算机的性能自行设定。2）Viewer 用于设置结果浏览窗口的外观，可修改如下：File Font：魏碑（或黑体），14号，加粗，红色；Text Output Font：宋体（该字体可尽量保证中英文混排时列对齐），12 号，兰色。,Data数据功能,定义和编辑变量、观测量的命令 1.Define Variable Properties：用于定义变量属性；2.Copy Data Properties：由外部文件和工作文件拷贝数据变量和属性；3.Define Dates：定义或编辑日期变量格式；4.Insert Variabl

11、e：在数据编辑窗口插入一个变量；5.Insert Case：在数据编辑窗口插入一个观测量；6.Goto Case：光标跳转到某一指定观测量。变量数据变换的命令 7.Sort Cases：对观测量进行排序；8.Transpose：对观测量进行转置；9.Restructure：对现有的观测量进行重新构造，形成新格式的数据文件；10.Merge File：把外部文件数据合并到工作文件中；11.Aggregate：对数据进行分类或不分类汇总，产生新文件或代替工作文件。12.Identify Duplicate Cases：标识重复观测量；13.Orthogonal Design：进行正交设计。观察量数

12、据整理的命令 14.Split File：拆分数据文件的观测量，观测量进行条件分组；15.Select Cases：选择观测量；16.Weight Cases：对观测量进行加权处理。,Transform变换与转换功能,通过基本变量创建各种新变量 1.Compute：计算产生新变量，SPSS提供了10类100多个函数，通过该菜单可以用表达式产生一个新变量；2.Random Number Seed：创建随机数种子；3.Create Times Series：创建时间序列变量；创建各种参数变量 4.Count：创建一个计数变量，用于统计计数；5.Recode：对变量值重新编码；6.Rank Cas

13、es：为观测量排秩，求得的秩在数据窗口作为一个新变量保存；7.Categorize Variables：建立新的分组变量，使数据分成若干个组；8.Automatic Recode：对变量值自动编码，产生一个连续的变量值编码；9.Replace Missing Values：创建替代缺失值变量；运行其它自定义的转输程序 10.Run Pending Transform：运行其它转换程序。,Utilities菜单功能,Variables 显示各个变量的基本信息。File Info 在结果窗口中给出当前数据文件全部变量的基本信息，可以输出到结果文件中。Define Sets 和 Use Sets

14、联合使用，用于将某些变量定义为一个集合（Sets)，便于分析时调用。Creste/Edit Autoscript 和Run Script 用于建立编辑和运行 VBs 脚本语言程序，其中前者只在结果窗口的相应菜单中存在，比较专业。Designate Window 如只存在于结果窗口的相应菜单中，并且只有同时存在两个以上的结果窗口时才可用，用于指定系统输出分析结果时所用的结果窗口（SPSS默认当前/最后一个当前结果输出窗口）Menu Editor 主用于编辑SPSS的菜单结构，属于玩具一类的菜单。,数据编辑窗口操作技巧,快速查找异常值、极端值选中变量，单击右键，选择Sort Ascend

15、ing或 Sort Descending.冻结数据表中的列变量数较多时使用，选中最左侧的第一（若干个）个变量，单击右键，选择Pin Selected Columns，该列就会被冻结在左侧，无论怎么拖动数据表，总可以看到它的值，结果可存储到文件里，一直有效（Undo Pinning）。快速改变变量次序选中变量名直接拖动：若单个变量或连续多个变量均有效；如果选择不连续的几个变量拖动只对居中的一个有效。也可在变量视图中进行。充分利用变量值标签 View Value Labels，快速排序发现缺失值和无标签的数值。快速重复调用对话框弹出最近使用的一些过程名。记录的快速定位 1.Data go to case，快速排序发现缺失值和无标签的数值。2.在当前列中，使用find寻找符合条件的记录（默认不区分大小写）。从其他窗口快速切换回数据窗口工具栏中的工具图标。快速定义成批变量键入变量名后使用方向键，直到将所有的变量名定义好后再定义变量的属性等内容。,

展开阅读全文