数据管理(TransformData).ppt

上传人:牧羊曲112 文档编号:5985983 上传时间:2023-09-11 格式:PPT 页数:22 大小:213.50KB
返回 下载 相关 举报
数据管理(TransformData).ppt_第1页
第1页 / 共22页
数据管理(TransformData).ppt_第2页
第2页 / 共22页
数据管理(TransformData).ppt_第3页
第3页 / 共22页
数据管理(TransformData).ppt_第4页
第4页 / 共22页
数据管理(TransformData).ppt_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《数据管理(TransformData).ppt》由会员分享,可在线阅读,更多相关《数据管理(TransformData).ppt(22页珍藏版)》请在三一办公上搜索。

1、Chap3 数据管理(Transform&Data),SPSS对话框元素介绍Transform菜单详解Data菜单详解Transform/Data菜单命令高级应用技巧,3.1 SPSS对话框元素介绍,一级对话框元素介绍二级对话框元素介绍对话框常用操作技巧,3.1.1 一级对话框元素介绍,候选变量列表框:显示格式为“标签变量名”;选入变量列表框:Test Variable 框;变量移动按钮:会转向;五个标准按钮:总在一起;其他按钮:如Options 和 Grouping Variable等;,3.1.2 二级对话框元素介绍,单选框:显示格式为“标签变量名”;复选框:Test Variable 框

2、;下拉列表框:会转向;文本框:总在一起;,3.1.3 对话框常用操作技巧,同时选入多个变量:1.Control:选中多个不连续变量;2.Shift或拖动:选中多个连续变量 善于使用无处不在的帮助:1.对话框界面中的帮助;2.单击右键,选“Whats this?”在操作对话框的同时浏览数据:设定对话框参数时参考原始数据,可在结果窗口中 调用分析对话框。,3.2 Transform菜单详解,Compute 过程Count 过程Recode 过程Categorize Variables 过程Rank Cases 过程Transform 菜单中的其他命令,3.2.1 Compute 过程,用途:用于对

3、目标变量赋值;目标变量:可以是已有变量或新变量,需确认;目标变量的赋值:常数或从已有变量或系统函数(70余种)计算而来的值;操作记录集:所有记录或满足某一条件的记录;,3.2.2 Count 过程,用途:用于标示某个值或某些值在某个变量的取值中是否出现 Target Variable:用于指定记录变量值是否出现的变量名;注意:当需要计算同时满足两个变量取值条件的记录数有多少时,直接利用对话框会得出完全错误的结果,需对对话框生成的程序加以修改.,3.2.3 Recode 过程,用途(编码):用于从原变量值按照某种一一对应的关系生成新变量值(码字);Output Variable:可以是原变量或生

4、成一个新变量;Automatic Recode 与 Recode:前者的码字为正整数,后者的码字用户可以根据实际需要定义;,3.2.4 Categorize Variables 过程,用途:用于将连续型变量自动按要求分成等间距的几组;Number of Categories:输入变量的等级数,默认4;,3.2.5 Rank Cases 过程,用途:用于按某(些)变量的大小将各个记录排序;适用情况:复杂的非参数检验方法无法直接用对话框来完成,需要先计算 秩次在进行分析;Rank Types:1.Rank普通排序(系统默认),新变量的值就是秩;2.Fractional rank as%累计百分数排

5、序;3.Savage score以指数分布为基础的原始分排序;4.Sum of Case weights 以分组例数之和的权重排序;5.Fractional rank以秩变量除以分组例数之和排序;6.Ntile先给定一个大于1 的整数,系统按照此数的范围确定秩。Ties:两个或两个以上的数据相等时的处理方式:对应秩的Mean平均 值、Low最小值和high最大值。,3.2.6 Transform菜单中的其他命令,Random Number seed:用于设定伪随机函数的随机种子,默认情况下随机种子随着时 间在不停改变,计算机计算的随机数值无法重复,在临床的情 况是不符合要求的;也可指定一个初始

6、种子,可重现;对真随 机函数没有任何影响;Creat Time Series:用于自动生成时间序列变量,专业,时间序列模型;Replace Missing Value:用于时间序列模型数据的预处理,当序列中存在缺失值时采用 适当的方法进行填充,并将结果存入一个新变量;,3.3 Data菜单详解,Sort Cases 过程Transpose 过程Restructure 过程Merge File 过程Aggregate 过程Split File 过程Select 过程Weight Cases 过程Data中的其他命令,3.4 Transform/Data菜单命令高级应用技巧,二项分布/Poisso

7、n分布累计概率的计算抽奖问题随机分配/抽样问题从原始数据生成简易频数表按字符型变量取值筛选记录,Data View界面,菜单功能简介,File:文件操作。Edit:文件编辑。View:视图编辑。Data:数据操作。Transform:数据转换。Analyze:统计分析方法。Graphs:图形编辑。Utilities:实用程序。Windows:窗口控制。Help:帮助。,File菜单功能,新建数据文件打开其它格式数据文件 1.直接打开:File Open Data;2.使用数据库查询打开:File Open Database New Query,目前用处不是很大;3.使用文本导入向导读入文本文件

8、:File Read Text Data,6步;保存数据文件(Save和Save as)Display Data Info 显示数据信息,如建立时间、标签设置、记录数、变量设置等。Apply Data Dictionary 可以直接在新数据集中套用以前定义好的变量设置(格式、标签等,不包括数据类型)Cache Data 如果从远程用SQL调用数据库,可以将数据全部读入暂存盘,建立数据缓冲区,加快数据 处理速度,对处理本机数据效果不明显。Print和Print Preview(SPSS 10.0)Switch Server 主要用于使用SPSS服务器(SPSS Server)的客户端计算机,当机

9、器需要从一台Server切换 到另一台Server,或和Server结束联络时使用。Stop Processor 停止执行当前的SPSS命令。,Edit菜单功能,Undo:取消前一次操作Cut:剪切选定的数据、文本、图形等Copy:拷贝选定的数据、文本、图形等;Paste:将剪贴版内的数据粘贴到选定的区域;Clear:清除选定的数据、文本、图形等Find:用于查找特定的数据;Options 用于定制SPSS中的各种数据格式及一些界面特征。一般使用其缺省设定即可。1)Genaral用于设置一些常规性选项,需要修改的内容如下:VaribaleLists:选中Alphabetica 即在对话框中变量

10、按字母顺序 排列;Outputtypeat start-up:请根据所用计算机的性能自行设定。2)Viewer 用于设置结果浏览窗口的外观,可修改如下:File Font:魏碑(或黑体),14号,加粗,红色;Text Output Font:宋体(该字体可尽量保证中英文混排时列对齐),12 号,兰色。,Data数据功能,定义和编辑变量、观测量的命令 1.Define Variable Properties:用于定义变量属性;2.Copy Data Properties:由外部文件和工作文件拷贝数据变量和属性;3.Define Dates:定义或编辑日期变量格式;4.Insert Variabl

11、e:在数据编辑窗口插入一个变量;5.Insert Case:在数据编辑窗口插入一个观测量;6.Goto Case:光标跳转到某一指定观测量。变量数据变换的命令 7.Sort Cases:对观测量进行排序;8.Transpose:对观测量进行转置;9.Restructure:对现有的观测量进行重新构造,形成新格式的数据文件;10.Merge File:把外部文件数据合并到工作文件中;11.Aggregate:对数据进行分类或不分类汇总,产生新文件或代替工作文件。12.Identify Duplicate Cases:标识重复观测量;13.Orthogonal Design:进行正交设计。观察量数

12、据整理的命令 14.Split File:拆分数据文件的观测量,观测量进行条件分组;15.Select Cases:选择观测量;16.Weight Cases:对观测量进行加权处理。,Transform变换与转换功能,通过基本变量创建各种新变量 1.Compute:计算产生新变量,SPSS提供了10类100多个函数,通过 该菜单可以用表达式产生一个新变量;2.Random Number Seed:创建随机数种子;3.Create Times Series:创建时间序列变量;创建各种参数变量 4.Count:创建一个计数变量,用于统计计数;5.Recode:对变量值重新编码;6.Rank Cas

13、es:为观测量排秩,求得的秩在数据窗口作为一个新变 量保存;7.Categorize Variables:建立新的分组变量,使数据分成若干个组;8.Automatic Recode:对变量值自动编码,产生一个连续的变量值编 码;9.Replace Missing Values:创建替代缺失值变量;运行其它自定义的转输程序 10.Run Pending Transform:运行其它转换程序。,Utilities菜单功能,Variables 显示各个变量的基本信息。File Info 在结果窗口中给出当前数据文件全部变量的基本信息,可以输出到结果文件中。Define Sets 和 Use Sets

14、 联合使用,用于将某些变量定义为一个集合(Sets),便于分析时调用。Creste/Edit Autoscript 和Run Script 用于建立编辑和运行 VBs 脚本语言程序,其中前者只在结果窗口的相应菜单中 存在,比较专业。Designate Window 如只存在于结果窗口的相应菜单中,并且只有同时存在两个以上的结果窗口时 才可用,用于指定系统输出分析结果时所用的结果窗口(SPSS默认当前/最后一 个当前结果输出窗口)Menu Editor 主用于编辑SPSS的菜单结构,属于玩具一类的菜单。,数据编辑窗口操作技巧,快速查找异常值、极端值 选中变量,单击右键,选择Sort Ascend

15、ing或 Sort Descending.冻结数据表中的列 变量数较多时使用,选中最左侧的第一(若干个)个变量,单击右键,选择Pin Selected Columns,该列就会被冻结在左侧,无论怎么拖动数据表,总可以看到它的值,结果可存储 到文件里,一直有效(Undo Pinning)。快速改变变量次序 选中变量名直接拖动:若单个变量或连续多个变量均有效;如果选择不连续的几个变量拖动 只对居中的一个有效。也可在变量视图中进行。充分利用变量值标签 View Value Labels,快速排序发现缺失值和无标签的数值。快速重复调用对话框 弹出最近使用的一些过程名。记录的快速定位 1.Data go to case,快速排序发现缺失值和无标签的数值。2.在当前列中,使用find寻找符合条件的记录(默认不区分大小写)。从其他窗口快速切换回数据窗口 工具栏中的工具图标。快速定义成批变量 键入变量名后使用方向键,直到将所有的变量名定义好后再定义变量的属性等内容。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号