《系统教程.ppt》由会员分享,可在线阅读,更多相关《系统教程.ppt(223页珍藏版)》请在三一办公上搜索。
1、1,SPSS系统教程,2,第一节 SPSS简介,SPSS的含义SPSS for WINDOWS的特点SPSS for WINDOWS的启动与退出SPSS for WINDOWS系统运行方式SPSS for WINDOWS窗口类型SPSS for WINDOWS系统参数设置,3,一、SPSS的含义,SPSS是软件英文名称的首字母缩写。原意为Statistical Package for the Social Sciences,即“社会科学统计软件包”。SPSS公司于2000年正式将英文全称更改为Statistical Product and Service Solutions,意为“统计产品与服
2、务解决方案”。我们现在讲授的主要是SPSS for Windows 11.0版。,4,二、SPSS for Windows11.0的特点,操作界面极为友好,易于学习,易于使用,是非专业统计人员的首选统计软件。无需花费大量时间记忆大量命令、过程、选择项等。只要粗通统计分析原理,就能得到统计分析的结果。可以根据计算机的设备来选择安装,灵活方便。能非常方便地与其他软件的数据进行转换。分析方法丰富,图表功能强大,输出结果美观漂亮。,5,三、SPSS的启动与退出,SPSS的启动使用开始菜单启动SPSS双击SPSS图标启动SPSSSPSS的退出使用FILE菜单中的“EXIT SPSS”菜单项退出SPSS单
3、击数据编辑窗右上角“x”的退出SPSS,6,进入SPSS后显示的文件对话框,在数据窗口输入数据选项,运行一个已存在的文件选项,打开一个已存在的数据源程序,使用数据库向导来创造一个新的文件选项,打开一个其它类型的文件,以浏览运行操作指导,7,Spss11.0的界面,数据窗口,变量定义窗口,8,主界面的10个下拉菜单,文件(File);编辑(Edit);视图(View);数据(Data);转换(Transform);统计分析(Analyze);作图(Graphs);工具(Utilities);窗口转换(Windows);帮助(Help),9,四、SPSS系统的运行方式,SPSS系统运行的三种方式:
4、完全窗口菜单运行管理方式程序运行管理方式混合运行管理方式,10,完全窗口菜单运行管理方式,完全窗口菜单运行管理方式主要在数据编辑窗口和输出观察窗口中进行操作。运行方式操作简便、直观,特别适合于初学者,也是本门课程讲授的主要方式。缺点:对话框中包括的是基本参数和基本统计量的选择项,对于某些专业人员来说,可能不能充分满足需要。,11,程序运行管理方式,程序运行管理方式是在语句窗口(Syntax)中直接运行编写好的程序的一种方式。分析结果仍然是显示在输出观察窗中。主要用于习惯使用 程序的用户(SPSS最初是使用程序来进行统计分析的)。,12,混合运行管理方式,混合运行方式是以上两种方法的结合方式。操
5、作程序:首先在数据窗中输入数据或利用主菜单中的(File)菜单项打开已经存在的数据文件,然后利用对话框选择分析过程和分析参数。选择后不马上执行,而是用Paste将选择的过程与参数变换成相应的命令语句。在语句窗口中可以进行修改,然后再将程序提交系统执行。,13,五、SPSS窗口类型,数据编辑窗口(Newdata)输出窗口(Output1)语句窗口(Syntax)统计图表编辑窗口(Chart)帮助窗口(Help),14,数据编辑窗口(Newdata),数据编辑窗口是一个可扩展的二维表格,用户可在该窗口中建立或编辑数据文件。其主要功能有:定义变量属性;录入数据;修改变量属性;移动记录指针;插入记录;
6、插入新的变量等。在一个SPSS运行期间不能同时打开两个以上的数据编辑窗口。,15,输出窗口(Output1),输出窗口是一个文本窗口,其功能是用来显示系统处理的输出结果或系统运行过程中所发生的错误信息。在一个SPSS运行期间可以同时打开两个或两个以上的输出窗口。其中只有一个为主输出窗口。,16,语句窗口(Syntax),语句窗口可以用来粘贴SPSS过程的命令语句以及各选项对应的子命令语句,也可以用来手工编辑命令语句。然后将这些命令提交给系统进行运行。在一个SPSS运行期间可以同时打开两个或两个以上的语句窗口。其中只有一个为主语句窗口。,17,统计图表编辑窗口,18,帮助窗口(Help),19,
7、六、SPSS系统参数设置,系统初始状态和系统默认值的设置是通过options选择对话框完成的。具体操作是通过打开Edit菜单中的options打开系统参数设置对话框。参数与状态的设置生效的时间不同,有的在确认后立即生效,有的要在下一次启动spss系统时才生效。,20,系统参数设置基本操作,21,Spss11.0中系统参数的设置,22,系统参数的设置的主要项目,通用参数的设置(General)观察窗口参数设置(Viewer)草稿窗口参数设置(Draft Viewer)标签输出设置(Output Labels)统计图形参数设置(Charts)交互图形窗口参数设置(Interactive)要点表参数
8、设置(Pivot Tables)数据功能卡设置(Data)数值型变量自定义格式设置(Currency)稿本窗口参数设置(Scripts),23,通用参数的设置项目,设置日志文件设置内存工作区的大小启动spss 时语句窗口状态的设置测度系统参数设置设置显示变量表顺序的方式文件表中文件数的设置启动时输出窗口类型的设置输出通告设置临时文件路径设置,24,通用参数的设置,日志文件:在日志文件中记录 系统 执行语句将每次运行的语句 记录 在前次运行语 句之后,并存入日 志文件将每次存入日志文 件时覆盖前次所存,设定内存测度单位选择语句窗口状态设定,声音设置:无声;默认声;自选声音文件,启动时输出窗类型:
9、产生交互式要点图和统计图输出文本格式要点图和统计图,变量显示方式顺序变量标签显示在前变量表中只显变量名变量名按字母顺序 按数据文件中变量类 型顺序,文件表中文件数设定系统使用过的文件数设定文件暂存处输出声明设置产生新结果时屏幕显 示导航器产生新结果时屏幕显 示新输出信息,25,观察窗口参数设置,主要项目:初始输出状态设置输出文本的字体、字号设置文本输出页面设置文本输出字型、字号设置与颜色,26,观察窗口参数设置,初始输入状态设置,文本标题字体和大小选择,文本输出字型、字号、颜色设置,文本输出页面设置,27,草稿观察窗口参数设置,主要项目:Display Output Items显示输出项的设置
10、。Page Breaks Between分页位置设置。在Front栏中设置使用在新的输出中的字体。Tabular Output平面表格输出栏,控制将要点表转换成平面表,即文本输出。Text Output文本输出栏,控制文本输出页的尺寸。,28,草稿观察窗口参数设置,日志中是否显示命令显示警告显示说明信息显示标题显示统计图形显示文本输出显示运行日志显示表格输出,分页设置在每个程序之间分页在每个输出之间插入一个分割符,字体设置,列表输出指定列宽和列分割 符形式使用空格为分割符.重复占多个页面表的 标题单元格周围显示格线输出表时每栏均为 最大列宽和标签长度在character栏内设定 列宽和标签最大
11、宽度;在cell栏指定行分割 符和列分割符.,标准页宽,每行80字符;132字符;自定义字符数标准页长,每页59行;尽可能的页长;自定义页长,29,标签输出设置,主要项目:在Outline Labeling结果标签栏中,设置输出图形时是否使用标签。在Pivot Table Labeling要点表格标签栏中,设置输出表格时是否使用标签。,30,标签输出设置,用于设定在输出图形时是否使用标签控制新的要点表中的变量名和描述性变量标签的输出。Labels:使用变量标签来标识每个变量。Names使用变量名来标识每个变量。Names and labels:使用 变量名和变量标签来标识每个变量。控制新的要点
12、表中的变量名和描述性变量标签的输出。Labels使用变量标签值来标识每个变量。Values使用变量值来标 识每个变量。LabelsandValues使用 变量值和变量标签值来标识每个变量。,要点表标签栏:用于设定在输出图形时是否使用标签控制在新的要点表中的变量名和描述性的变量标签值的输出。Labels:使用变量标签来标识每个变量。Names使用变量名来标识每个变量。Names and labels:使用 变量名和变量标签来标识每个变量。,控制新的要点表中的数据值和描述性的变量标签值的输出。Labels使用变量标签值来标识每个变量。Values使用变量值来标识每个变量。Labels and Va
13、lues使用 变量值和变量标签值来标识每个变量。,31,统计图形参数设置,主要项目:图形模板栏 Chart Template图形的宽与高比设置参数框 Chart Aspect图形中文字字体设置栏 Font图形填充和线条样式栏 Fill Patterns and Line Styles图形变框栏 Frame,32,统计图形参数设置,图形模板栏新的图形属性采用本对话框之中设置使用一个图形模板来确定图形属性,图形宽高设置栏:可输入宽高比值,框架栏为整个图形画一个框,包括标题和图例为输出的图形部分画出边框,单元格栏在线上标志刻度在线上标志分类,当前设置字体选择图形填充和线条样式使用14种颜色调色板,后
14、根据需要给颜色增加样式使用样式来代替颜色,33,交互图形窗口参数设置,主要项目:ChartLook交互图形外观样式栏Data Saved with Chart栏,控制与交互图形同时保存的信息。Print Resolution 栏,控制交互图形打印的精度。Measurement System栏,设置交互图形的度量系统。Reading Pre-8.0 Data Files 栏,读取8.0以前版本的数据文件选择项。,34,交互图形窗口参数设置,图形外观样式栏可单击Browse选择样式目录,图形数据存储栏当生成图表的数据文件与图表分开时,控制信息与交互图形一起保存只保存综合数据,打印精度栏,测度单元栏
15、,读取8.0前版本的数据文件栏可对数值型变量描述最小值以便将数据分类或指明刻度。,35,要点表参数设置,主要项目:Table Look 表格外观样式栏,可选择新表格的表格样式。Set Table Look Directory 按钮允许改变系统默认的Table Look目录。Adjust Column Width for 控制要点表列宽的自动调整栏。Default Edit Mode 设置默认的编辑表格模式。,36,要点表参数设置,表格外观栏选择系统提供的表格输出时的外观样式,调整要点表列宽栏列宽调整为标签列宽列宽调整为标签列宽和数据值列宽中较大的一个。,默认编辑模式栏Edit all tabl
16、es in viewer:控制在观察窗口中的要点表或一个单独窗口的激活Edit only small tables in viewer:在观察窗口仅能编辑小的要点表Edit small and medium tables in viewer:在观察窗口仅能编辑小的或中等的要点表Edit all but very large in viewer:在观察窗口不能编辑非常大的要点表Open all tables in a separate windows:在一个单独窗口打开表,样本栏预览Table Look中选定的样式,37,数据功能卡设置,主要项目:Transformation and Merge
17、 Options 选择数据转换和合并栏.Display Format for New Numeric Variables 新数值变量指定系统默认的显示宽度和小数位数。Set Century Range for 2-Digit Years栏,对日期型数据中的年份指定用两位数字输入和显示。,38,数据功能卡设置,设置两位年表示法变动范围自动选择自定义,为新数值型变量指定格式栏宽度小数点,数据转换与合并栏立刻执行要求的转换同时读取数据文件在遇到命令时才执行转换和合并,39,数值型变量自定义格式的设置,主要项目:Custom Output Formats用户定义输出格式栏All Values设置数值的
18、首尾字符栏Negative Value设置负数的首尾字符栏Decimal Separator设置小数点符号栏,40,数值型变量自定义格式的设置,自定义输出格式,设置首尾字符栏在此框输入一个字符,此字符将成为在所有值前都显示的前缀。在此框输入的值成为在所有值后都显示的后缀,设置负数的首尾字符栏在此框内输入在所有负值前都显示的前缀在此框内输入的值成为在所有负值后都显示的后缀,输出样本栏显示变量格式的预览,小数点分割符设置栏采用圆点作小数点采用逗号作小数点,41,稿本窗口参数设置,主要项目:Global Procedures 全局过程栏Autoscripts 自动稿本栏,自动稿本文件是稿本子程序的组
19、合,在每次运行建立某一输出对象类型的过程时都要自动运行这些稿本子程序。Autoscript subroutine status矩形框中包含当前所有自动稿本文件的所有子程序。,42,全局过程栏,自动脚本栏,稿本窗口参数设置,43,第二节 SPSS数据文件的建立,44,本讲主要内容,1、进入spss前的准备工作 资料的审查、数据编码、资料的登录、制定分析计划等等。2、Spss运行的基本程序与使用方法 录入、定义、保存、分析,45,数据资料的形式:封闭性问卷资料与开放性问卷资料。不同的资料形式均要求对资料进行审查,但在编码时有不同的要求。,一、进入SPSS之前的准备工作,46,资料的审查,主要考察三
20、个方面:资料的完整性审查资料的统一性审查资料的合格性审查,资料,47,资料的完整性审查,包括资料总体上的完整性和每份资料的完整性。资料总体的完整性主要考虑问卷发放的数量、回收率等。每份资料的完整性主要看问卷的填答情况,是否是有效问卷。,48,资料的统一性审查,1、检查所有问卷、报表填答的方法是否统一。2、检查统一指标的数值所使用的单位是否一致。3、审查指标的定义和分析的标准是否与自己的研究分类相一致。4、审查指标统计的总体是否一致。,49,资料的合格性审查,审查提供资料的人的身份是否符合规定的调查对象的身份。审查所提供的资料是否符合填答的要求。审查所提供的资料是否正确。,50,审查资料正确性的
21、三种方法,1、判断检验:依据已知情况来判断是否真实正确。2、逻辑检验:从资料的逻辑关系来检验是否正确。3、计算检验:通过各种数字的运算来检验是否正确。,51,资料的编码,根据一定的规则将研究资料转换为可进行统计分析的数码资料的过程。,问题025:您认为打工的外地人对武汉市的社会秩序是否有影响?(单选)1有很大影响 2有较大影响 3没有影响 4不好说,4,编码,答案,52,编码的步骤,1、确定变量,变量:用来反映概念的量化形式。在统计中往往指最小的分析单位。编码就是对变量进行编码。变量由两个部分构成:变量名和变量值。要注意区分何为变量,何为变量值。在调查问卷中还要注意区分问题和变量。,53,问题
22、009:您有几个儿子?几个女儿?1儿子_人 2女儿_人,2,3,问题,变量1,变量2,变量1的值,变量2的值,54,2、几种常见的编码方式,封闭性问卷的处理方法单项选择题多项选择题多项排序选择题固定选择项不固定选择项开放性问卷的处理方法,55,2,2,56,有6个选项,故应设6个变量,运用0-1编码方法编码,即:1,0,1,0,1,1。此外,多选还有另外一种编码方法,即直接编码输入法,编码为1,3,5,6,0,0。,1 3 5 6,57,3 1 6,问题012:您择业中考虑的主要因素有(依据重要性大小排列,限选三项),1经济收入 2 专业对口 3发展前途 4 地理区位5个人爱好 6 风险大小7
23、劳动强度 8 社会福利9社会地位 10其他,因为是依据重要性大小排列,限选三项,故应设三个变量,编码依次为3,1,6。,58,择业中考虑的主要因素(依据重要性先后排列),1经济收入 2 专业对口 3发展前途 4 地理区位5个人爱好 6 风险大小7劳动强度 8 社会福利9其他,3 1 6 4 7 8 5,因为是依据重要性排列,不限制选项,故应设九个变量,编码依次为:3,1,6,4,7,8,5,0,0。,59,择业中考虑的主要因素(多选),1经济收入 2 专业对口 3发展前途 4 地理区位5个人爱好 6 风险大小7劳动强度 8 社会福利9其他,编码应为:1,0,1,1,1,0,1,1,0。或1,3
24、,4,5,7,8,0,0,0。,60,开放性问卷的处理方法,1、对回答进行分类。一般首先随机抽取一部分问卷,了解回答的情况,依据回答对问卷进行分类,主要考虑语气强弱、观点确定等方面。2、建立回答类别与对应的数量关系,进行编码。,61,数据登录,在大型社会调查中通常要进行数据登录,现在一般采用问卷页边编码方式,以避免转录中增加误差。数据登录的主要作用:输入更快捷、准确。有利于多人分工合作、共同输入。便于核查数据。,62,采用DOS、WPS、CCED等软件,按ASCII码方式录入成文本文件(*.dat;*.txt)。这种录入方式的特点是,数据之间没有间隔,录完一个数码后自动后移,录入速度较快。缺点
25、是容易错位。,采用SPSS数据编辑器(SPSS Data Editor)录入。其优点是不容易错位,缺点是不能自动后移,录入速度慢,数据错误不容易修改。,数据录入,63,二、SPSS运行的基本步骤,64,数据编辑器,录入数据,65,保存数据,单击保存类型列表框,可以看到SPSS所支持的各种数据类型,有DBF、FoxPro、EXCEL、ACCESS等,这里我们仍然将其存为SPSS自己的数据格式(*.sav文件)。在文件名框内键入变量名并回车,可以看到数据管理窗口左上角由Untitled变为了现在的新变量名。,66,SPSS变量定义,Spss7.5、Spss8.0、Spss9.0的定义变量均通过Da
26、ta菜单中 Define Variable子菜单的对话框中完成。Spss10.0中变量定义只需在Data和Variable中进行转换即可进行变量定义。Spss10.0中的变量定义。,67,Spss11.5变量定义项目,Spss11.5中变量定义的一共有10个项目:变量名(name)、变量类型(type)、变量长度(width)、小数位数(decimals)、变量标签(label)、变量值标签(values)、缺省值(missing)、变量显示宽度(columns)、变量对齐方式(align)、变量测量尺度(measure)。注意区分变量的标签(Variable Labels)与变量值的标签(V
27、alue Labels)。,68,变量的类型表,69,变量标签与变量值标签,变量标签(Variable Labels):为进一步描述变量所表示的意义,特别是当变量名不能充分描述变量所表述的意义时。变量值标签(Value Labels):为进一步说明变量的可能取值,它可以定义,也可不定义。如,变量取值为:grade1、grade2、grade3、grade4,其表示年级,则变量标签为年级,而变量值标签对应变量取值为:本科一年级、本科二年级、本科三年级、本科四年级。,70,Spss11.5中变量定义的操作,单击Variable View 进入;,单击,定义变量名,单击,定义变量类型,定义变量标签,
28、变量标签值,定义测度层次,定义变量宽度,定义对齐方式,定义变量类型对话框,定义变量标签值对话框,定义变量定义缺省值对话框,71,插入变量与删除变量,插入量与删除观测量,数据的剪切、粘贴与复制,1.插入变量在添加处单击Var,单击右鼠标键出现右侧对话框,单击Insert Variables2.删除变量,1.插入观测量在添加处单击观测量,单击右鼠标键出现右侧对话框,单击Insert Case2.删除观测量,剪切,复制,粘贴,若想恢复,打开Edit-Undo,数据的简单编辑,72,1、寻找某个观察量:单击Data-Go to Case 打开对话框:,输入要寻找观测量序号,2、在某个变量中寻找指定数据
29、,1)单击某变量如stock所在列的任意一单元格2)单击Edit-Find,打开对话框3)在Find中输入要找数据某变量,Find Data in Variable SALARY对话框,Go To Case对话框,数据的简单编辑,73,第三节 为分析作好准备,74,本节主要内容,数据编辑器的功能数据文件的整理数据文件的加权重编码数据的变换和计算缺失值的处理,75,数据编辑器,图标,菜单栏,标题栏,输入数据栏,数据显示区:变量名观察序号,数据编辑器的构成,一、数据编辑器的功能,76,数据编辑器的功能主要是通过主菜单的“Edit”和“Data”两个菜单项来实现的。其主要功能有:1)变量和观测量的编
30、辑功能2)数据编辑功能,数据编辑器的功能,77,数据编辑功能表(Edit菜单),78,Data菜单的各项命令,79,Data菜单的各项命令,80,二、数据文件的整理,主要内容:观测量数据的排序变量值排秩拆分数据文件合并数据文件,81,观测量数据的排序,首先在数据窗中建立或读入一个数据文件。按Data Sort Cases顺序逐一单击鼠标键,打开Sort Cases观测量排序对话框。依据需要进行选择,然后单击OK按纽即可。,82,观测量数据的排序,在左边的源变量框中选择排序变量进入Sort by框。如果选择2个以上的变量,观测量的排序结果与排序变量在Sort by框中的顺序有关。列于首位的为第一
31、排序变量。,在Sort Order 栏内选择排序方式升序与降序,83,变量值排秩,运用Transform 命令实现。求得的秩在数据窗中建立一个新变量来保存。具体操作方法:按Transform Rank Cases顺序逐一单击鼠标键,打开Rank Cases对话框。依据需要进行选择,然后单击OK按纽即可。新生成的秩变量的名称以原变量名称前加字母“R”的形式出现在数据文件中。,84,变量值排秩,85,变量值排秩的选项说明,在Assign rank 1 to 栏中可选择秩的排列方式。如选择一个或多个分组变量进入By栏,系统将按By变量分组排秩。当所选择的变量具有相同值时称为Tie(结),其秩次的决定
32、原则可以在Rank Cases:Ties对话框中指定。在Rank Type中可以选择获得秩次的其他方法。Display summary Tables 复选项为默认选择,表示要在输出结果窗中显示新变量的名称、标签、秩类型等总结性信息。,86,拆分数据文件,在进行数据处理时经常要对数据文件中的观测量进行分组分析,如分性别的平均分数。进行分析之前必须对 数据文件进行拆分。拆分分件并不是将一个数据文件分为两个或几个独立的数据文件,而是在同一个数据文件中按某个条件分组。这种拆分在以后的运算中一直有效直到取消或更改拆分变量。,87,拆分数据文件的具体操作,读取一个数据文件。按Data Split File
33、s顺序逐一单击鼠标,打开Split Files对话框。根据对数据的具体需要选择相应的选项。按Ok完成。,88,拆分数据文件,89,合并数据文件,合并数据文件是指将外部数据中的观测量或变量合并到当前的数据文件中去。合并数据文件包括两种方式:从外部数据文件增加观测量到当前数据文件中纵向合并或称追加观测量。从外部数据文件增加变量到当前数据文件中横向合并。,90,纵 向 合 并,首先打开一个数据文件。按Data Merge Files Add Cases顺序逐一单击鼠标,打开:Read File对话框,依据需要选择文件,然后进入Add Cases From对话框,选择相应的选项或做适当的修改即可。,9
34、1,纵 向 合 并,92,纵 向 合 并,93,横 向 合 并,横向合并有两种方式:从一个指定的外部数据文件中取得一个或几个变量的数据(包括变量名称)增加到 当前工作数据文件中,实际上相当于两个数据文件的横向合并。按关键变量合并,即要求两个数据文件必须有一个共同的关键变量,而且这两个文件中的关键变量还存在一定数量的相同值的观测量。,94,横向合并的具体操作,首先打开一个数据文件。按Data Merge Files Add Variables顺序逐一单击鼠标,打开Add Variables:Read File对话框,依据需要选择相应的选项或做适当的修改即可。,95,横向合并,96,三、对观测量加
35、权处理,在计算的过程中需要利用变量对数据进行加权处理时采用。加权处理的具体方法:按DataWeight Cases,打开Weight Cases对话框,依据需要进行适当的选择即可。,97,对观测量加权处理,98,对观测量加权处理,在选择加权变量时应注意:加权变量中含有零、负数或缺省值的观测量将被排除在分析之外。分数值有效。一旦对数据进行了加权处理,那么在以后的分析中加权处理一直有效,直到关闭加权处理过程或选择其他的加权变量进行加权处理。,99,四、重编码,重编码的步骤及两种方式:(1)Into Same Variables;(2)Into Different Variables.,100,重编
36、码的应用,高一层次的变量,转化为低一层次的变量时,常常需要重编码。当采用量表来进行测量,而量表中变量取值有正反两种方向的设置,需要转化为同一方向时,常常需要重编码。,101,第一种方式重编码,102,If Case 对话框,用于设置变量重编码的条件,103,Old and New Values对话框,设置旧变量转变为新变量的对应方式,104,第二种方式重编码,第二种重编码方式需要在Output Values中定义新变量的变量名与变量标签。第二种重编码方式中 If 和 Old and New Values按钮展开的对话框形式与结构、内容是一样的。,105,五、对数据进行变换和计算,利用菜单“Tr
37、ansform”下的“Compute”命令实现数据的变换和计算利用菜单“Transform”下的“Compute”命令,可以完成以下工作:1、计算数值或字符型变量的值2、创建新的变量或取代已存在的变量,对于新的变量,依然可以定义3、可以利用已建立的函数进行变量的计算和转换,106,创建新的变量对话框,107,创建新的变量,108,六、缺失值的处理,SPSS中缺失值默认为圆点“.”DATA中设置了3种设置缺失值的方式TRANSFORM下设置了5中不同的替代缺失值的方法。缺失值的处理方法,109,缺失值定义方法,110,缺失值替代方法,111,缺失值处理方法,Exclude cases pariw
38、ise 成对删除含缺失值的个案Exclude cases listwise 删除所有含有缺失值的个案Replace with mean 用均值代替缺失值Exclude cases analysis by analysis 统计检验时,删除含有缺失值的个案Report values 报值,112,第四节 基本统计分析,113,一、SPSS统计分析功能概述,1、SPSS数值分析过程2、SPSS图形分析过程,114,1、SPSS数值分析过程,Descriptive Statistics Compare means General linear model CorrelateRegression,Lo
39、glinearClassifyData reduction ScaleNonparametric tests SurvivalMultiple response,115,2、SPSS图形分析过程,116,基本统计分析功能包括:描述性统计分析(Descriptive Statistics),二、基本统计分析功能,117,描述性统计分析(Descriptive Statistics),1、Frequencies 频数分析表2、Descriptive 描述性统计分析过程3、Crosstabs 列联表分析过程,118,1、频数分析表,一、主要功能 可对数据按组进行归类整理,形成变量不同水平的频数分布表
40、和图形,对数据的分布趋势进行初步分析。二、频数分析 按AnalyzeDescriptive StatisticFrequencies顺序,打开Frequencies对话框如图。,119,选择一个或多个变量右移入Variable(s)框。,按Statistics按钮,打开Statistics对话框,显示频数分布表,按Chart按钮,打开Chart 对话框,按Format按钮,打开Format 对话框,Frequences主对话框,120,输出百分位数:输出四分位数,显示25%、50%、75%的百分位数;将数据平均分为所设定的相等等份,可输入2100 的整数,如键入4则输出第25、50、75百分位
41、数自定义百分位数,可输入0100 的整数。输入值后:按Add:输入值后按此键,可反复操作键入多个百分位数;按Remove:删除已键入的数值 按Change:重新输入新数,离差栏,分布参数栏,在计算百分位数值和中位数时,假设数据已分组,且用各组的组中值代替各组数据,中心趋势栏,输出统计量对话框,121,Chart 对话框,不输出任何图形,为默认 输出条形图,各条高度代表变量各分类的频数输出圆图,圆图中各块的数值表示各分类变量的频数输出直方图,此图仅适用于区间型数值变量。选择此项后,还可选择With normal curve,画出的直方图带有正态曲线,只有选择了条形图和圆图项才有效,决定纵轴表示的
42、统计量纵轴表示频数图纵轴表示百分比,122,Format 对话框,控制频数表输出的分类数量。默认为10,多变量框中可设定多变量表格输出的格式,设置频数表输出的格式,选择频数表中排列顺序按变量升序排列,此为默认按变量降序排列按变量各种取值发生的频数的升序排列按变量各种取值发生的频数的降序排列,123,表49 100名大学生血清蛋白含量(%),三、例题分析,对某高校100名大学生血清蛋白含量(g%)做频数分析,数据如表49,124,1、具体步骤按AnalyzeDescriptive StatisticFrequencies 顺序,打开Frequencies对话框。打开数据文件“大学生血清.sav”
43、,挑xdh变量进入Variable框,grade变量进入Break框。选中Display frequency tables复选框,要求输出频数分布表。单击Statistics按钮,选择要输出的统计量。单击Chart 按钮,选择Histogram项,输出直方图,并选择With normal curve复选框,输出正态曲线。单击Format 按钮,选Ascending项。单击“OK”完成。,125,血清蛋白含量的直方图,血清蛋白含量的统计表,2、输出结果及分析结果如下,126,血清蛋白含量的频数分布表,127,一、主要功能:调用此过程对变量进行描述性统计分析,计算均值、标准差、全距和均值标准误差等
44、,并可将原始数据转换成Z分数。二、描述统计量分析按Analyze Descriptive Statistics Descriptives顺序单击,打开 Descriptives主对话框。如图,选一个或多个变量移入,如选中此框,将对Variables框中选择的变量进行标准化产生相应的Z分值,并作为新变量保存到数据窗口,其变量名在原变量名前加z。,Descriptive 对话框,2、描述性统计分析过程,128,Options 对话框,基本统计量,当Variables框中有多个变量时,此框确定其输出顺序:按Variables框中的排列顺序输出按各变量的字母顺序输出按均值的升序排列按均值的降序排列,分
45、布,129,三、例题分析 已知20个初生婴儿的体重数据如下表,对其进行描述统计。20个初生婴儿的体重(g),1、操作步骤:打开数据文件“婴儿体重.sav”。打开 Descriptives主对话框,选定变量t进入Variable栏中。选中Save standardized values as variables 复选框,要求计算变量的z值,并保存结果到当前数据集中。单击Options 按钮,选中Mean、Std.Deviation、Minimum、Maximum、Variance 项。,130,婴儿体重的描述统计量,这时打开原数据集,可看到多了一列zt,这是t 的z 分数,如下图所示:,保存了z
46、 分数的数据集,2、输出结果及分析,131,3、列联表分析过程,主要功能:调用列联表分析过程可进行计数资料和某些等级资料的列联表分析,一个行变量和一个列变量可组成一个二维列联表,如再加一个控制变量则可组成一个三维列联表。而多个行、列、控制变量就可组成一个复杂的多维列联表。在分析中可对二维和多维列联表资料进行统计描述和x2检验,并计算相应的百分数指标。此外,还可计算四格表确切概率(Fishers Exact Test),且有单双侧(One-Tail、Two-Tail)、对数拟然比检验(Likelihood Ratio)以及线性关系的Mantel-Haenszel x2检验。,132,4、列联表分
47、析过程,列联表分析程序 按Analyze-Descriptive Statistics-Crosstabs 顺序打开 Crosstabs 主对话框。如图:,133,列联表概述,列联表分析的基本步骤按Analyze-Descriptive Statistics-Crosstabs的顺序打开列联表的对话框;在左侧的原变量框中选择一个或多个分类变量送入Row作为分布表中的行变量;选择一个分类变量送入Column框,作为分布表中的列变量;根据需要选择一个控制变量进入layer框中。该变量决定频数分布表的层;Display clustered bar charts复选项,显示每一组中各分类变量的分类条形
48、图;Suppress tables复选项,要求只输出统计量,不输出多为列联表;,134,该框中的变量作为分布表中的行变量,必须是数值型或字符型等分类变量。,该框中的变量作为控制变量,决定频数分布表中的层,可有多个控制变量,如要增加新的控制变量,按Next 键,要修改以前的变量按Previous 键,显示每一组中各变量的分类条形图。,只输出统计量,不输出多维列联表。,Crosstabs 对话框,135,进行行和列变量相互独立的假设检验,有多种检验法。(注),进行相关系数的检验,有两项结果显示:Pearson相关系数和 Spearman相关系数,适用于定类变量的统计量:基于卡方检验基础上对相关性的
49、检验用来描述相关性当用自变量预测因变量时,此系数反映这种预测降低错误的比率。显示不确定系数,表示用一个变量来预测其他变量时降低错误的比率,适用于定序变量:Gamma系数反映两个有序变量间的对称相关性。是Gamma检验的非对称推广。对有序变量和秩变量相关性的非参数检验。与Kendalls tau-c相似,适用于定序变量:用于检验相关性用于检验两个评估人对同一对象的评估是否具有一致系。检验某事件发生和某因子之间的关系进行两个相关的二值变量的非参数检验进行一个二值因素变量和一个二值响应变量的独立性检验。,Crosstabs的Statistics 对话框,136,Crosstabs的Cell Disp
50、lay 对话框,选择在列联表中输出的统计量,包括观测量数、百分比、残差,输出观测量的实际数量如果行和列变量在统计上是独立的或不相关的,那么会在单元格中输出期望的观测值的数量。,输出单元格中观测量的数目占整行全部观测量数目的百分比输出单元格中观测值的数目占整列全部观测量数目的百分比输出单元格中观测量的数目占全部观测量数目的百分比,计算非标准化残差计算标准化残差计算调整后残差,137,Table Format 对话框,决定各行的排列顺序:各行的排列按升序各行的排列按降序,三、例 为了探讨吸烟与慢性支气管炎有无关系,调查了339人,情况如下:,吸烟和慢性支气管炎调查表,138,输入数据:变量h为采得