定量分析工具SPSS.ppt

上传人:牧羊曲112 文档编号:6112998 上传时间:2023-09-25 格式:PPT 页数:81 大小:732KB
返回 下载 相关 举报
定量分析工具SPSS.ppt_第1页
第1页 / 共81页
定量分析工具SPSS.ppt_第2页
第2页 / 共81页
定量分析工具SPSS.ppt_第3页
第3页 / 共81页
定量分析工具SPSS.ppt_第4页
第4页 / 共81页
定量分析工具SPSS.ppt_第5页
第5页 / 共81页
点击查看更多>>
资源描述

《定量分析工具SPSS.ppt》由会员分享,可在线阅读,更多相关《定量分析工具SPSS.ppt(81页珍藏版)》请在三一办公上搜索。

1、,第二讲 定量分析工具SPSS,简介,一、什么是SPSS,SPSS(Statistics Package for Social Science)是一种运行在Windows系统下最适用于社会科学的统计软件包。SPSS软件从1968年由美国斯坦福大学开发使用至今,已经拥有全球数以万计的用户,成为世界上应用最广泛的专业统计软件之一。,该软件包集数据整理、分析过程、结果输出等功能为一体,采用窗口操作界面,统计分析方法涵盖面广,用户操作使用方便,输出数据表格图文并貌,并且随着它的功能不断完善,统计分析方法不断充实,大大提高了统计分析工作的效率。,SPSS 统计分析过程包括描述性统计、均值比较、一般线性模

2、型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类;每类中又分好几个统计过程,如均值比较;每个过程中又允许用户选择不同的方法及参数。,二、SPSS系统运行的环境要求,SPSS10.0以上版本软件包可以工作在两种模式下,单机模式和作为网络系统的用户界面模式。SPSS软件包可以运行在微软公司的Windows 98、Windows ME、Windows 2000和Windows XP操作系统之下。由于统计分析软件的数据量比较大,所以系统运行需要大于16M以上空间。,1、启动Windows后,把SPSS系统安装软盘(或光盘)插入软驱(或光驱),并找到SP

3、SS的安装程序的可执行文件Setup.exe。2、双击 Setup.exe 文件,安装程序向导将给出每一步操作的提示。在出现Welcome窗口后,选择Next进入下一步。3、安装程序显示Software License Agreement对话框时,选择Yes接受显示的协议条款。,三、SPSS软件包的安装,4、选择把SPSS 安装到哪个文件夹(目录),默认文件夹为程序文件目录下的SPSS 目录(如“C:Program FilesSPSS”)。如果要改变安装目录,按Browse选择新的目录。然后单击Next按钮。5、在User Information窗口中输入Name(姓名)、Organizati

4、on(组织单位)、Serial Number(产品序列号),然后单击Next按钮。,6、根据需要选择安装类型:Typical(典型安装)、Compact(最小安装)、Custom(定制安装)。这里假设要进行定制安装,所以选择Custom。按Next进入下一步。7、选择要安装的部件。8、根据授权情况选择个人安装或共享安装。9、输入许可证号,单击Next。10、单击Finish按钮,结束SPSS 安装过程。,四、SPSS的运行方式,SPSS提供了3种基本运行方式:完全窗口菜单方式,程序运行方式、混合运行方式。程序运行方式和混合运行方式是使用者从特殊的分析需要出发,编写自己的SPSS命令程序,通过语

5、句直接运行。,本课程只介绍完全窗口菜单管理方式,这种操作方式简单明了,除数据输入工作需要键盘外,大部分的操作命令、统计分析方法的实现是通过菜单、图标按钮、对话框来完成的。非常适用于一般的统计分析人员和一般统计方法的应用者。,五、SPSS软件包的启动,单击Windows 的开始按钮(如图所示),在程序菜单项SPSS for Windows中找到SPSS 11.5 for Windows并单击。,Run the tutorial:运行操作指南;Type in data:输入数据选项,建立新的数据集时可选择此项;Run an existing query:运行一个已经存在的数据文件选项;Create

6、 new query using Database Wizard:用数据库处理工具建立新文件;,Open an existing date source:打开一个已经存在的数据文件;Open another type of file:打开其他类型的文件。Dont show this dialog in the future:是一复选对话框,选中该复选项后,下次启动SPSS时将不会显示对话框,直接显示数据编辑窗口。,六、SPSS的主界面与数据输入,File:文件管理菜单,有关文件的调入、存储、显示和打印等;Edit:编辑菜单,有关文本内容的选择、拷贝、剪贴、寻找和替换等;View:“视图”菜单,

7、显示或隐藏状态行、工具栏、网络线、值标签和改变字体。,七、数据编辑窗口的主菜单,Data:数据管理菜单,有关数据变量定义、数据格式选定、观察对象的选择、排序、加权、数据文件的转换、连接、汇总等;Transform:数据转换处理菜单,有关数值的计算、重新赋值、缺失值替代等;,Analyze:统计菜单,有关一系列统计方法的应用;Graphs:作图菜单,有关统计图的制作;Utilities:用户选项菜单,有关命令解释、字体选择、文件信息、定义输出标题、窗口设计等;,Windows:窗口管理菜单,有关窗口的排列、选择、显示等;Help:求助菜单,有关帮助文件的调用、查寻、显示等。,八、SPSS操作的基

8、本步骤,录入数据,1、定义数据,(1)定义变量类型,变量名(name);变量类型(type);变量长度(width);小数位数(decimals);变量标签(label);变量值标签(values);缺省值(missing);变量显示宽度(columns);变量对齐方式(align);变量测量尺度(measure)。,(2)定义变量值标签,变量标签(Variable Labels):为进一步描述变量所表示的意义,特别是当变量名不能充分描述变量所表述的意义时。变量值标签(Value Labels):为进一步说明变量的可能取值,它可以定义,也可不定义。如,变量取值为:grade1、grade2、g

9、rade3、grade4,其表示年级,则变量标签为年级,而变量值标签对应变量取值为:本科一年级、本科二年级、本科三年级、本科四年级。,按间隙(gaps)划分,根据一个变量紧挨着的两个观测值之间是否有空隙(缺口),可以把变量分为两类:离散型变量(discrete variable)和连续型变量(continuous variable)。如果一个变量的观测值之间有空隙,该变量称为离散型变量,否则称为连续型变量。例如,性别、企业数目、分组情况等为离散型变量;身高、体重、血压、GDP 等为连续型变量。,(3)变量(Variable)的分类,按作用划分,根据一个变量在分析时的作用,可以分为因变量(dep

10、endent variable)或自变量(independent variable)。如果一个变量由其他变量来描述,该变量称为因变量或反应变量(response variable);如果一个变量与其他变量一起用于描述因变量,该变量称为自变量或预测变量(predictor variable)。例如,在分析家庭收入、性别等因素对消费支出的影响时,收入变量和性别变量是自变量,消费支出变量是因变量。,根据测量尺度划分,定类变量又称为名义(nominal)变量。这是一种测量精确度最低、最粗略的基于“质”因素的变量,它的取值只代表观测对象的不同类别,例如“性别”变量、“职业”变量等都是定类变量。定类变量的

11、取值称为定类数据或名义数据。,定类数据的其同特点是用不多的名称来加以表达,并由被研究变量每一组出现的次数及其总计数所组成,这种数据是枚举性的,由计数而得。因而,定类数据中同一组内各单位是等价的,同时若更换各不同组的符号并不会改变数据原有的基本信息。因此,最常用来综合定类数据的统计量是频数、比率或百分比等。,定序变量又称为有序(ordinal)变量、顺序变量,它的取值的大小能够表示观测对象的某种顺序关系(等级、方位或大小等),也是基于“质”因素的变量。例如,“最高学历”变量的取值是:1小学及以下、2初中、3高中、中专、技校、4大学专科、5大学本科、6研究生以上。由小到大的取值能够代表学历由低到高

12、。,定序变量的取值称为定序数据或有序数据。适合于定序数据的数学关系是“大于”和“小于”关系。定序数据中,同一组内各单位是等价的,相邻组之间的单位是不等价的,它们存在“大于”或“小于”的关系。进行保序变换,则不改变数据原有的基本信息即等级顺序。最适合用于综合定序数据取值的集中趋势的统计量是中位数。,定距变量又称为间隔(interval)变量,它的取值之间可以比较大小,可以用加减法计算出差异的大小。例如,“年龄”变量,其取值60 与20 相比,表示60 岁比20 岁大,并且可以计算出大40 岁(60-20)。定距变量的取值称为定距数据或间隔数据。定距数据是一些真实的数值,具有公共的、不变的测定单位

13、,可以进行加减乘除运算。,定距数据的基本特点是两个相同间隔的数值的差异相等,例如,年龄的60 岁与50 岁之差等于40 岁与30 岁之差。对于定距数据,不仅可以规定“等价关系”以及“大于关系”和“小于关系”,而且也可以规定任意两个相同间隔的比值或差值。如果将每个数值分别乘以一个正的常数再加上一个常数,即进行正线性变换,并不影响定距数据原有的基本信息。因此,常用的统计量如均值、标准差、相关系数等都可直接用于定距数据。,定比变量又称为比率(ratio)变量,它与定距变量意义相近,细微差别在于定距变量中的“0”值只表示某一取值,不表示“没有”。例如,人的身高就是一个定比变量,如果身高值为“0”米,则

14、表示这个人不存在。而定比变量的“0”值表示“没有”。,而在测定温度的摄氏表中,0度并不表示没有温度,因为还有在零点以下的温度。定比变量的取值称为定比数据或比率数据。定比数据也同样可进行算术运算和线性变换等。通常对定距变量和定比变量不需再加以区别,两者统称为定距变量或间隔变量。,小结,一般地,定类变量和定序变量用于描述定性数据,属于定性变量;而定距变量和定比变量用于描述定量数据,属于定量变量。一个变量在不同分析中可当作不同尺度的变量。例如,“年龄”在某些分析中(如回归分析)当作定距变量,而在另外一些分析中(如方差分析)可通过分组作为定类变量处理。,另外,较高尺度的变量包含了较低尺度变量的性质。定

15、序变量包含了定类变量的所有特征,定距变量同时包含了定序变量和定类变量的特征。这种性质允许在分析数据时把一些较高尺度变量作为较低尺度变量处理。例如,定距变量可当作定类变量或定序变量看待,而定序变量可作为定序变量分析。,以上通过三种不同方法对变量进行分类。这些分类是可以重叠的。一个变量可能是离散型变量、自变量、定类变量(如“最高学历”),也可能是连续型变量、因变量、定距变量(如“血压”)。定类变量必须是离散变量,而定距变量和定序变量可以是离散变量或连续变量;连续变量必须是定序变量或定距变量。例如,变量“性别”是离散变量又是定类变量;变量“年龄”可当作定距变量、连续变量,也可以作为定类变量、离散变量

16、。,2、录入数据,八、SPSS主菜单功能的简单操作,(一)File主菜单,数据暂存,切换服务器,(二)Edit,撤销上一步操作,恢复上一步操作,粘贴变量,(三)View(窗口外观控制),字体,用竖线作刻度标志,变量值标签,变量,(四)Data,1、定义和编辑变量、观测量,Define Variable Properties:定义变量属性;Copy Data Properties:由外部文件和工作文件拷贝数据变量和属性;Define Dates:定义或编辑日期变量格式;Insert Variable:在数据编辑窗口插入一个变量;Insert Case:在数据编辑窗口插入一个观测量;Goto Ca

17、se:光标跳转到某一指定观测量。,(1)对变量的编辑,插入一个新变量数据窗口单击DataInsert Variable,在光标所在位置的前一列插入一个新的变量,变量名字和属性可以在Variable View窗口中定义。,(2)观察值的编辑,插入一个新观测量(Case)在数据窗口主菜单上单击DateInsert Cases命令,在光标所在位置的前上一行插入一行新的观测个体,输入新的观测数据。,(3)查找指定的观测量(数据),查找指定的观测数据的命令是Go to Case。在数据窗口单击DateGo to Case,弹出一个对话框,如图所示:输入要找的观测量的序号后,点OK按钮,数据表中光标就会指

18、到选定的观测量个体。,2、变量数据变换的命令,Sort Cases:对观测量进行排序;Transpose:对观测量进行转置;Restructure:对现有的观测量进行重新构造,形成新格式的数据文件;Merge File:把外部数据合并到工作文件中;Aggregate:对数据进行分类或不分类汇总,产生新文件或代替工作文件。Identify Duplicate Cases:标识重复观测量;Orthogonal Design:进行正交设计。,(1)观测数据排序,给观测量数据排序的命令是Sort Cases。在数据窗口单击DateSort Cases,打开Sort Cases对话框,从对话框左侧的变量

19、列表中选择排序变量,点击右箭头按钮加入Sort by框中,然后在Sort Order栏中选择排序顺序:Ascending:个体按照选定的排序变量值由小到大的升序排列;Descending:个体按照选定的排序变量值降序排列。,注意1:观测个体,排序变量可以是一个或多个,当选择多个排序变量时,首先按第一个变量值排序,然后在第一个变量取值相同的那些个体中再按第二个变量值排序,依次类推。注意2:在排序的时候,观测个体整行的值一同变到新位置,而不是只有排序变量那一列变动。但数据表中左边框上的序号并不随着变动,因此,为了保留原始数据的信息,最好自己定义一个变量来记录观测个体的序号。,(2)数据分类汇总(数

20、据分组汇总),用户可以根据需要对数据按指定的变量的数值进行归类分组汇总。以某数据库两个班的学生成绩为例,如果按照性别对数学成绩进行汇总,可以使用分类汇总命令实现。具体操作如下:,1.指定分类变量和汇总变量。打开数据库,在数据窗口单击DateAggregate命令,打开Aggregate Date对话框。如图所示:,2.在变量名列表框中选择分类变量”性别”进入Break Variable(s)。3.在变量名列表框中选择汇总变量”Math”进入Aggregate Variable(s)。4.单击Function按纽,打开Aggregate Date:Function对话框,,在此对话框中可以选择平

21、均值、数据和、标准差的形式,特别值形式,百分数形式、频数形式等其中之一的方法进行分类汇总。选择分类汇总的函数形式后返回Aggregate Date对话框中。,5.单击Name&Label按纽,可以重新指定结果文件中的变量名并加入变量标签。SPSS默认的结果文件中的变量名为原变量名最后加上1.6.最后单击OK,可得相应的数据文件。,3、观察量数据整理的命令,Split File 拆分数据文件的观测量,观测量进行条件分组;Select Cases 选择观测量;Weight Cases 对观测量进行加权处理。通过选择上述命令,可以实现对数据的整理编辑。,(1)在数据中选取子集,如果需要从数据文件中选

22、取一部分数据,可以在数据编辑窗口单击Data Select Case,打开Select Case对话框,在该对话框的Select栏中选择挑选数据子集的方式:All case:选择所有数据;If condition is satisfied:按指定条件选择数据。Random Sample of cases:对观察值进行随机抽样。,单击If按纽,打开Select Case:If对话框,如图所示,先选择变量,然后定义条件。,对观察值进行随机抽样。单击Random Sample of cases 按纽,打开Select Case:Random sample对话框。如图所示。,在Sample Size栏

23、中有两种选择方式,一种是大概抽样(Approximately),即键入抽样比例后由系统随机抽样;另一种是精确抽样((Exactly),要求输入从第几个观察值起抽取多少数据。,(五)Transform,Compute:计算产生新变量,SPSS提供了10类100多个函数,通过该菜单可以用表达式产生一个新变量;Random Number Seed:创建随机数种子变量;Create Times Series:创建时间序列变量;,1、通过基本变量创建各种新变量,(1)计算产生新变量,对于已存在的数据变量,根据需要进行计算生成新变量的命令是Compute。在数据窗口单击Transform Compute,

24、打开Compute Variable对话框,如图所示。,在对话框左上方Target Variable栏中,键入即将生成的新变量的名称,并单击Type&Lable按纽确定变量标签及数据类型。,整数函数,反正切函数,2、创建各种参数变量,Count:创建一个计数变量,用于统计计数;Recode:对变量值重新编码;Rank Cases:为观测量排秩,求得的秩在数据窗口作为一个新变量保存;Categorize Variables:建立新的分组变量,使数据分成若干个组;Automatic Recode:对变量值自动编码,产生一个连续的变量值编码;Replace Missing Values:创建替代缺失

25、值变量;,在数据窗口单击TransformCount,打开Count Occurrence of Value within Cases对话框,如图所示:,先在Target Variable中指定一个变量(可以是已经存在的变量或新变量),并定义变量标签,然后指定要统计的变量加到Numeric Variables框中,再单击Define Values按纽,打开Value to Count对话框。,Value:输入某个值为清点对象;System-missing:以系统的缺失值为清点对象;System-or user missing:以系统或用户指定的缺失值为清点对象;,Range:指定数值的计数区域

26、:其中包括:()through()在框内指定下限和上限lowest through():在框内只指定上限;()highest through:在框内只指定下限。,图中给出的是计算达到优良标准,即学生达到80分以上的人数。确定了计数数值后,单击Add,使选择结果进入Values to count 框内。单击Continue按纽,返回主对话框中。,变量分组(编码),对变量数据的重新分组(编码),是指给每个变量值重新赋予一个码来描述他们的某些属性。码数相同的即为一组。比如,可以对年龄重新分组,19岁及以下年龄赋予一个编码1,20-29岁的年龄码赋予2,30-39岁年龄码赋予3,依此类推,这些码只能取

27、正整数值。从某种程度上来讲,编码也可以看做分组:一个组对应一个组号,这样就把这些人按年龄分为几个组,一目了然。,缺失值的替代方式,在数据窗口点击TransformReplace Missing Values,打开Replace Missing Values,对话框,如图所示:,在变量中选择具有缺失值的变量进入New Variable框内,系统可以自动产生替代缺失值的新变量,也可处定义新变量。然后在Method的下拉菜单中选择缺失值的替代方式。,Series mean 用该变量所有非缺失值的平均值替代缺失值;Mean of nearly point用缺失值相邻点的的非缺失值的平均数据替代缺失值;

28、Median of nearly point 用缺失值相邻点的的非缺失值的中位数替代缺失值;Linear interpolation 用缺失值相邻点的的非缺失值的中点值替代缺失值;Linear trend at point 用线性拟合方式替代缺失值。,(六)Analyze,回归分析,聚类与判别,因子分析,非参数检验,多选变量分析,定距/定比变量,一般线性模型,1、Reports,Case Summaries:观测值摘要分析Report Summaries in Row:行形式输出报告Report Summaries in Columns:列形式输出报告,2、Descriptive,考察数据的奇异性和分布特征奇异性:数据的过大或过小分布特征:数据是否来自正态分布总体,考察方法:统计量和统计图形(箱图、茎叶图(频数、茎和叶)、方差齐次性检验Spread vs level图)。,Explore,Dependent List:因(分析)变量,定距变量Factor List:分组变量,分类变量Label Cases by:标识变量,为方便查找输出观测量,3、Tables,4、Compare Means,5、Regression,6、Classify,7、Nonparametric,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号