《SPSS实例分析》PPT课件.ppt

上传人:牧羊曲112 文档编号:5577177 上传时间:2023-07-30 格式:PPT 页数:99 大小:1,022.50KB
返回 下载 相关 举报
《SPSS实例分析》PPT课件.ppt_第1页
第1页 / 共99页
《SPSS实例分析》PPT课件.ppt_第2页
第2页 / 共99页
《SPSS实例分析》PPT课件.ppt_第3页
第3页 / 共99页
《SPSS实例分析》PPT课件.ppt_第4页
第4页 / 共99页
《SPSS实例分析》PPT课件.ppt_第5页
第5页 / 共99页
点击查看更多>>
资源描述

《《SPSS实例分析》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《SPSS实例分析》PPT课件.ppt(99页珍藏版)》请在三一办公上搜索。

1、SPSS软件例题分析,80/20规则在SPSS的使用中同样有效,以Analyze菜单为例,其中最常用的子菜单为:Discriptive Statistics Compare Means General Linear Model(第一项)Correlate Regression(前半截),SPSS软件界面,查阅变量,Data Reduction数据变换,Report报告,Compare Means平均数比较,Descriptive Statistics描述性统计分析,General Linear Model一般线性模型,Correlate相关分析,Regression回归分析,Loglinear

2、对数线性模型,Classify分类,Survival生存分析,Nonparametric Tests非参数检验,查阅数据,t,SPSS的主菜单菜单栏共有9个选项:1、File:文件管理菜单(文件调入、存储、显示和打印等)2、Edit:编辑菜单(文本内容的选择、拷贝、剪贴、寻找和替换等)3、Data:数据管理菜单(数据变量定义、数据格式选定、观察对象 的选择、排序、加权、数据文件的转换、连接、汇总等)4、Transform:数据转换处理菜单(数值的计算、重新赋值、缺失值替代等)5、Statistics:统计菜单(统计方法)6、Graphs:作图菜单(统计图的制作)7、Utilities:用户选项

3、菜单(命令解释、字体选择、文件信息、定义 输出标题、窗口设计等)8、Windows:窗口管理菜单(窗口排列、选择、显示)9、Help:求助菜单,第一章 SPSS概览,1.1 数据的输入和保存,例1.1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下,问该地急性克山病患者与健康人的血磷值是否不同?患者:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11健康人:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87,具体工作流程如下:1.将数

4、据输入SPSS。2.进行必要的预分析(分布图、均数标准差的描述等),以确定应采用的检验方法。3.按题目要求进行统计分析。4.保存和导出分析结果。下面就按这几步依次讲解。,1.1 数据的输入和保存,1.1.1 SPSS的界面,1.1.2 定义变量,该资料是定量资料,设计为成组设计,因此我们需要建立两个变量,一个变量代表血磷值,习惯上取名为X,另一个变量代表观察对象是健康人还是克山病人,习惯上取名为GROUP。,建立X变量,1.1.3 输入数据,先来输入变量X的值,1.1.4 保存数据,支持数据类型:DBF、FoxPro、EXCEL、ACCESS,1.2 数据的预分析,选择“分析”=“描述统计”=

5、“描述”菜单,我们以上的做法对吗?当然有问题!光看总的描述是不够的,还应当看看分组的描述情况。这里要用到文件分割功能,请切换回数据管理窗口,选择Data=Split File菜单,系统弹出文件分割对话框如下:,1.2.2 绘制直方图,统计指标只能给出数据的大致情况,没有直方图那样直观,画直方图,选择Graphs=Histogram,系统会弹出绘制直方图对话框如下:,将变量X选入Variable选择框内,单击OK按钮。此时结果浏览窗口内会绘制出如下两个直方图:,两组的数据没有特别偏的分布,也没有十分突出的离群值,因此无须变换,可以直接采用参数分析方法来分析。综合设计类型,最终确定采用成组设计两样

6、本均数比较的t检验来分析。最后,还要取消变量分割,免得它影响以后的统计分析,再次调出变量分割对话框,选择单选按钮中的“Analyze all cases,do not create group”,单击OK按钮就可以了。,1.3 按题目要求进行统计分析,下面用SPSS来做成组设计两样本均数比较的t检验,选择Analyze=Compare Means=Independent-Samples T test,系统弹出两样本t检验对话框如下:,将变量X选入test框内,变量group选入grouping框内,注意这时下面的Define Groups按钮变黑,表示该按钮可用,单击它,系统弹出比较组定义对话

7、框如右图所示:该对话框用于定义是哪两组相比,在两个group框内分别输入1和2,表明是变量group取值为1和2的两组相比。然后单击Continue按钮,再单击OK按钮,系统经过计算后会弹出结果浏览窗口,首先给出的是两组的基本情况描述,如样本量、均数等,然后是t检验的结果如下:,Independent Samples Test,可见该结果分为两大部分:第一部分为Levenes方差齐性检验,用于判断两总体方差是否齐,这里的检验结果为F=0.032,p=0.860,可见在本例中方差是齐的;第二部分则分别给出两组所在总体方差齐和方差不齐时的t检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应

8、选用方差齐时的t检验结果,即上面一行列出的t=2.524,=22,p=0.019。从而最终的统计结论为按=0.05水准,拒绝H0,认为克山病患者与健康人的血磷值不同,从样本均数来看,可认为克山病患者的血磷值较高。,1.4 保存和导出分析结果,1.4.1 保存结果文件三种办法:需要结果的时候再运行一次分析程序。用笔将结果抄在纸上。直接保存结果文件。方便快捷的是第三种,在结果浏览窗口中(注意:一定要在结果浏览窗口中)选择菜单File=Save,由于该结果也从来没有被保存过,所以弹出和前面保存数据时极为相似的一个Save as对话框,和前面相比,唯一的区别就是文件的保存类型只有View Files(

9、*.spo)一种。在文件名框中键入“Li1_1”并回车,该结果文件就会按文件名Li1_1.spo被存储。,1.4.2 导出分析结果,SPSS提供纯文本格式功能,在结果浏览窗口中选择菜单File=Export,系统会弹出Export Output对话框如下:,第二章 描述性统计分析,Frequencies过程,第三章 均数间的比较,3.1Means过程 和上一章所讲述的几个专门的描述过程相比,Means过程的优势在于各组的描述指标被放在一起便于相互比较,并且如果需要,可以直接输出比较结果,无须再次调用其他过程。显然要方便的多。,分组平均数比较的含义 当一个变量为定类变量,另一变量为定距变量时,两

10、变量间是否有关,通常以分组平均数比较的方法来考察。即按照定类变量的不同水平来分组,看每个分组的定距变量的平均数是否有差异。不同组间的平均数差异越小,两个变量间的关系越弱;相反,平均数差异越大,变量间关系越强。,性别与四级英语考试通过率的相关统计,表述:统计结果显示,当性别取值不同时,通过率变量的取值并未发生变化,因此性别与考试通过率无关。自变量的不同取值在因变量上无差异,两变量无关。自变量的不同取值在因变量上有差异,两变量有关。,界面说明【Dependent List框】用于选入需要分析的变量。【Independent List框】用于选入分组变量。【Options钮】弹出Options对话框

11、,选择需要计算的描述统计量和统计分析:,Statistics框 可选的描述统计量。它们是:sum,number of cases 总和,记录数mean,geometric mean,harmonic mean 均数,几何均数,修正均数standard deviation,variance,standard error of the mean 标准差,均数的标准误,方差median,grouped median 中位数minimum,maximum,range 最小值,最大值,全距kurtosis,standard error of kurtosis 峰度系数,峰度系数的标准误skewness,

12、standard error of skewness 偏度系数,偏度系数的标准误percentage of total sum,percentage of total N 总和的百分比,样本例数的百分比,结果解释,以第一章的数据为例,输出如下:,3.2Independent-Samples T Test过程Independent-Samples T Test过程用于进行两样本均数的比较,即常用的两样本t检验。,结果解释要检验克山病患者与健康人的血磷值是否相同,用Independent-Samples T Test 过程的结果输出如下:T-Test,可见该结果分为两大部分:第一部分为Levene

13、s方差齐性检验,用于判断两总体方差是否齐,这里的戒严结果为F=0.032,P=0.860,可见在本例中方差是齐的;第二部分则分别给出两组所在总体方差齐和方差不齐时的t检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的t检验结果,即上面一行列出的t=2.524,=22,P=0.019。从而最终的统计结论为按=0.05水准,拒绝H0,认为克山病患者与健康人的血磷值不同,从样本均数来看,可认为克山病患者的血磷值较高。最后面还附有一些其他指标,如两组均数的可信区间等,以对差异情况有更直观的了解。,上表的标题内容翻译如下:,3.3One-Way ANOVA过程 One-Way AN

14、OVA过程用于进行两组及多组样本均数的比较,即成组设计的方差分析,如果做了相应选择,还可进行随后的两两比较,甚至于在各组间精确设定哪几组和哪几组进行比较,在本章的内容中,是最为复杂的一个。,ANalysis Of VAriance,F统计的原理 F统计的目的是分析分组的平均数是否相等。如果相等,说明组间没有差别;如果不相等,说明组间平均数有差异,这时分组是有效的。但F统计独特的地方是,它并不直接利用平均数来比较,而是利用与方差有关的统计指标总变差(SST)、组间变差(SSB)、组内变差(SSW)的关系来进行判别。,界面说明,分析实例例 用低、中、高水平的生长素处理牧草根系,测定处理后的根系长度

15、,问3组根长有无差别?,低 中 高,Oneway,上面给出了单因素方差分析的结果,可见F=84.544,P0.001。因此可认为3组根长不同。翻译如下:,上表是用S-N-K法进行两两比较的结果,简单的说,在表格的纵向上各组均数按大小排序,然后在表格的横向上被分成了若干个亚组,不同亚组间的P值小于0.05,而同一亚组内的各组均数比较的P值则大于0.05。从上表可见,高、中和低被分在了三个不同的亚组中,因此三组间两两比较均有差异;由于各个亚组均只有1个组别进入,因此最下方的组内两两比较P值均为1.000(自己和自己比较,当然绝对不会有差异了)。,例1:通过重复小区的牧草生长量的比较,从8个苜蓿品种

16、无性系中选优,考虑到试验地土质差异,而将整个试验区划分成4个区组(即4个重复),每一区组分成8个小区,每一小区是一个处理,各区组的小区排列是随机的,其设计图式及试验结果如图:,为了进行方差分析,将所取得的各无性系重复小区的生长数据列下表1,并计算其有关数值见表2-1、表2-2。表2-1,表2-2,解()作统计假设假设八个无性系在各小区的生长均无显著差异。(2)计算离差平方和 SS内=SS总SS间=0.00600,列方差分析表 表2-3(4)结论:小概率事件出现,推翻假设,即八个无性系之间的生长量有显著差异。上面进行的方差分析只得出八个无性系之间的生长量有着显著的差异,但究竟这些无性系品种相互之

17、间生长量哪些有显著差异,现在还需要进行检验。下面按各平均数的大小顺序排列,列表2-4进行比较。,结论:无性系中3与4,与1,3与2,5与1,5与2;6与4,6与1,6与2;7与4,7与1均有显著差异。即无性系中3,5,6和7号品种均可以95%的可靠性选用,其他不宜选用。上面是对试验结果作的单因素方差分析,随机区组试验的结果还可以用双因素方差分析的方法进行分析。其中一因素即问题所研究的因素无性系的生长量,另一因素为区组条件。双因素方差分析可以判断这两个因素各水平间的差异显著程度。如果区组之间无显著差异。说明各区组条件相似。否则,只有用随机区组设计,借助于双因素方差分析把区组间差异撇除,才可能真正

18、弄清楚所研究的各处理间的差异显著性,克服区组间差异的干扰。,表2-4,例2:对上例我们用双因素方差分析的方法进行分析。统计假设是一样的。在离差平方和的计算中多一项区组间离差平方和。SS总=0.03435(同前)SSA=0.02835,(SSA表示品种间的离差平方和也同前)=0.0034,(SSe表示误差项平方和)自由度 f总=km-1=48-1=31 fA=m-1=8-1=7 fB=K-1=4-1=3 fC=f总-fA-fB=31-7-3=21列方差分析表 2-5,表2-5 结论:FAFa FBFa表明无性系品种与区组对生长量均有显著影响,品种的差异显著性与单因素方差分析是一致的,但在单因素方

19、差分析中假定了区组条件基本一致,而用双因素方差分析方法分析的结果,区组的差异也显著,这表明虽然采取了随机区组设计,但在土壤条件方面差异并没有被完全克服。若用单因素方差分析则不能发现这一问题,用双因素方差分析的优点也就在于此。关于具体信息测验部分与单因素方差分析是相同的。,第四章 一般线性模型,Univariate子菜单:单变量方差分析。Multivariate子菜单:多变量方差分析。Repeated Measures子菜单:重复测量数据的分析。Variance Components子菜单:用于作方差成份模型。,4.1两因素方差分析,例 对小白鼠喂以A、B、C三种不同配方的食物,目的是了解不同食

20、物增重的效果。采用随机区组设计方法,以窝别作为划分区组的特征,以消除遗传因素对体重增长的影响。现将同品系同体重的24只小白鼠分为8个区组,每个区组3只小白鼠。三周后体重增量结果(克)列于下表,问小白鼠经三种不同食物喂养后所增体重有无差别?,weight,foodgroup,单击【Model钮】后出现一个对话框,用于设置在模型中包含哪些主效应和交互因子,默认情况为Full factorial,即分析所有的主效应和交互作用。我们这里没有交互作用可分析,所以要改一下,否则将作不出结果来。将按钮切换到右侧的custom,这时中部的Build Term下拉列表框就变黑可用,该框用于选择进入模型的因素交互

21、作用级别,即是分析主效应、两阶交互、三阶交互、还是全部分析。这里我们只能分析主效应:选择main,再用黑色箭头将group和food选入右侧的model框中,如果对这段叙述不太清楚,请参考下面的动画。,首先是所用方差分析模型的检验,F值为11.517,P小于0.05,因此所用的模型有统计学意义,可以用它来判断模型中系数有无统计学意义;第二行是截距,它在我们的分析中没有实际意义,忽略即可;第三行是变量GROUP,可见它也有统计学意义,不过我们关心的也不是他;第四行是我们真正要分析的FOOD,非常遗憾,它的P值为0.084,结论是:尚不能认为三种配方喂养的小白鼠体重增量有差别。,Post Hoc

22、TestsFOODHomogeneous Subsets,这是两两比较的结果,方法为SNK法,由于前面总的比较无差异,所以这里三种食物均在一个亚组内,检验无差异,P值为0.121,可能有用的几个问题:需要分析的影响因素可以都选入fixed factor框,如果不是复杂的模型,一般分析结果不会有误。方差分析模型多数情况下要选model III,但这在数据存在缺失值、设计不平衡等情况下要慎重考虑,因为此时往往会要求模型进行详细的设置。,model的设置对分析是非常重要的,如果设置不正确,可能什么都做不出来,比如无重复数据的方差分析纳入了交互作用、析因设计的方差分析纳入了设计中不存在的因素,就会做不

23、出结果。一般线性模型的复杂性是较高的,一旦存在有疑问的内容,一定要查阅有关统计书籍,并在必要时请教专业统计分析人员。,4.4多元方差分析 所谓的多元方差分析,就是说存在着不止一个因变量,而是两个以上的因变量共同反映了自变量的影响程度。比如要研究某些因素对牧草生长的影响程度,则高度、产量等都可以作为生长状况的测量因子,即都应作为因变量。,4.5重复测量的方差分析 重复测量的方差分析指的是一个应变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。,Repeated measures对话框界面说明 实际上,如果对普通方差分析模

24、型作出正确的设置,两者的分析结果是完全相同的,即都正确,那么,重复测量的方差分析过程有何优势呢?我们通过下面的例子来看看:,第五章 相关分析,相关(Correlation)是用来作两个变量关系的统计分析,考察两变量是否存在共同变化的趋势。两变量共同变化的趋势在统计中用共变异数(Covariance)来表示。即A变量的取值从低到高(或从高到低)变化时,B变量是否也同样发生变化。当两变量在同一方向上变化,称为有正相关;相反方向变化,称为负相关;无变化即无相关。相关系数即用来表示相关的程度。,SPSS的相关分析功能被集中在Statistics菜单的Correlate子菜单中,包括以下三个过程:Biv

25、ariate过程此过程用于进行两个/多个变量间的参数/非参数相关分析,如果是多个变量,则给出两两相关的分析结果。这是Correlate子菜单中最为常用的一个过程,实际占相关分析的95%以上。,Partial过程如果需要进行相关分析的两个变量其取值均受到其他变量的影响,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数,这种分析思想和协方差分析非常类似。Partial过程就是专门进行偏相关分析的。Distances过程调用此过程可对同一变量内部各观察单位间的数值或各个不同变量间进行距离相关分析,前者可用于检测观测值的接近程度,后者则常用于考察预测值对实际值的拟合优度。该过程在实际应用中用的非常少。,Bivariate过程,界面说明,产量高度,第六章:多元线性回归,回归的含义:回归(Regression,或Linear Regression)和相关同样都用来分析两个变量间的关系,但回归有明确的因果关系假设。即要假设一个变量为自变量,一个为因变量,自变量对因变量的影响就用回归表示。如年龄对收入的影响。由于回归构建了变量间因果关系的数学表达,它具有统计预测功能。,例测得10名3岁儿童的身高(cm)、体重(kg)和体表面积(cm2)资料如下。试用多元回归方法确定以身高、体重为自变量,体表面积为因变量的回归方程。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号