[教育学]Ch6SPSS数值统计分析选讲ppt课件.ppt

上传人:小飞机 文档编号:2047535 上传时间:2023-01-03 格式:PPT 页数:55 大小:901KB
返回 下载 相关 举报
[教育学]Ch6SPSS数值统计分析选讲ppt课件.ppt_第1页
第1页 / 共55页
[教育学]Ch6SPSS数值统计分析选讲ppt课件.ppt_第2页
第2页 / 共55页
[教育学]Ch6SPSS数值统计分析选讲ppt课件.ppt_第3页
第3页 / 共55页
[教育学]Ch6SPSS数值统计分析选讲ppt课件.ppt_第4页
第4页 / 共55页
[教育学]Ch6SPSS数值统计分析选讲ppt课件.ppt_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《[教育学]Ch6SPSS数值统计分析选讲ppt课件.ppt》由会员分享,可在线阅读,更多相关《[教育学]Ch6SPSS数值统计分析选讲ppt课件.ppt(55页珍藏版)》请在三一办公上搜索。

1、第6章 SPSS数值统计分析选讲,刘明祥,信息技术与传播学院,2,1 假设检验的基本思想,基本思想在统计推断中,首先解决的一个工作是进行参数估计的问题,但是,在经过参数估计之后,需要对估计得到的参数进行检验。这就是假设检验的内容了。假设检验的内容主要是关于在做出推论估计之后,对所估计的内容进行检验,在统计上确定所得到的估计是否是统计显著的。,3,1 假设检验的基本思想,基本思想某学校某年级男生千米跑的成绩均值为3 min 50s,两个月前来了一名新的长跑教练,经过两个月的教学训练之后,从中随机抽测了10名男生的千米跑成绩,得到其样本均值为3 min 30s,标准差为20 s。问题是:新教练的训

2、练方法是否使男生的千米跑成绩发生了改变?从某培训班中随机抽取两个小组,实验组使用新的教学方法,对照组使用传统的教学方法,后期统一测验成绩,实验组为84、78、85、76、88、75、85、93、76、89;对照组为80、79、87、71、68、82、76、91、79、68。问题是:新的教学方法是否优于传统教学方法?,4,1 假设检验的基本思想,基本思想在假设检验中,通常把所做的那个需要检验是否为真的假设H0称为原建设。如H0:a=230或H0:a1a2。如果原假设是关于总体参数的,则称它为参数假设,相应的检验则称为参数检验;如果原假设H0是关于总体分布类型的,则称它为分布假设,检验分布假设的问

3、题,称为分布检验(或称为非参数检验)。,5,1 假设检验的基本思想,基本思想衡量一个事件发生与否可能性的标准用概率大小来表示,通常概率大的事件容易发生,概率小的事件不容易发生。将概率很小,如P0.05的事件称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,因此如果只进行一次试验的话,可以看做不发生。,6,1 假设检验的基本思想,基本思想假设检验的基本思想是统计学的“小概率反证法”原理:对于一个小概率事件来说,其对立面发生的可能性显然要大大高于这一小概率事件,可以认为小概率事件在一次试验中不应当发生。因此可以首先假定需要考察的假设是成立的,然后基于此进行推导,来计算一下在该假设所代表

4、的总体中进行抽样研究,得到当前样本的概率是多少。如果结果显示这是一个小概率事件,则意味着如果假设是成立的,则在一次抽样研究中竟然发生了小概率事件!这显然违反了小概率原理,因此可以按照反证法的思路推翻所给的假设,认为它们实际上是不成立的,这就是小概率反证法原理。,7,1 假设检验的基本思想,基本思想在一个袋子中装有红、白两种颜色的球共100个,有人说这100个球中只有一个是红球,其余99个都是白色球。问这种说法是否成立?建立假设,P233,8,1 假设检验的基本思想,假设检验的两类错误假设检验的依据是“小概率事件在一次试验中不会发生”,然后小概率事件并非是不可能发生的事件(只是它不是经常发生),

5、我们并不能完全排斥它发生的可能性,因而假设检验的结果就有可能出现错误,按照错误发生的不同情况可分为两类错误。第一类错误:原假设H0实际上是正确的,但由于抽样误差的原因,或者说恰好发生了小概率事件的原因,使得我们错误的拒绝了它,从而犯了“弃真”的错误,统计学上称它为“第一类错误”。犯第一类错误的概率即统计检验水准。,9,1 假设检验的基本思想,假设检验的两类错误第二类错误:原假设H0实际上是不正确的,但由于抽样误差的原因,检验中得到的P值大于检验水准,使得我们未能拒绝H0,从而犯了“存伪”的错误,统计学上称它为“第二类错误”,用字母 表示。若 小,则 就会增大;或 小,则 就会增大。理论上可以证

6、明,当样本容量增大时才能使犯两类错误的概率都减小。,10,1 假设检验的基本思想,假设检验的两类错误统计检验可能出现两种结果:第一,拒绝原假设,接受备选假设;第二,根据现有证据无法拒绝原假设。无法拒绝也无法确定原假设是否真实,得到一个摸棱两可的结果。只有拒绝H0的结论才是统计上有明确意义的结果。因此,应将不希望出现的情况列为原假设,而将希望得到的结论设为备选假设,然后统计检验拒绝原假设,从而接受备选假设。,11,1 假设检验的基本思想,假设检验中的其他问题若备选假设以单方向形式描述的,则此检验为单尾检验one-tailed test,若要检验假设是否发生了变化,但是并不是非常清楚的了解发生变化

7、的方向,就要用双尾检验two-tailed test。从专业知识的角度来判断是单尾检验还是双尾检验,一般来说双尾检验更加保守和稳妥一些。假设检验还分为参数检验和非参数检验。通常参数检验是已知相关数据分布形式基础上,要了解相应参数取值时的检验形式。,12,2 正态分布的检验,正态分布在SPSS中,正态分布的考察方法有:通过计算偏度系数和峰度系数加以考察;通过绘制直方图等图形工具来考察;也可以通过进行各种假设检验。最常用的对于正态分布的检验是K-S单样本检验。,13,2 正态分布的检验,K-S检验K-S检验是一种分布拟合优度的检验,其方法是将一个变量的累积分布函数与特定分布进行比较。用Ai表示理论

8、分布每个类别的累积相对频数,Oi表示样本频数的相应值,K-S检验是以Ai和Oi的绝对差异为基础的,其检验统计量为:,则若原假设成立,则每次抽样研究中所得到的K值应当不会偏离O太远,如果K值越大,说明基于原假设得到当前样本的可能性就越小,就越有可能判断H0为错误。通常可以直接应用K-S检验来对样本数据进行正态分布的检验。但是,通常的做法是对样本数据进行图形描述,图形可以给分析着一个直观的印象。,14,2 正态分布的检验,K-S检验某零售商希望了解其销售收益revenue的大致分布情况,依据其他销售商已有的资料,他认为其销售收益可能服从正态分布,为了检验其假设,考虑是否与其他零售商一样,销售收益服

9、从正态分布,收集到相关的销售收益数据sales.sav中。请使用SPSS软件分析样本数据是否服从正态分布。,K值:正向为0.019,负向为0.010,绝对值最大为0.019。统计量Z值为0.750,相应的显著性水平为0.627,若正态分布的假设成立,则从一个正态分布的总体中按照现有样本量抽样,则平均每100次中会有62.7次得到实际数据与理论分布之间的差值K等于甚至大于现有样本的K值0.019。因此不能拒绝样本数据,即该厂商的销售收益服从正态分布。,15,3 二项分布检验,简介二项分布检验Binomial Test是对二分类变量的拟合优度检验,它考察每个类别中观察值的频数与特定二项分布下的预期

10、频数间是否存在统计学差异。对于一个服从二项分布的随机变量而言,在n次试验中结局A出现的次数X的概率分布为:,16,3 二项分布检验,简介使用上述公式,可以算出基于原假设时各发生次数的出现概率,利用小概率反证法,按照和K-S检验中类似的逻辑做出相应的检验结论。根据经验,新生儿染色体异常率一般为1%,某医院观察了当地共400名新生儿,只发现一例染色体异常,数据见binom.sav,该地新生儿染色体异常率是否低于一般水平?,检验假设H0:=0.01,该地新生儿染色体异常率并无不同。H1:0.01,该地新生儿染色体异常率低于一般。因不存在传染性,新生儿染色体是否异常可以认为是服从二项分布的,,单侧概率

11、P=0.1050.05,而这里默认的小概率事件水准为0.05,因此在400名新生儿中出现一例染色体异常,甚至于一例也没有的情形并非小概率事件,因此不能拒绝原假设,尚不能认为异常率低于一般。,17,4 连续变量的t检验,简介在针对连续变量的统计推断方法中,最常用的有t检验和方差分析两种。其中t检验是最基本的检验方法。假设已知一个正态分布的总体N(,2),现从中进行抽样研究,每次抽样的样本量固定为n,这样对每一个样本都计算其均数X。由于这种抽样可进行无限多次,这些样本均数就会构成一个分布。统计学家发现,该分布正好就是正态分布N(,2/n)。,18,4 连续变量的t检验,简介也就是说,样本均数所在分

12、布的中心位置和原数据分布中心位置相同,而其标准差则为/,通常将样本均数的标准差称为标准误。此为中心极限定理。利用t分布规律可进行t检验。,19,4 连续变量的t检验,单一样本的t检验单一样本的t检验是一种关于总体均数的假设检验问题,此问题中只有一个随机抽取的样本,研究目的是推断这个样本相应的总体均数是否等于或大于或小于某个已知总体均数。如将过去某一年的某门平均成绩做为已知总体均数,来检验今年某门课程的成绩与过去成绩是否存在显著差异。Analyze-Compare Means-One-Sample T Test,20,4 连续变量的t检验,单一样本的t检验 某工厂用自动打包机打包,每包标准质量为

13、100Kg。为保证正常生产,每天开工后需先行试机,检查打包机是否有系统偏差,以及时进行调整。某日开工后在试机中共打了9个包,测得9包的质量Kg为:99.3、98.7、100.5、101.2、98.3、99.7、99.5、102.1、100.5请判断,打包机是否需要进行调整。,建立假设:H0:=0,打包机工作正常。H1:0,打包机工作不正常。=0.05,输入已知的总体均数,已知总体均数为100,t为-0.055,P为0.957,自由度df为8两均数的差值等信息。由于0.9570.05,因此不拒绝原假设,可认为打包机工作正常。,21,4 SPSS统计检验,t检验1 建立假设,即假定两个总体平均数之

14、间没有显著差异。2 计算统计量t的值,对于不同类型的问题选用不同的统计量计算方法。如果要判断一个总体中小样本平均数与总体平均值之间的差异程度,则t的计算公式为:,22,4 SPSS统计检验,t检验2 计算统计量t的值如果要判断两组样本平均数之间的差异程度,则t的计算公式为:,23,4 SPSS统计检验,t检验3 根据自由度df=n-1,查t值表,找出规定的t理论值并进行比较。理论值差异的显著水平为0.01级或0.05级。不同自由度的显著水平理论值记为t(df)0.01和t(df)0.054 比较计算得到的t值和理论t值,推断发生的概率,对显著性关系做出判断。,24,4 SPSS统计检验,t检验

15、4 t值比较,25,4 SPSS统计检验,t检验例13-6,某班有50人,随机抽取20人利用多媒体教学软件进行语文教学试验。在期终考试结束后,得知全班语文考试成绩如表所示,其中前20人为参加试验的学生成绩。试通过检验样本平均数与总体平均数之间的差异程序判断该实验的效果。小样本平均差异的显著性检验t检验,26,4 SPSS统计检验,t检验Analyze-Compare Means-One-Sample T Test,27,4 SPSS统计检验,t检验t检验的结果为t值、自由度df、双尾显著性概率sig、均值差异Mean Difference和均值差异的95%置信区间。查t值表可知,t(df)0.

16、05=t(19)0.05=2.093样本t=38.544t(19)0.05样本与总体之间存在显著差异,样本平均分高于总体平均分。,28,4 SPSS统计检验,T检验正常人脉搏平均数为72次/分,现测得15名患者的脉搏数据:71,55,76,68,72,69,56,70,79,67,58,77,63,66,78,试问这15名患者的脉搏与正常人的脉搏是否存在显著差异?此为单样本的T检验。,29,4 SPSS统计检验,T检验查t表,t(df)0.05=t(14)0.05=2.145实际t=-1.8360.05,所以差异不显著。,30,4 连续变量的t检验,独立样本的t检验独立样本T检验是指两个总体独

17、立,并且均数未知的检验。Analyze-Compare Means-Indepentdent-Sample T Test希望评价两位教师的教学质量,试比较其分别任教的甲、乙两班(设甲乙两班原成绩接近,不存在差别)考试后的成绩是否存在差异?数据见ttest.sav,可认为两个班级的成绩是两组独立的数据,建立假设如下:H0:1=2,两个班级成绩相同,两位任课教师的教学质量 不存在差别。H1:12,两个班级成绩不同,两位任课教师的教学质量 存在差别。差异显著性水平=0.05,第一部分为方差齐性检验结果,F=0.733,P=0.3970.05,可认为两样本所在总体的方差是齐的。则t为3.056,P=0

18、.0040.05,可以认为两个班级成绩不同,两位任课教师的教学质量有差别。,31,4 连续变量的t检验,独立样本的t检验在应用t检验进行两样本均数的比较时,要求数据满足以下三个条件:正态性,各个样本均来源于正态分布的总体;方差齐性,各个样本所在总体的方差相等;独立性,各观察值之间是相互独立的,不能相互影响。方差齐性检查,如果其所对应的P值小于设定的检验水准,则拒绝原假设,认为两组的方差不齐。,32,4 SPSS统计检验,T检验收集了某校30名学生的自信心值,数据如下,请问该指标是否与性别有关?此为独立样本的t检验。,33,4 SPSS统计检验,T检验由上图可知,方差齐性检验结果,P=0.845

19、0.05,可以认为方差相等,故取方差相等的检验结果,T检验结果,P=0.4630.05可以认为,差异不显著,即自信心值与性别无关。,34,4 SPSS统计检验,T检验配对样本的T检验,是指将同一水平的对象配成对子,然后随机分成两组或是一批对象自身对比的试验。如同一对象处理前后的数据;同一对象两个部位的数据;同一样品用两种方法检验的结果;两个对象分别接受两种处理后的数据等。Analyze-Compare Means-Paried-Sample T Test,35,4 SPSS统计检验,T检验将条件相近的学生配成对子,再随机分成两组,采用两种不同的训练方法进行训练,训练一个周期后,测得两组学生跳高

20、成绩如下,试问两种训练方法的效果是否相同?此为配对样本的T检验Paried-Sample T Test,36,4 SPSS统计检验,T检验检验结果,P=0.0060.01,差异非常显著,两种训练方法效果不同。配对样本的t检验实际上就是单一样本的t检验,等价于已知总体均数为0的情况。,37,4 SPSS统计检验,T检验用某药治疗10名高血压病人,对每一病人治疗前后的舒张压mmhg进行了测量,结果见pairedt.sav,请问该药有无降压作用?典型的配对样本的t检验。,P=0.027,可以认为使用该药会影响病人的血压。由于治疗前后的差值均数为正,故可推断该药使病人的血压下降,具有降压作用。,38,

21、4 SPSS中的均值比较与检验,Means过程分组计算指定变量的描述统计量,包括均值、标准差、总和、方差等。对Data11-01.sav,分性别和年龄统计身高和体重。,一次课程结束!,39,4 SPSS统计检验,方差分析方差分析是由费歇尔(R.A.Fisher)提出的,它与T检验相比优越之处在于可以同时检验多个平均数之间的差异,并且可以解释几个因素水平之间的相互作用。如教学效果受教法、教材、学生接受能力等诸多因素的影响,要研究这些因素对教学效果的影响程度、分析它们之间交互作用的大小,T检验方法就无能为力了,而方差分析为解决这类问题提供了一种有效的方法。,40,4 SPSS统计检验,方差分析方差

22、分析的基本功能就是对多组平均数差异的显著性进行检验。通过组间差异与组内差异比值的分析,来推断几个相应平均数差异的显著性,这就是方差分析的逻辑。方差分析分为单因素方差分析、多因素方差分析、协方差分析、多元方差分析、重复试验设计的方差分析与方差成分分析。,41,4 SPSS统计检验,方差分析因变量:试验中要观测的量,即所要考察的结果。因素:影响因变量的指标,也称为自变量。水平:因素在试验时所分的等级或因素的不同状态,可能是数量的,如年龄,也可能是分类的,如性别等。主效应:试验中由一个因素的不同水平引起的差异。简单效应:一个因素的水平在另一个因素的某个水平上的差异。处理效应:试验的总变异中由自变量引

23、起的差异,主效应、简单效应、交互作用均为处理效应。,42,4 SPSS统计检验,方差分析交互作用:当一个因素的水平在另一个因素的不同水平上变化趋势不一致时,称两个因素之间存在着交互作用。或者:若一个因素A对因变量的影响与另一个因素B取什么水平有关,就称因素A与因素B之间存在交互作用,即除了因素A与B单独的作用外,它们的不同水平的组合对因变量产生的作用。当两个因素A与B之间的交互作用的方差很小、比误差项的方差还小时,可以认为A与B之间无交互作用,相应的平方和只不过是误差的一种反映,可将该项与误差项合并,相应的自由度也合并,以提高分析的精度。,43,4 SPSS统计检验,方差分析基本假设1 总体服

24、从正态分布2 变异的同质性,即各个组的变异是相等的:以两个总体为例,则 一般情况下无差异。3 独立性:试验中一个被试的观测值应独立于其他被试的观测值。即方差必须是齐的,进行方差齐性检验。,44,4 SPSS统计检验,方差分析基本假设样本含量n应适当大一些,最好在30人以上。最简单的情况是单因素方差分析。对于影响一个因变量的众多因素,若仅使一个因素发生变化,而其它因素则保持不变或控制在一定范围内,分析这一因素对因变量的影响是否显著,属于单因素方差分析。Analyze-Compare Means-One-Way ANOVA,45,4 SPSS统计检验,方差分析对于大学新生的入学成绩,可通过t检验来

25、考察男女学生间的入学成绩是否有差异。但若想知道来自江苏、四川、山东、安徽、上海等省份的学生,其入学成绩是否有差异?在田间试验时,科研人员将田地分成多块,分别在每一块上进行试验,要比较多块之间的农作物生长情况?实际上是:在单一处理因素之下,多个不同水平之间的连续性观察值的比较,目的是通过对多个样本的研究,来判断这些样本是否来自于同一总体。,46,4 SPSS统计检验,方差分析多个均数比较时,不能采用t检验作两两比较。R A Fisher提出:将总变异分解为由研究因素所造成的部分和由抽样误差所造成的部分,通过比较来自于不同部分的变异,借助F分布做出统计推断。,47,4 SPSS统计检验,方差分析单

26、因素方差分析所解决的是一个因素Factor之下的多个不同水平level之间的关系问题。一般来说,这个因素应是名义尺度的nominal scaled,用该变量的不同取值代表不同水平。现希望比较美国、日本、欧洲的汽车,考察其每千米耗油量有无差异。若为两个因素水平,则为t检验,但现在是三个因素水平。,48,4 SPSS统计检验,方差分析预分析:Means过程来检验方差齐性:标准差相差不大。通过直方图来考察正态性。One-Way ANOVA进行单因素方差分析,不同产地的汽车耗油量不同,49,4 SPSS统计检验,方差分析多重比较,汽车有差异,但日欧的汽车差异不明显,50,4 SPSS统计检验,方差分析

27、各组均数的精细比较前面所讲的多重比较实际上可以归结为对均数的线性组织L=a1u1+a2u2+a3u3的假设检验,其中a1、a2、a3是指定的常数。若a1、a2、a3分别为1、-1、0,则L=u1-u2。若对假设L=0进行检验,则等价于第一组和第二组均数是否相等的两两检验。通过指定系数的方法可以进行均数间的精细比较。,51,4 SPSS统计检验,例:要比较4种强心剂的毒性。将其注入实验鼠内,记录导致死亡时的剂量,每种药物各进行了10次试验,结果见guineapig.sav。计算,52,4 SPSS统计检验,通过contrast指定系数,假设不成立,即第一种药物的效果并不相当于后三种药物的效果的平

28、均。,53,4 SPSS统计检验,通过contrast指定系数要比较美产与日产汽车、日产与欧产汽车的MPG,可通过定义系数的方式来实现。定义系数1、-1、0和定义系数0,-1,-1,54,4 SPSS统计检验,单因素方差分析要求资料满足正态性、独立性和方差齐性的要求。单因素方差分析针对的是多组均数间的比较。方差分析拒绝原假设只能说明各组之间存在差异,但并不足以说明各组之间的关系。利用多重比较可以初步判断各组间的关系。这实际上是单因变量单因素方差分析。也可通过下面的Univariate过程实现。,55,5 单因变量多因素方差分析,例某超市将同一种商品采用3种不同包装(因素B)放在3个不同货架(因素A)上做销售试验,该商品连续卖了3天。现考察不同包装、货架及其交互作用对商品销售量的影响。salesAB.savAnalyze-General Linear Model-Univariate命令,进行单因素变量、多因素方差分析。若指定了协变量,则进行协方差分析。,方差齐性检验结果,0.676,方差是齐的。,不同的交互作用对销售是有影响的。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号