《均值比较与检验ppt课件.ppt》由会员分享,可在线阅读,更多相关《均值比较与检验ppt课件.ppt(51页珍藏版)》请在三一办公上搜索。
1、,主要内容,5.1 统计推断与假设检验5.2 Means过程5.3 单样本T检验5.4 两独立样本T检验5.5 两配对样本T检验,5.1 统计推断与假设检验,1、参数检验利用样本数据对总体特征的推断通常有两种情况:(1)当总体分布已知(如总体为正态分布)的情况下,对总体包含的参数进行推断的问题称为参数检验;(2)当总体分布未知的情况下,根据样本数据对总体的分布形式或特征进行推断,通常采用的统计推断方法是非参数检验方法。,5.1 统计推断与假设检验,1、参数检验,均值比较(Means),用于计算指定变量的综合描述统计量;,单样本T检验(One-Sample T Test),检验单个变量的均值与假
2、设检验值之间是否存在差异;,独立样本T检验(Independent Sample T Test),用于检验两组来自独立总体的样本,其独立总体的均值或中心位置是否一样;,配对样本T检验(Paired-Sample T Test),用于检验两个相关的样本是否来自具有相同均值的总体。,Compare Means子菜单,5.1 统计推断与假设检验,2、假设检验的几个概念(1)统计假设原假设:在很多情况下,我们给出一个统计假设仅仅是为了拒绝它。例如,如果我们要判断给定的一枚硬币是否均匀,则我们假设硬币是均匀的(即p=0.5,其中p是正面出现的概率)类似地,如果我们要判断一种方法是否优于其他的方法,则我们
3、假设两种方法之间没有差异。这样的假设通常称为零假设或原假设,记为备择假设:任何不同于零假设的假设都称为备择假设。例如,如果零假设是,则备择假设是。备择假设记为。,5.1 统计推断与假设检验,2、假设检验的几个概念(2)假设检验的两类错误第一类错误:在假设检验中拒绝了本来是正确的零假设,称为“弃真”错误。第二类错误:在假设检验中没有拒绝本来是错误的零假设,称为“取伪”错误。,5.1 统计推断与假设检验,2、假设检验的几个概念(3)显著性水平 在作假设检验时,我们犯第一类错误的最大概率称为检验的显著性水平。这个概率常记为,通常抽样前就指定好,这样得到的结果才不会影响我们的选择。在实际问题中,显著性
4、水平可以有多种选择,但最为普通的是0.05或0.01。例如,如果设计一个决策法则选择的显著性水平是0.05(5%),那么在100次中可能有5次机会使我们拒绝本该接受的假设。也就是说,我们大约有95%的把握作出正确的决策。此时,我们说拒绝假设的显著性水平为0.05,即犯拒绝本应接受的假设这类错误的概率是0.05。,5.1 统计推断与假设检验,2、假设检验的几个概念(4)概率p值 p值是当零假设正确时,观测到的样本信息出现的概率。如果这个概率很小,以至于几乎不可能在零假设正确时出现目前的观测数据时,我们就拒绝零假设。p值越小,拒绝零假设的理由就越充分。但怎样的p值才算“小”呢?通常是与预先设定的显
5、著性水平 值比较,若 值为0.05,p值小于0.05则认为该概率值足够小,应拒绝零假设。,5.1 统计推断与假设检验,3、假设检验的基本步骤第1步 给出检验问题的原假设;根据检验问题的要求,将需要检验的最终结果作为零假设。例如,需要检验某学校的高考数学平均成绩是否同往年的平均成绩一样,都为75,由此可做出零假设,第2步 选择检验统计量;在统计推断中,总是通过构造样本的统计量并计算统计量的概率值进行推断,一般构造的统计量应服从或近似服从常用的已知分布,例如均值检验中最常用的t分布和F分布等。,5.1 统计推断与假设检验,3、假设检验的基本步骤第3步 计算检验统计量的观测值及其发生的概率值;在给定
6、零假设前提下,计算统计量的观测值和相应概率p值。概率p值就是在零假设 成立时检验统计量的观测值发生的概率,该概率值间接地给出了样本值在零假设成立的前提下的概率,对此可以依据一定的标准来判断其发生的概率是否为小概率。第4步 在给定显著性水平条件下,做出统计推断结果。这里的显著性水平指的是当假设正确时被拒绝的概率,即弃真概率,一般取0.01或0.05。当检验统计量的概率p值小于显著性水平时,则认为此时拒绝零假设而犯弃真错误的概率小于显著性水平,即低于预先给定的水平,也就是说犯错误的概率小到我们能容忍的范围,这时可以拒绝零假设;反之,如果检验统计量的概率p值大于显著性水平,如果拒绝零假设,犯弃真错误
7、的概率大于预先给定的容忍水平,这时不应该拒绝零假设。,主要内容,5.1 统计推断与假设检验5.2 Means过程5.3 单样本T检验5.4 两独立样本T检验5.5 两配对样本T检验,5.2 Means过程,1、Means过程的主要功能 Means过程即均值过程,其主要功能是分组计算,比较指定变量的描述性统计量包括均值、标准差、总和、观测量数、方差等一系列单变量描述性统计量,还可以给出方差分析表和线性检验结果。均值过程中系统默认的描述统计量可按分组给出指定变量的均值、标准差、观测量数等,对话框中的选项可以给出其他更加丰富的描述统计量。,5.2 Means过程,2、Means过程的操作界面,选择待
8、分析的变量。,在该选项组中定义分组变量,主要包括以下几项:Independent List文本框:选择分组变量。可定义多层分组变量,每层分组变量中也可以有多个变量;Previous按钮:选择前一层的分组变量;Next按钮:选择下一层的分组变量。,单击该按钮,弹出如图5-2所示的options子对话框。,图5-1,5.2 Means过程,2、Means过程的操作界面,图5-2 Option 按钮,Statistics文本框:在该文本框中列出可以选择的描述性统计量,这些统计量的具体含义同描述性统计分析中的统计量含义一样。,Cell Statistics文本框:列出要输出的统计量。默认输出Mean(
9、均值)、Number of Cases(观测量数)和Standard Deviation(标准差);,Statistics for First Layer选项组:该选项组定义是否进行分组第一层变量的方差分析(Anova table and eta)和线性检验(Test for linearity)。,5.2 Means过程,3、实例分析【例5-1】表5.1是各地区分性别受教育程度的人口数量,利用均值过程比较受教育程度是否受性别的影响。,5.2 Means过程,3、实例分析第1步 数据组织;根据表5.1生成SPSS数据文件,建3个变量:“sex”、“edu”、“num”,数据文件的部分数据如图5
10、-3所示。,图5-3,5.2 Means过程,3、实例分析第2步 打开主对话框;选择Analyze Compare Means Means,打开同图5-1一样的均值过程主对话框。第3步 确定要进行均值比较的变量;在图5-1的对话框中,从左边的候选变量列表框中选择“人口数量(num)”变量,移入Dependent List文本框中,表示对该变量进行均值比较分析。第4步 确定分组变量;分组变量可以有几层,选择“性别(sex)”变量作为第一层分组变量,将其移入Independent List文本框中。,5.2 Means过程,3、实例分析第5步 确定输出的统计量;单击图5-1上的Options按钮,
11、弹出如图5-2所示的子对话框,选择Anova table and eta复选框,进行方差分析,单击Continue按钮,返回主对话框。,5.2 Means过程,3、实例分析结果分析,5.2 Means过程,3、实例分析结果分析,表5.4是性别的单因素方差分析,在下一章会详细介绍方差分析,此处不再详细讲述。表中的Sig.值远大于0.05,说明不同性别受教育的人口数量没有显著性差异。,5.2 Means过程,3、实例分析结果分析,表5.5是人口数量与性别的相关性度量表。此时的Eta和Eta Squared取值都很小,说明性别和受教育的人口数量的相关性很差,这也和单因素方差分析表的结论是一致的。,主
12、要内容,5.1 统计推断与假设检验5.2 Means过程5.3 单样本T检验5.4 两独立样本T检验5.5 两配对样本T检验,5.3 单样本T检验,1、单样本T检验目的和步骤(1)单样本T检验的目的 单样本T检验的目的是利用来自某总体的样本数据,推断该总体的均值是否与指定的检验值之间存在显著性差异。它是对总体均值的假设检验。例如,从新生的入学成绩的抽样数据推断平均成绩是否为75分;在人口普查中,某地区职工今年的平均收入是否和往年的平均收入有显著差异。,5.3 单样本T检验,1、单样本T检验目的和步骤(2)单样本T检验的步骤第1步 提出零假设;单样本T检验需要检验总体均值与指定的检验值是否存在显
13、著差异。为此,给出检验均值为,零假设为:,其中,为总体均值。例如,假设储户一次平均存(取)款金额与2000元无显著性差异,零假设则为:。,5.3 单样本T检验,1、单样本T检验目的和步骤(2)单样本T检验的步骤第2步 选择检验统计量;单样本T检验的前提是总体服从正态分布,其中 为总体均值,为总体方差。如果样本容量为n,样本均值为,则 仍服从正态分布,即:。在零假设成立的条件下,均值检验使用t统计量,构造的t统计量为:,其中,用 代入,t统计量服从自由度为n-1的t分布,S为样本标准差。SPSS的操作结果中还显示均值标准误差(Std.Error Mean),计算公式为:,即统计量的分母部分。,5
14、.3 单样本T检验,1、单样本T检验目的和步骤(2)单样本T检验的步骤第3步 计算检验统计量的观测值及其发生的概率;在给定零假设的前提下,SPSS将检验值代入t统计量,得到检验统计量观测值以及根据t分布的分布函数计算出概率p值。第4步 给定显著性水平,做出统计推断。给出显著性水平,与检验统计量的概率p值作比较。当检验统计量的概率p值小于显著性水平时,则拒绝零假设,认为总体均值与要检验的 之间存在差异;反之,如果检验统计量的概率p值大于显著性水平,则接受零假设,认为总体均值与检验值 之间无显著性差异。,5.3单样本T检验,2、单样本T检验的操作界面,从候选变量框中选择要进行T检验的变量移入此框中
15、,可同时选择多个变量,此时,SPSS就将分别产生多个变量的T检验分析结果。,在此框中输入检验值,即检验与什么值有无显著性差异。,单击该按钮 弹出Option对话框,该对话框用于指定置信水平和缺失值的处理方法,图5-3,5.3 单样本T检验,3、实例分析【例5-2】某生产食盐的生产线,其生产的袋装食盐的标准重量为500g,现随机抽取10袋,其重量分别为:495,502,508,496,505,499,503,498,505,500。假设数据呈正态分布,请检验生产线的工作情况。第1步 数据组织;首先建立SPSS数据文件,只需建立一个变量“Weight”,录入相应的数据即可。,5.3 单样本T检验,
16、3、实例分析第2步 打开主对话框;选择Analyze Compare Means One-Sample T Test,打开同图5-3一样的单样本T检验主对话框。第3步 确定要进行T检验的变量;在图5-3所示的对话框中,选择“Weight”变量作为检验变量,移入“Test Variable(s)”框中。第4步 输入要检验的值;在图5-4的对话框中的“Test value”中输入要检验的值,本例应输入500。,5.3 单样本T检验,3、实例分析结果分析,5.3 单样本T检验,3、实例分析结果分析,表5.7是单样本T检验结果表,第一行的Test Value为检验参数值500,即用于比较的总体均值,下
17、面从左至右依次为检验统计量(t)、自由度(df)、双尾检测概率P值(Sig.(2-tailed))、样本均值与和检验值的差(Mean Difference)、均值差的95%置信区间(95%Confidence Interval of the Difference)。当置信水平为95%时,显著性水平为0.05,从表5.7中可以看出,双尾检测概率P值为0.432,大于0.05,故零假设成立,也就是说抽样袋装食盐的重量与500克无显著性差异,有理由相信生产线工作状态正常。,主要内容,5.1 统计推断与假设检验5.2 Means过程5.3 单样本T检验5.4 两独立样本T检验5.5 两配对样本T检验,
18、5.4 两独立样本T检验,1、两独立样本T检验目的和主要步骤(1)两独立样本T检验的目的单样本T检验是检验样本均值和总体均值是否有显著性差异,而两独立样本T检验的目的是利用来自某两个总体的独立样本,推断两个总体的均值是否存在显著差异。例如,为比较两种牧草对奶牛的饲养效果,随机从奶牛群中选取喂养不同牧草的奶牛各10头记录每日平均产奶的量,根据记录的数据推断两种牧草对奶牛饲养的效果有无显著性差异。,5.4 两独立样本T检验,1、两独立样本T检验目的和主要步骤(2)两独立样本T检验的主要步骤第1步 提出零假设;两独立样本T检验需要检验两个总体的均值是否存在显著性差异。因此,零假设 为:,即假设两样本
19、均值相等,备择假设为:,即假设两样本均值不等。,5.4 两独立样本T检验,1、两独立样本T检验目的和主要步骤(2)两独立样本T检验的主要步骤第2步 选择检验统计量;两独立样本T检验的前提是两个独立的总体分别服从 和。在零假设成立的条件下,独立样本T检验使用t统计量。构造独立样本T检验的t统计量分为两种情况。1)当样本方差相等时,t统计量定义为:其中 和 分别为两样本容量,和 分别为两样本标准差。该统计量服从自由度为 的t分布。,5.4 两独立样本T检验,1、两独立样本T检验目的和主要步骤(2)两独立样本T检验的主要步骤第2步 选择检验统计量;2)当样本方差不等时,t统计量定义为:可见,两独立样
20、本T检验的结论在很大程度上取决于两个总体的方差是否相等。这就要求在检验两总体均值是否相等之前,首先应对两总体方差是否相等进行检验,也称之为方差齐性检验。,5.4 两独立样本T检验,1、两独立样本T检验目的和主要步骤(2)两独立样本T检验的主要步骤第3步 计算检验统计量的观测值及其发生的概率;在给定零假设的前提下,SPSS将检验值0代入t统计量的 部分,得到检验统计量观测值以及根据t分布的分布函数计算出概率p值。第4步 给定显著性水平,做出统计推断。给出显著性水平,与检验统计量的概率p值作比较。当检验统计量的概率p值小于显著性水平时,则拒绝零假设,认为两个总体均值之间存在差异;反之,如果检验统计
21、量的概率p值大于显著性水平,则接受零假设,认为两个总体均值之间无显著性差异。,5.4 两独立样本T检验,2、两独立样本T检验的操作界面,从候选变量框中选择要进行T检验的变量移入此框中,,图5-4,选择分组变量,在选择变量进入Grouping Variable框后,Define Groups按钮将被激活,单击该按钮定义分组信息,单击该按钮 弹出Option对话框,该对话框用于指定置信水平和缺失值的处理方法,5.4 两独立样本T检验,3、实例分析【例5-3】为比较两种不同品种的玉米的产量,分别统计了8个地区的单位面积产量,具体数据见表5.8。假定样本服从正态分布,且两组样本相互独立,试比较在置信度
22、为95%的情况下,两种玉米产量是否有显著性差异。,5.4 两独立样本T检验,3、实例分析第1步 数据组织;根据表5.8,SPSS数据文件中建立两个变量,分别为“品种”、“产量”,变量“品种”的变量值标签为:a-品种A,b-品种B,录入数据即可。第2步 打开主对话框;选择Analyze Compare Means Independent-Samples,打开同图5-4一样的两独立样本T检验主对话框。,5.4 两独立样本T检验,3、实例分析第3步 确定要进行T检验的变量;在图5-4所示的对话框中,选择“产量”变量作为检验变量,移入“Test Variable(s)”框中。第4步 确定分组变量;选择
23、变量“品种”作为分组变量,将其移入图5-4中的“Grouping variable”文本框中,并定义分组的变量值:Group1a,Group2b。,5.4 两独立样本T检验,3、实例分析结果分析,5.4 两独立样本T检验,3、实例分析结果分析,在方差相等的情况下,两独立样本T检验的结果应该看表5.10中的“Equal variances assumed”一行,第5列为相应的双尾检测概率(Sig.(2-tailed)为0.332,在显著性水平为0.05的情况下,T统计量的概率p值大于0.05,故不应拒绝零假设,,即认为两样本的均值是相等的,在本例中,不能认为两种玉米品种的产量有显著性差异。,主要
24、内容,5.1 统计推断与假设检验5.2 Means过程5.3 单样本T检验5.4 两独立样本T检验5.5 两配对样本T检验,5.5 两配对样本T检验,1、两配对样本T检验目的和主要步骤(1)两配对样本T检验目的 两配对样本T检验的目的是检验两个相关样本是否来自相同均值的正态总体,即推断两个总体的均值是否存在显著差异。配对的概念是指两个样本的各样本值之间存在着对应关系,配对样本的两个样本值之间的配对是一一对应的,并且两个样本的容量相同。配对样本T检验与独立样本T检验的差别之一是要求样本是配对的。所谓配对样本可以是个案在“前”“后”两种状态下某属性的两种状态,也可以是对某事物两个不同侧面或方面的描
25、述。其差别在于抽样不是相互独立的,而是互相关联的。,5.5 两配对样本T检验,1、两配对样本T检验目的和主要步骤(2)两配对样本T检验主要步骤第1步 提出零假设;配对样本T检验需要检验两个总体均值是否存在显著性差异,其零假设为,其中,和 分别为第一个总体和第二个总体的均值。第2步 选择检验统计量;在配对样本T检验中,设、分别为配对样本。其样本差值,此时检验统计量为:其中 为 的均值,S为 的标准差,n为样本数,当 时,t统计量服从自由度为n-1的t分布。,5.5 两配对样本T检验,1、两配对样本T检验目的和主要步骤(2)两配对样本T检验主要步骤第3步 计算检验统计量的观测值及其发生的概率;该步
26、骤的目的是计算t统计量的观测值以及相应的概率p值。SPSS将计算两组样本的差值,并将相应数据代入上式的t检验统计量计算公式中,计算出t统计量的观测值和对应的概率p值。第4步 给出显著性水平,并做出统计推断结果。给出显著性水平,与检验统计量的概率p值作比较。如果概率p值小于显著性水平,则应拒绝零假设,认为差值的总体均值与0有显著不同,两总体的均值有显著差异;反之,如果概率p值大于显著性水平,则不应拒绝零假设,认为差值的总体均值与0无显著不同,两总体的均值不存在显著差异。,5.5 两配对样本T检验,2、两配对样本T检验的操作界面,图5-5,该列表框中的变量作为分析变量,总是成对地出现,可以有多对被
27、分析的变量。,单击该按钮 弹出Option对话框,该对话框用于指定置信水平和缺失值的处理方法,5.5 两配对样本T检验,3、实例分析【例5-4】以下是某大学跆拳道选手15人的平衡训练的数据,统计实验前、后平衡训练成绩是否有差异。训练前:86,77,59,79,90,68,85,94,66,72,75,72,69,85,88训练后:78,81,76,92,88,76,93,87,62,84,87,95,88,87,80第1步 数据组织;首先建立SPSS数据文件,建立两个变量:“训练前”、“训练后”,录入相应数据。,5.5 两配对样本T检验,3、实例分析第2步 打开主对话框;选择Analyze C
28、ompare Means Paired-Samples T Test,打开同图5-5一样的配对样本T检验主对话框。第3步 确定配对分析的变量;将变量“训练前”和“训练后”添加到“Paired Variables”框中,作为第一对分析的配对变量。,5.5 两配对样本T检验,3、实例分析结果分析,表5.12是两配对样本T检验的简单相关关系及其检验结果。表中第3列为训练前和训练两样本的相关系数,第4列是相关系数的检验p值。从表中可以看出,在显著性水平为0.05时,训练前后的概率p值为0.132,大于0.05,接受零假设,可以认为训练前后的成绩没有明显的线性关系。,5.5 两配对样本T检验,3、实例分析结果分析,表5.13是两配对样本T检验的最终结果。表中第2列是配对样本的平均差值,训练前后的成绩平均相差了5.933,第3列是差值的标准差,第4列是差值的均值标准误差,第5列和第6列分别是在置信度为95%时差值的置信下限和置信上限,共同构成了该差值的置信区间为(-11.57,-0.292)。第7列为统计量的观测值,第8列为自由度,最后一列为双尾检验概率p值,在置信水平为95%时,显著性水平为0.05,由于概率p值为0.041,小于0.05,拒绝零假设,可以认为训练前后对成绩有显著效果。,