《两配对样本非参数检验.ppt》由会员分享,可在线阅读,更多相关《两配对样本非参数检验.ppt(25页珍藏版)》请在三一办公上搜索。
1、SPSS 16实用教程,第10章 非参数检验,10.7 两配对样本非参数检验,10.7.1 统计学上的定义和计算公式,定义:两配对样本(2 Related Samples)非参数检验是在对总体分布不很清楚的情况下,对样本来自的两配对总体进行检验。,配对样本的理解:两配对样本非参数检验一般用于同一研究对象(或两配对对象)分别给予两种不同处理的效果比较,以及同一研究对象(或两配对对象)处理前后的效果比较。前者推断两种效果有无差别,后者推断某种处理是否有效。如:判断服用某种药品前后某项关键生理指标值有无变化、同一个家庭夫妻两人的寿命有无差别等等,两配对样本非参数检验的前提要求两个样本应是配对的。在应
2、用领域中,主要的配对资料包括:具有年龄、性别、体重、病况等非处理因素相同或相似者。首先两个样本的观察数目相同,其次两样本的观察值顺序不能随意改变。SPSS中有以下3种两配对样本非参数检验方法。,1两配对样本的McNemar(麦克尼马尔)变化显著性检验,McNemar变化显著性检验以研究对象自身为对照,检验其两组样本变化是否显著。原假设:样本来自的两配对总体分布无显著差异。McNemar变化显著性检验要求待检验的两组样本的观察值是二分类数据,在实际分析中有一定的局限性。,McNemar变化显著性检验基本方法采用二项分布检验。它通过对两组样本前后变化的频率,计算二项分布的概率值。,Table 1.
3、两组样本的交叉二维频数表,在原假设条件下应该有(a+b)=(a+c)或者(c+d)=(b+d)即b=c大样本下有近似自由度为1的卡方统计量:X2=(b-c)2/(b+c),第一组样本,第二组样本,2两配对样本的符号(Sign)检验,当两配对样本的观察值不是二值数据时,无法利用前面一种检验方法,这时可以采用两配对样本的符号(Sign)检验方法。原假设为:样本来自的两配对样本总体的分布无显著差异。,检验步骤:.将第二组样本的各个观察值减去第一组样本对应的观察值,如果得到差值是一个正数,则记为正号;差值为负数,则记为负号。.计算正号的个案数 和负号的个案数。(出现差值等于时,删除此个案,样本数相应地
4、减少。)如果正号的个数和负号的个数大致相当,则可以认为两配对样本数据分布差距较小;正号的个数和负号的个数相差较多,可以分为两配对样本数据分布差距较大。,SPSS将自动对差值正负符号序列作单样本二项分布检验,计算出实际的相伴概率值(原假设对应的理论概率等于0.5)。如果得到的概率值小于或等于用户的显著性水平,则应拒绝零假设H0,认为两配对样本来自的总体分布有显著差异;如果概率值大于显著性水平,则不能拒绝零假设H0,认为两配对样本来自的总体分布无显著差异。,3两配对样本的Wilcoxon符号平均秩检验,两配对样本的符号检验考虑了总体数据变化的性质,但没有考虑两组样本变化的程度。两配对样本的Wilc
5、oxon符号平均秩检验考虑了这方面的因素。原假设为:样本来自的两配对样本总体的分布无显著差异。,检验步骤:按照符号检验的方法,将第二组样本的各个观察值减去第一组样本对应的观察值,如果得到差值是一个正数,则记为正号;差值为负数,则记为负号。(出现差值等于时,删除此个案,样本数相应地减少。)保留差值数据。根据差值数据的绝对值大小按升序排序,并求出相应的秩。分别计算符号为正号的秩和W+、负号秩总合W以及正号平均秩、负号平均秩。,(W+,W)这里的是删除差值等于的个案以后的样本容量。根据检验统计量计算相伴概率值,与设定的显著性水平进行比较作出检验判断。,研究问题 分析10个学生接受某种方法进行训练的效
6、果,收集到这些学生在训练前、后的成绩,如表10-9所示。表格的每一行表示一个学生的4个成绩。其中第一列表示,训练前的成绩是否合格,0表示不合格,1表示合格;第二列表示训练后的成绩是否合格,0表示不合格,1表示合格;第三列表示训练前学生的具体成绩;第四列表示训练后学生的具体成绩。问训练前后学生的成绩是否存在显著差异?,10.7.2 SPSS中实现过程,表10-9训练前后的成绩,通过前两列数据可以运用McNemar检验,而后两列数据适合做符号检验和Wilcoxon符号平均秩检验,实验步骤,图10-23 在菜单中选择“2 Related Samples”命令,图10-24“Two-Related-S
7、amples Tests”对话框,设置配对的样本,配对样本的几种检验方法,(其中Marginal Homogeneity检验是McNemar检验针对多取值有序数据的推广方法),图10-25 选择两个变量配对,根据前两个指标值进行配对样本的McNemar检验,图10-27 选择两个变量配对,根据后两个指标数据进行符号检验和Wilcoxon符号平均秩检验,10.7.3 结果和讨论,(1)描述性统计部分结果如下表所示。,(2)McNemar检验结果如下两表所示。,2*2交叉列联表,相伴概率值为0.125,应该认为训练前后学生成绩没有变化,(3)Wilcoxon检验结果如下两表所示。,出现了一个差值等
8、于零的个案,删除此个案,于是样本容量从10变成了9。符号为正的有9个,秩和为45,符号为负的有0个,秩和为0。这样,统计量W=0,构造的Z=-2.673,近似相伴概率值p=PrZ=-2.673=0.008,(Z服从标准正态分布。)因而拒绝原假设,认为训练前后学生的成绩有显著性差异。,差值为第二组减第一组,(4)符号检验结果如下两表所示。,差值为第二组减第一组,差值等于0的有一个个案,需要删除。之后N+=9,N-=0N+,N-在原假设下服从B(9,1/2)分布。相伴概率(双边检验2-tailed)P=2*PrN+=9=2*(1/2)9=0.00390625所以和平均秩检验一样拒绝原假设认为训练前
9、后学生的成绩有显著性差别。McNemar检验中,只要训练前后都是及格或都是不及格就认为没有差别,而没有考虑到虽然同样及格或不及格但是分数有可能增加了。,作业!,要求:在进行符号检验和Wilcoxon平均秩检验时,差值计算,符号赋值,编秩等工作要在数据文件中体现。统计量的计算过程包括相伴概率的计算表达式。,1.书上研究问题。2.经调查得知某厂8名职工的入厂技术成绩(即技术培训前成绩)和进行技术培训后的技术成绩如下。分析技术培训前后,职工的技术成绩有无显著差异?(数据中0表示不合格,1表示合格),3.某厂生产豪华型和普通型两种家用电器。由各个零售店抽样得到的这两种型号电器的销售价格如下:厂方建议这两种型号电器的销售价格有100元的差价,利用样本数据检验:它们的差价是否是100元?a.两种型号电器的销售价格服从正态分布。(T检验)b.销售价格的分布未知。(符号检验和符号平均秩检验),