《第7章相关分析.ppt》由会员分享,可在线阅读,更多相关《第7章相关分析.ppt(43页珍藏版)》请在三一办公上搜索。
1、SPSS统计软件,第七章 相关分析,平均数、标准差是对单变量进行描述的特征量。若对两个变量之间变化关系进行描述,需要用相关量。如,描述同一组学生两门学科成绩的关系;智力与学习成绩的关系等等,都要用相关量来描述。,一、引言,7.1相关分析的基本原理,二、相关的概念两个变量之间不精确、不稳定的变化关系称为相关关系。相关分析是研究变量间密切程度的一种统计方法。两个变量之间的变化关系,既表现在变化方向,又表现在密切程度上。从变化方向来看,两个变量之间有以下几种关系:,三、相关的类别1、正相关 两个变量的变化方向一致如智商与学习成绩(非智力因素基本相同)2、负相关 两个变量的变化方向相反如解题能力与解题
2、所用时间的长短3、零相关 两个变量的变化方向无一定规律,四、相关系数(一)定义:用来描述两个变量相互之间变化方向及密切程度的数学特征量称为相关系数。用r表示。(二)数值变化范围:0|r|1-1r1r的正、负号表明两个变量之间变化的方向绝对值的大小表明两个变量之间变化密切程度,1、概念及适用范围积差相关:当两个变量都是正态连续变量,而且两者之间呈线形关系时,表示这两个变量之间的相关,又叫皮尔逊(Pearson)相关。如,初中升高中入学考试生物与化学成绩均以百比制表示,若二者分别呈正态分布,它们之间呈线性关系,这时可用积差相关来表示它们的变化关系。,五、积差相关,使用条件两个变量都是由测量获得的连
3、续性数据两个变量的总体都呈正态分布,或接近于正态分布。判断总体是否呈正态分布可进行卡方检验,以后会介绍。必须是成对数据,而且每对数据之间相互独立两个变量之间呈线性关系。这可由相关散点图的形状来决定。散点图在随后也进行介绍。样本容量n30,散点图:,判断散点图,主要看其分布形状是否呈斜向椭圆形,散点在椭圆中心处分布密集,椭圆长轴两端稀疏,这反映两变量之间是直线关系。若四个象限的散点相等,且分布均匀,为零相关。若散点分布呈曲线形,为曲线相关。散点图的趋势若表明两个变量是线性关系,才可以计算积差相关系数。,2、积差相关系数的计算方法原始数据计算法:,3、相关系数的显著性检验,相关系数的抽样分布从两个
4、正态连续变量的总体中,随机抽取n对数据,算得一个样本相关系数r值,随后将这些数据还回两个总体中去,再从中随机抽取n对数据,又可以计算出一个样本的r值,这一切可能个样本r值的频数分布,就构成一个实验性的相关系数r的抽样分布。,相关系数显著性检验的原理上面求出的相关系数r,是根据样本数据计算出来的,它存在着抽样误差。也就是说,即使从总体相关系数=0的总体中随机抽取的样本,由于抽样的偶然性,计算出的r值有可能不等于0。所以,不能仅仅根据r的大小,对两个变量之间关系的密切程度作出判断,还要看r在以=0为中心的抽样分布上出现的概率如何。如果从=0的总体中,随机抽取的r在抽样分布上出现的概率较大,则r和=
5、0的差异无显著意义。反之,如果从=0的总体中,随机抽取的r在抽样分布上出现的概率较小,则r和=0有显著性差异,即不是来自两个变量相关系数为0的总体。,六、等级相关,等级相关:以等级次序排列或以等级次序表示的变量之间的相关。斯皮尔曼二列等级相关斯皮尔曼等级相关(一)概念及其适用范围当两个变量以等级次序排列或以等级次序表示时,两个相应总体并不一定呈正态分布,样本容量也不一定大于30,表示这两个变量之间的相关,称为等级相关。根据某种标准对某项成绩所评定的等级,或按某种指标的优劣程度所排列的名次等,均属于等级秩序性分数。,计算等级相关系数的公式为,D表示两个变量每对数据等级之差,7.2 连续变量的相关
6、分析,像年龄变量、收入变量、成绩变量都是典型的连续变量。这就是我们前面介绍的Pearson相关。,例从某系随机选取了40名大学生进行追踪研究,分别在入学后一周、第一学年末、第二学年末和第三学年末共4次英语词汇测验推算得到的被试的英语词汇量(单位:千)。表中的变量如下:性别(0表示女生,1表示男生),test1(入学后一周词汇量),test2(第一学年末词汇量),test3(第二学年末词汇量),test4(第三学年末词汇量)。想计算并检验学生英语词汇量四次测验之间的相关系数。,在进行相关分析之前,可以使用Graphs菜单中的Scatter命令作散点图。,散点图是以点的分布反映变量之间相关情况的统
7、计图形,根据图中的各点分布走向和密集程度,大致可以判断变量之间的关系。,按顺序GraphsScatter单击,打开Scatterplot散点图主对话框。,1、Simple简单散点图,只显示一对相关变量的散点图,4、3-D三维散点图,显示三个相关变量之间的散点图,3、Matrix矩阵散点,在矩阵中显示多个相关变量之间的散点图,2、Overlay重叠散点图,可显示多对相关变量的散点图,把test1选择作为Y轴变量,把test2选择作为X轴变量。,结果:,矩阵散点图在矩阵变量框内要选择两个或两个以上的变量,编辑散点图,选中图中的点,打开Properties图形属性对话框,选择Marker点选项卡。在
8、选项卡中,选择点的类型(Type)、点的大小(Size)、点的外周线(Border Width)以及点的颜色(Color)。,选择分析菜单下的相关分析下两个变量间的相关分析选项,菜单,2单击按钮,3单击OK,1选择变量,皮尔逊相关系数,如果两变量相关显著,需要标注,显著性检验选项,将、指定为。,结果和讨论,每个变量有三行数据,第一行是该变量与其他变量之间的相关系数,右上角标有“”的表示在0.01水平上是显著的。Sig.(2-tailed)双尾t检验结果,对于相关系数为0的假设成立的概率。N为参与相关系数计算的有效观测量数。,结论:r=0.886,P=0.0000.01,拒绝H0。可以认为tes
9、t1和test2之间有正的直线相关关系。,H0:=0,即test1和test2无直线相关关系。,相关性检验,7.3 等级变量的相关分析,前面介绍了等级相关,下面看如何利用SPSS来实现这种计算。,例某班10个学生进行了数学和语文测验,分析数学与评议的成绩是否等级相关?,选择分析菜单下的相关分析下两个变量间的相关分析选项,菜单,2单击按钮,3单击OK,1选择变量,斯皮尔曼相关系数,结果和讨论,结论:r s=0.610,P=0.0610.05,接受H0。可以认为语文成绩与数学成绩无直线相关关系。,H0:s=0,即语文成绩与数学成绩无直线相关关系,相关性检验,例:12名学生的两门功课成绩评定分数见下表。问这两门功课的成绩是否具有一致性?,例题,优1良2中3,数据,课程A,课程B,数据录入,结论:r s=0.657,P=0.0200.05,拒绝H0。可以认为两门功课成绩 间有正的直线相关关系,即具有一致性。,H0:s=0,即两门功课成绩 间无直线相关关系,相关性检验,凡符合计算积差相关系数的资料,不要用等级相关计算,要计算积差相关。,注意,