SPSS统计分析第7章相关分析.ppt

上传人:小飞机 文档编号:5449282 上传时间:2023-07-08 格式:PPT 页数:26 大小:282.50KB
返回 下载 相关 举报
SPSS统计分析第7章相关分析.ppt_第1页
第1页 / 共26页
SPSS统计分析第7章相关分析.ppt_第2页
第2页 / 共26页
SPSS统计分析第7章相关分析.ppt_第3页
第3页 / 共26页
SPSS统计分析第7章相关分析.ppt_第4页
第4页 / 共26页
SPSS统计分析第7章相关分析.ppt_第5页
第5页 / 共26页
点击查看更多>>
资源描述

《SPSS统计分析第7章相关分析.ppt》由会员分享,可在线阅读,更多相关《SPSS统计分析第7章相关分析.ppt(26页珍藏版)》请在三一办公上搜索。

1、第七章,相关分析,主要内容,7.1 相关分析简介7.2 两变量相关分析7.3 偏相关分析7.4 距离分析,7.1相关分析简介,(1)函数关系与相关关系 变量之间的关系可以分为两种:一种是函数关系,另一种是相关关系。函数关系是一一对应的确定性关系,比较容易分析和测度。可是在现实世界中,变量间的关系往往并不是简单的确定性关系,也就是说,变量之间有着密切的关系,但又不能由一个或几个变量的值确定另一个变量的值,即当自变量x取某一值时,因变量y的值可能会有多个。这种变量之间的非一一对应的、不确定性的关系,称之为相关关系。(2)相关分析基本概念 衡量事物之间,或称变量之间线性相关程度的强弱并用适当的统计指

2、标表示出来,这个过程就是相关分析。相关系数是衡量变量之间相关程度的一个指标,总体的相关系数用表示,样本的相关系数用r表示。,相关关系的种类1 按涉及的变量分:简单相关和复相关2 按表现形式分:线性相关和非线性相关3 按变化方向分:正相关和负相关4 按相关程度分:不相关、低度相关、显著相关、高度相关和完全相关,4,主要内容,7.1 相关分析简介7.2 两变量相关分析7.3 偏相关分析7.4 距离分析,7.1二元变量相关分析,(1)基本概念 二元变量的相关分析是指通过计算变量间两两相关的相关系数,对两个或两个以上变量之间两两相关的程度进行分析。根据所研究的变量类型不同,又可以分为二元定距变量的相关

3、分析和二元定序变量的相关分析。(2)统计原理二元定距变量的相关分析:定距变量又称为间隔(interval)变量(即连续属性变量),变量值之间可以比较大小,可以用加减法计算出差异的大小。Pearson简单相关系数及t统计量,7.1二元变量相关分析,定序变量的相关性分析:定序变量又称为有序(ordinal)变量、顺序变量、等级变量,它取值的大小能够表示观测对象的某种顺序关系(等级、方位或大小等)。定序变量的相关系数用斯皮尔曼(Spearman)相关系数和肯德尔(Kendalls)相关系数来衡量。Spearman相关系数及Z统计量,Kendalls等级相关系数 及Z统计量,7.2 二元变量相关分析,

4、(3)分析步骤第1步 计算相关系数r:利用样本数据计算样本相关系数,样本相关系数反映了两变量间线性相关程度的强弱。相关系数的取值范围界于-1与1之间,即-1r1 当0r 1,表明变量之间存在正相关关系;当-1 r0,表明变量之间存在负相关关系;当|r|=1时,表示其中一个变量的取值完全取决于另一个变量,二者即为函数关系;当r=0时,说明变量之间不存在线性相关关系,但这并不排除变量之间存在其它非线性相关的可能。,根据经验可将其相关程度分为几种:当|r|0.8时视为高度相关;当0.5|r|0.8时视为中度相关;当0.3|r|0.5时视为低度相关;当|r|0.3时说明变量之间的相关性很弱。,第2步

5、对样本来自的两总体是否存在显著的线性关系进行推断:由于存在抽样的随机性和样本数量较少等原因,通常样本相关系数不能直接用来说明样本来自的两总体是否具有显著的线性相关性,需要通过假设检验的方式对样本的总体进行统计推断。提出零假设H0:即两总体无显著的线性关系;构造检验统计量:由于不同的相关系数采用不同的检验统计量,因此在相关分析时,不同的过程需要构造不同的检验统计量;计算检验统计量的观测值及对应的概率p值;对两总体的相关性进行推断:如果检验统计量的概率p值小于给定的显著性水平,应拒绝零假设,即认为两总体之间存在显著性线性关系;反之,应接受零假设。,7.2二元变量相关分析,(4)SPSS实现举例【例

6、7-1】为了分析父亲与儿子身高之间的相关性,现抽样了12对父子的身高,数据如下表。请对其进行相关性分析(显著性水平取0.05)。,7.2二元变量相关分析,第1步 分析:身高是定距变量,考虑用Pearson相关系数来衡量。第2步 数据的组织:分成两列,一列是父亲的身高,另一列是儿子的身高。,7.2二元变量相关分析,第3步 选择菜单“分析相关双变量”,打开如图7-1所示的对话框,将“father”和“son”两变量移入“变量”框中;“相关系数”选择Pearson;在“显著性检验”中选择“双侧检验”;,7.2二元变量相关分析,第4步 主要结果及分析。,其中包括了叉积离差矩阵、协方差矩阵、Pearso

7、n相关系数及相伴概率p值。从表中可看出,相关系数为0.7030,说明呈正相关,而相伴概率值Sig.=0.0050.05,因此应拒绝零假设(H0:两变量之间不具相关性),即说明儿子身高是受父亲身高显著性正影响的。,主要内容,7.1 相关分析简介7.2 两变量相关分析7.3 偏相关分析7.4 距离分析,(1)基本概念 偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量,这种相关系数称为偏相关系数。偏相关系数的数值和简单相关系数的数值常常是不同的,在计算简单相关系数时,所有其他自变量不予考虑。(2)统计原理 控制一个变量和控制两个变量的偏相关系数分别为:,7.3 偏相关

8、分析,检验的统计量为:,(3)统计分析步骤第1步 根据公式计算偏相关系数;第2步 对样本来自的两总体是否存在显著性相关进行推断。提出零假设H0:即两总体的偏相关系数与零无显著性差异;选择检验统计量:偏相关分析选择的是t统计量;计算t值及对应的概率p值;决策:如果相伴概率p值小于给定的显著性水平,则应拒绝零假设,认为两总体的偏相关系数与零有显著性差异;否则,接受原假设。,7.3 偏相关分析,(4)SPSS实现举例【例7-3】下表是四川绵阳地区3年生中山柏的数据,分析月生长量与月平均气温、月降雨量、月平均日照时数、月平均湿度4个气候因素中哪些因素有关。,7.3 偏相关分析,17,7.3 偏相关分析

9、,第1步 分析:这4个气候因素彼此均有影响,分析时应对生长量与4个气候因素分别求偏相关,如在求生长量与气候因素的相关时控制其他因素的影响。所以需进行偏相关分析;第2步 数据组织:如上表定义4个变量,输入数据即可;第3步 进行偏相关分析:选择菜单“分析相关双变量”,指定分析变量和控制变量,分析变量“hgrow”和“temp”的偏相关系数,并将“rain”、“hsun”、“humi”设为控制变量。如下图所示设置。,第4步 主要结果及分析。,7.3 偏相关分析,从中可以看出,月降雨量、月平均日照时数和月平均湿度为控制变量,生长量与月平均气温关系密切,偏相关系数为0.977,双尾检测的相伴概率为0.0

10、00(表示趋近于0的正数),明显小于显著性水平0.05。故应拒绝原假设,说明中山柏的生长量与气温间存在显著的相关性。,主要内容,7.1 相关分析简介7.2 两变量相关分析7.3 偏相关分析7.4 距离分析,(1)基本概念 距离分析是对观测量之间相似或不相似程度的一种测度,是计算一对观测量之间的广义距离。这些相似性或距离测度可以用于其他分析过程,例如因子分析、聚类分析或多维定标分析,有助于分析复杂的数据集。(2)统计原理不相似性测度对定距数据的不相似性(距离)测度可以使用的统计量有:欧几里得距离、平方欧氏距离、切比雪夫距离、Block距离、明可斯基距离等。对定序数据,主要使用卡方不相似测度和斐方

11、测度。对二值(只有两种取值)数据变量之间的距离描述,使用欧氏距离、平方欧氏距离、尺寸差异、模式差异、方差、形或兰斯和威廉斯等距离统计量。,7.4 距离分析,相似性测度 对于定距数据主要使用皮尔逊相关系数和夹角余弦距离;对于二值数据的相似性测度主要包括简单匹配系数、Jaccard相似性指数、Hamann相似性测度等20余种。,7.4 距离分析,其中的距离又分为个案(观测记录)之间的距离和变量之间的距离两种。,(3)分析步骤 距离分析中不存在假设检验问题,主要是通过SPSS自动计算变量或个案之间的相似性或不相似性距离,根据其计算距离值的大小来确定变量或个案之间的相似性或不相似性的强弱。,(4)SP

12、SS实现举例【例7-4】已知我国四城市2004年各月的日照时数如下表所示,请分析各城市日照数是否近似。,7.4 距离分析,第1步 分析:这是考查4个城市的日照时数是否相似的问题,可用距离分析实现。既可以计算其相似性测度,亦可计算其不相似性测度;第2步 数据组织:分别定义的变量:month”(月份)(用字符型变量)、“Beijing”(北京)、“Tianjin”(天津)、“ShiJZ”(石家庄)、“Dalian”(大连)。,7.4 距离分析,7.4 距离分析,第3步 进行距离分析:选择菜单“分析相关距离”,弹出下图所示的“距离”对话框,将4个变量(“北京”、“天津”、“石家庄”、“大连”)移入“变量”框中进行相似性度量计算;在“计算距离”组中选中“个案间”单选框,进行变量间的距离分析;在“度量标准”单选框组中选中不相似性,求解其不相似性度量。,第4步 主要结果及分析。,7.4 距离分析,表格的第一行(Euclidean 距离)说明采用的是欧氏距离。这是一个对称矩阵,当两变量的欧氏距离越大,说明其差别越大,反之越小。从表中可看出“北京”和“大连”的日照数最接近,而“北京”和“天津”的日照数相差最大。,The End,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号