相关分析和检验.ppt

上传人:小飞机 文档编号:5803841 上传时间:2023-08-21 格式:PPT 页数:30 大小:336.49KB
返回 下载 相关 举报
相关分析和检验.ppt_第1页
第1页 / 共30页
相关分析和检验.ppt_第2页
第2页 / 共30页
相关分析和检验.ppt_第3页
第3页 / 共30页
相关分析和检验.ppt_第4页
第4页 / 共30页
相关分析和检验.ppt_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《相关分析和检验.ppt》由会员分享,可在线阅读,更多相关《相关分析和检验.ppt(30页珍藏版)》请在三一办公上搜索。

1、第三节相关分析 和偏相关分析(Correlation analysis and partial correlation analysis),安徽岳西小区试验结果。降雨因素和土壤侵蚀之间是否存在相关关系?,问题实例,问题分解采用什么指标度量变量间的关系?采用什么方法来评价相关是否显著?,相关分析:研究变量之间相互关联程度大小,采用合理的指标对相关事物的观测值进行统计分析。相关分析内容:相关程度的度量;相关程度的检验 相关关系与函数关系的区别 函数关系:变量之间是一种完全确定性的关系,并可用数学公式表示出来。如长方形的面积(S)与 长(a)和 宽(b)的关系。相关关系:变量间不是完全确定的关系,且

2、不能用数学公式准确表示出来。函数关系可以看作是相关关系的特例,即函数关系是完全的相关关系。相关关系是相关分析的研究对象。相关不等于有因果。相互关联事物的至少2种解释:X是Y的因或果;X与Y均为第3个变量的因或果,相关分析的概念,相关类型图,这种相关计算方法称积差相关或积矩相关,是由英国统计学家皮尔逊(Pearson)提出的,又称皮尔逊相关。反映的是线性相关。相关系数与协方差。需要指出的是:参与相关分析的两个变量是对等的,不分自变量和因变量,因此相关系数只有一个。计算积差相关系数条件:两变量为等距或等比数据;两变量正态分布;两变量具备一一对应关系。,相关系数两个变量相关程度大小的数量化指标(r表

3、示)。,相关系数:两个变量相关程度大小的数量化指标(r表示)。取值范围:11之间;正相关:负相关:完全相关:零相关:,相关系数取值,相关系数的计算,第1式:计算均值-计算标准差-计算离均差;计算离均差乘积;计算相关系数。第2式:计算和-计算交叉乘积和-计算平方和;计算和的平方;计算相关系数。针对实例问题:r=0.892,是否线性相关?,对容易一个r值,如r=0.25,可能会想到两种情况:由于r=0.250,说明两变量之间在总体上是相关的。虽然r=0.250,但这可能是偶然情况,是取样造成,实际两变量在总体上是不相关的。所以需要进行检验。,问题的第2个方面:评价相关是否显著相关显著性检验,建立假

4、设 假设总体相关系数为 H0:=0,H1:0确定单尾还是双尾检验 双尾选择显著性水平 最常用的数值是0.05,这是一种约定俗成。针对实例问题:0.05,相关显著性检验步骤,选择统计量并计算 t检验:,针对实例问题:,F检验:,根据显著性水平和分布查表求临界值t 针对问题实例:df=n-2=44 t0.052.02判断与结论 如果t t,拒绝H0,显著差异;否则接受H0,无显著差异。针对问题实例:t13.09 t0.052.02 拒绝H0,说明在安徽岳西地区降雨量和土壤侵蚀的相关性显著。,统计学家为方便应用,根据上述t检验制成了相关系数显著性表在实际应用中,更多的是直接根据相关系数大小查相关系数

5、显著性表判断r是否显著 方法根据自由度和显著性水平查相关系数显著性表得到临界r值,如果计算r值大于临界r值,则相关性显著。,延伸的问题:如果有很多相关系数需要检验,怎么办?,针对实例问题:r=0.892 df=n-2=46-2=44,查相关系数显著性表得到临界r值:r0.05=0.288 因r=0.892 r0.05=0.288 所以判断在安徽岳西地区降雨量和土壤侵蚀的相关性是显著的。,等级相关,计算积差相关前提或要求:两变量正态分布;两变量为等距或等比数据。如果上述两条件之一不满足,此时宜采用等级相关分析。最常用的为Spearman等级相关。适用于度量定序变量与定序变量之间的相关;不要求正态

6、分布。,Spearman等级相关系数计算,或,Spearman等级相关检验,Spearman等级相关检验,判断是否线性相关,这是进行相关分析的前提;散点图的重要性:线性相关?;相关程度判断;异常点影响;分层资料影响;变量数据类型选择积差相关或等级相关;参与相关分析的两个变量是对等的,不分自变量和因变量;相关系数检验是否存在相关或总体相关系数是否为0的判断。,相关分析要点,练习安徽岳西 侵蚀.xls如果存在相同等级情况出现,等级相关系数计算公式为:,SPPS 练习文件,偏相关分析,事物之间的联系往往十分复杂,一个结果常常是受到多种因素相互综合作用下产生的。在多变量的情况下,变量之间的相关关系是很

7、复杂的。例:在研究某作物产量与降雨量时,作物产量和降雨量之间的关系中实际还包含了温度对产量的影响,在这种情况下单纯计算简单相关系数,显然不能准确地反映事物之间地相关关系,而需要在剔除其他相关因素影响的条件下计算相关系数。偏相关分析正是用来解决这个问题的。因此多元相关分析除了要利用上一节的简单相关系数外,还要进行偏相关分析,计算偏相关系数。,偏相关分析是指在对其他变量的影响进行控制的条件下,分析多个变量中某两个变量之间的线性相关程度,计算偏相关系数。计算简单相关系数只需要掌握两个变量的观测数据,并不考虑其他变量对这两个变量可能产生的影响。计算偏相关系数时需要掌握多个变量的数据,一方面考虑多个变量相互之间可能产生的影响,一方面又采用一定方法控制其他变量,考察两个特定变量的净相关关系。变量之间存在错综复杂的关系,偏相关系数与简单相关系数在数值上可能相差很大,甚至符号都可能相反,偏相关系数更能反映现象之间的真实关系。例:商品的需求同时受收入水平和价格的影响,在一定的收入水平下,商品的价格越高,商品的需求量应该越小。可是实际生活中,收入和价格常常都有不断提高的趋势,如果不考虑收入对需求影响,仅利用需求和价格的数据去计算简单相关系数,可能得出价格越高需求越大的错误结论。,偏相关系数计算,偏相关系数其检验,End,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号