《医学统计学相关线性回归.ppt》由会员分享,可在线阅读,更多相关《医学统计学相关线性回归.ppt(39页珍藏版)》请在三一办公上搜索。
1、直线回归与相关,目的要求1、掌握直线回归的概念、直线回归系数的意义。2、掌握直线相关的概念,相关系数的意义。3、掌握直线相关与回归的区别和联系,应用时注意事项。4、熟悉求直线回归方程的一般步骤。5、熟悉求直线相关系数的一般步骤。6、熟悉等级相关的适用条件及其应用。,直线回归与相关的区别和联系,一、区别 1、对资料要求不同(1)回归分析要求因变量是Y服从正态分布的随机变量,X是可以精确测量和严格控制的变量,一般称型回归,即只能由X推算Y。(2)相关分析要求两个变量X、Y是均服从正态分布的随机变量,即双变量正态分布。对这种资料进行回归分析称型回归,可以求出两个方程:,由X推算Y的方程:由Y推算X的
2、方程:,2、应用不同:说明两变量间依存变化的数量关系用回归,说明变量间的相关关系用相关。3、意义不同:b表示X每增(减)一个单位,Y平均改变b个单位;r说明具有直线关系的两个变量间相关关系的密切程度与相关的方向。4、计算方法不同。5、取值范围不同;-1r1,-b+。6、b有单位,r没有单位。,二、联系1、对一组数据若同时计算r与b,则它们的正负号是一致的。2、r和b的假设检验是等价的,即对同一资料,两者的t值相等()。在实际中采用对r的检验来代替对b的检验。3、可用回归解析相关。r的平方,即r2,称决定系数,它说明回归平方和(SS回)占总平方和(SS总)的比重,其取值范围在01之间。,上式说明
3、,当SS总固定不变时,SS回的大小取决于r2。r2越大,则SS回就越大;SS回是由于引入了相关变量后使总平方和减少的部分。SS回越接近SS总,则r2越接近1,说明引入相关变量的效果越好。,可通过r2的大小来确定两变量间相关关系的实际意义。例如r=0.2,n=100时,可以认为两变量间有直线相关关系,但r2=0.04,表示回归平方和在总平方和中仅占4%,即X对Y的影响仅占4%,实际意义不大。,在临床研究中,若r2达到0.7以上,就可认为回归效果不错;但在实验室研究中,如标准线的配制,r2的要求很高,达到0.95以上。,判断回归方程效果的指标:1、剩余标准差 2、残差 3、决定系数,P444,回归
4、分析的一般步骤:1.绘制散点图,初步判断是否呈直线趋势 2.计算a、b。(如果基本呈直线趋势)3.对b作假设检验 方法:(1)F检验(2)t检验(3)用r检验来代替。,4.作结论 如P0.05,说明方程成立,列出回归方程;如P 0.05,说明方程不成立,不列回归方程。,(教材:P121,例 9-1),1.数据录入,变量值录入,定义变量,2.绘制散点图,Graphs,Scatter/Dot,点击,弹出对话框,文件中变量列表,数据基本呈直线趋势,可用直线回归分析。,结果输出窗口,3.回归分析,Analyze,Regression,Linear,弹出主对话框,自变量,自变量,因变量,弹出对话框,返回
5、主对话框,返回主对话框,弹出对话框,标准化预测值,标准化残差,学生化残差,选“*SRESID”作为y轴,“DEPENDNT”为x轴,并选取“Normal probability plot”,返回主对话框,返回主对话框,弹出对话框,对回归分析的结果保存,如残差、预测值,返回主对话框,返回主对话框,弹出对话框,返回主对话框,返回主对话框,结果输出窗口,结果输出窗口,P值,P值,a值,结果输出窗口,残差的正态P-P图,结果输出窗口,体重与学生化残差散点图,如果散点出现明显的规律,表示存在自相关或非线性或方差不齐。,不能直接采用直线回归分析。,散点呈随机分布,斜率为0,说明误差项独立,独立性假设成立。
6、,由X推Y的回归方程为:Y=-58.235+0.716X,相关分析的一般步骤:1.绘制散点图 2.求r 3.对r作假设检验:(1)t检验;(2)查表 4.作结论:有无相关及其方向,(教材:P121,例 9-1),1.数据录入,变量值录入,定义变量,2.绘制散点图,Graphs,Scatter/Dot,点击,弹出对话框,文件中变量列表,数据基本呈直线趋势,可用直线相关分析。,结果输出窗口,3.相关分析,Analyze,Correlate,Bivariate,弹出主对话框,相关系数,点击,弹出对话框,返回主对话框,返回主对话框,点击,结果输出窗口,r值,P值,习题(P447,第四单元及例9-2,9-4)1.回归分析2.相关分析3.等级相关分析 等级:数字:0 1 2 3 4,