用SPSS做回归分析.ppt

上传人:牧羊曲112 文档编号:5368900 上传时间:2023-06-30 格式:PPT 页数:35 大小:1.06MB
返回 下载 相关 举报
用SPSS做回归分析.ppt_第1页
第1页 / 共35页
用SPSS做回归分析.ppt_第2页
第2页 / 共35页
用SPSS做回归分析.ppt_第3页
第3页 / 共35页
用SPSS做回归分析.ppt_第4页
第4页 / 共35页
用SPSS做回归分析.ppt_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《用SPSS做回归分析.ppt》由会员分享,可在线阅读,更多相关《用SPSS做回归分析.ppt(35页珍藏版)》请在三一办公上搜索。

1、3.4 用SPSS作回归分析,一、简介,在现实生活中,客观事物常受多种因素影响,我们记录下相应数据并加以分析,目的是为了找出对我们所关心的指标(因变量)Y有影响的因素(也称自变量或回归变量)x1、x2、xm,并建立用x1、x2、xm预报Y的经验公式:,从而用以进行预测或控制,达到指导生产活动的目的。,多元线性回归,以年龄为自变量x,血压为因变量y,可作出如下散点图:,例1、某医学研究所对30个不同年龄的人的血压(高压)进行了测量,得到如下数据:,为了判断经验公式是否可用线性函数来拟合,可以画出散点图观察。其方法如下:,双击,改变显示格式,改变坐标轴的显示,为了求得经验公式,可通过如下步骤进行:

2、,从散点图可以看出年龄与血压有线性关系:,当自变量和因变量选好后,点击 OK 键,Model为回归方程模型编号(不同方法对应不同模型)R为回归方程的复相关系数R Square即R2系数,用以判断自变量对因变量的影响有多大,但这并不意味着越大越好自变量增多时,R2系数会增大,但模型的拟合度未必更好Adjusted R Square即修正R2,为了尽可能确切地反映模型的拟合度,用该参数修正R2系数偏差,它未必随变量个数的增加而增加Std.Error of the Estimate是估计的标准误差,结果说明常用统计量:,Sum of Squares为回归平方和(Regression)、残差平方和(R

3、esidual)、总平方和(Total)df 为自由度Mean SquareFSig 为大于F的概率,其值为0.000,拒绝回归系数为0的原假设:b0=b1=0即认为回归方程显著性成立,结果说明方差分析:,Model 为回归方程模型编号Unstandardized Coefficients 为非标准化系数,B为系数值,Std.Error为系数的标准差Standardized Coefficients 为标准化系数t 为t检验,是偏回归系数为0(和常数项为0)的假设检验Sig.为偏回归系数为0(和常数项为0)的假设检验的显著性水平值B 为Beta系数,Std.Error 为相应的标准差,结果说明

4、回归系数分析:,第一导丝盘速度Y是合成纤维抽丝的重要因素,它与电流的周波X有密切关系,由生产记录得:,试求Y对X的经验回归直线方程,并求误差方差2的无偏估计值。检验X与Y之间是否存在显著的线性关系(取=0.01)?,例.概率论与数理统计P267,检验说明线性关系显著,操作步骤:AnalyzeRegression Linear StatisticsModel fit Descriptives,结果:,对于多元线性回归主要需研究如下几个问题:,建立因变量Y与x1、x2、xm的经验公式(回归方程)对经验公式的可信度进行检验判断每个自变量xi(i=1,m)对Y的影响是否显著?利用经验公式进行预报、控制

5、及指导生产诊断经验公式是否适合这组数据,方差分析的主要思想是把 yi 的总方差进行分解:,模型平方和,误差平方和,二、多元线性回归,参数估计方法最小二乘法回归方程显著性的检验就是检验以下假设是否成立(采用方差分析法):,如果自变量对Y的影响显著,则总方差主要应由xi引起,也就是原假设不成立,从而检验统计量为:,多元线性回归的方差分析表:,在实际问题中,影响因变量Y的因素(自变量)可能很多。在回归方程中,如果漏掉了重要因素,则会产生大的偏差;但如果回归式中包含的因素太多,则不仅使用不便,且可能影响预测精度。如何选择适当的变量,建立最优的回归方程呢?,在最优的方程中,所有变量对因变量Y的影响都应该

6、是显著的,而所有对Y影响不显著的变量都不包含在方程中。选择方法主要有:,逐步筛选法(STEPWISE)(最常用)向前引入法(FORWARD)向后剔除法(BACKWARD)等,逐步回归变量选择问题,开始,对不在方程中的变量考虑能否引入?,引入变量,能,对已在方程中的变量考虑能否剔除?,能,剔除变量,否,筛选结束,否,逐步回归的基本思想和步骤:,某地区大春粮食产量 y 和大春粮食播种面积x1、化肥用量x2、肥猪发展头数x3、水稻抽穗扬花期降雨量x4的数据如下表,寻求大春粮食产量的预报模型。,例2、大春粮食产量的预报模型,按GraphsScatter Simple顺序展开对话框将y选入Y Axis,

7、然后将其余变量逐个选入X Axis,绘出散点图,观察是否适宜用线性方程来拟合。,1.初步分析(作图观察),按StatisticsRegression Linear顺序展开对话框将y作为因变量选入Dependent框中,然后将其余变量选入作为自变量选入Independent(s)框中,Method框中选择Stepwise(逐步回归)作为分析方式,单击Statistics按钮,进行需要的选择,单击Continue返回单击OK按钮执行,2.回归模型的建立,被引入与被剔除的变量,回归方程模型编号,引入回归方程的自变量名称,从回归方程被剔除的自变量名称,回归方程中引入或剔除自变量的依据,3.结果分析,由

8、复相关系数R=0.982说明该预报模型高度显著,可用于该地区大春粮食产量的短期预报,常用统计量,方差分析表,回归方程为:,按常识理解,粮食产量和播种面积关系密切,但预报模型中,变量x1未引入,这是因为:,多年来该地区的大春粮食播种面积变化甚微,近于常数,因而对产量的影响不大而失去其重要性。,回归系数分析,在汽油中加入两种化学添加剂,观察它们对汽车消耗1公升汽油所行里程的影响,共进行9次试验,得到里程Y与两种添加剂用量X1、X2之间数据如下:,试求里程Y关于X1、X2的经验线性回归方程,并求误差方差2的无偏估计值。,例.概率论与数理统计P280,检验说明线性关系显著,结果:,在实际问题中,常会遇

9、到变量之间关系不是线性的相关关系,而是某种曲线的非线性相关关系。此时首先要确定回归函数的类型,其原则是:,根据问题的专业知识或经验确定根据观测数据的散点图确定,常选曲线类型:双曲线、幂函数曲线、对数曲线、指数曲线、倒数指数曲线、S形曲线,三、非线性回归,鼠标在选项上点击右键可看到相应模型类型,操作步骤:AnalyzeRegression Curve Estimation,结合SPSS的曲线模型选择:,测量13个样品中某种金属含量Y与该样品采集点距中心观测点的距离X,有如下观测值:,求Y关于X的关系式。,例.概率论与数理统计P286,首先绘出散点图:,Graphs Scatter Simple,

10、步骤:,根据散点图的形态可以认为变量X与Y之间具有对数曲线类型的回归方程:,通过点击右键观看选择适当的类型:Logarithmic,操作步骤:AnalyzeRegression Curve Estimation,结果如右:,由图易知,结果方程与书上结果有差距,因此我们有理由怀疑,原来的数据可能有错误(一般是打印错误),再结合原数据分析发现,Y=110.62是比较合适的,更改后再求解,由图易知,结果方程与书上结果很接近,通过对图形仔细分析,可以发现X=14时,Y=106.62导致图形剧烈变化!,例.概率论与数理统计P286,电容器充电到电压100伏时,开始放电测得时刻ti时的电压ui数据如下:,找出时刻ti与电压ui的关系式。,思考:仍有差异的原因?,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号