《Spss线性回归分析讲.ppt》由会员分享,可在线阅读,更多相关《Spss线性回归分析讲.ppt(31页珍藏版)》请在三一办公上搜索。
1、管理学分析方法 spss线性回归分析,回归分析,(一)回归分析内涵1、含义:回归分析是指通过一个变量或一些变量的变化解释另一个变量的变化。因果关系预测一般采用回归分析方法预测。2、回归的分类(1)按自变量的个数分一元线性回归:y=a+bx(有一个自变量)多元线性回归:(有两个或两个以上的自变量)(2)按回归曲线的形态分线性(直线)回归非线性(曲线)回归,回归分析,(二)回归分析的主要内容1、从一组数据出发,确定因变量和自变量的关系式;2、对关系式中的参数进行估计,并进行统计检验;3、筛选自变量,即从大量自变量中找出影响显著的,剔除不显著的;4、用求得的回归模型进行预测;5、对预测结果进行分析、
2、评价。(三)回归分析的作用通过回归分析找出变量之间的关系,并确定之间的因果关系,通过数学模型预测因变量的发展。,一元线性回归,一、一元线性回归模型,存在偏差,最小二乘法,X为自变量的取值,,为因变量的取值,a为拟合线上经过Y轴上的,点截距,b为拟合线上的斜率,Y=a+bx,Y,X,一元线性回归,二、一元线性回归spss操作过程1创建一个数据文件数据文件的创建分成三个步骤:(1)选择菜单【文件】【新建】【数据】新建一个数据文件,进入数据编辑窗口。窗口顶部标题为“spss 数据编辑器”。(2)单击左下角【变量视窗】标签进入变量视图界面,根据试验的设计定义每个变量类型。(3)变量定义完成以后,单击【
3、数据视窗】标签进入数据视窗界面,将每个具体的变量值录入数据库单元格内。,图1 奖金-销售量表,一元线性回归,以奖金-销售量表图1做回归分析2、绘制散点图 打开数据文件,选择【图形】-【旧对话框】-【散点/点状】,图2,选择简单分布,单击定义,打开子对话框,选择X变量和Y变量,如图3单击确定提交系统运行,结果见图4所示,图3,一元线性回归,从图上可直观地看出奖金与销售量之间存在线性相关关系,图4 散点图,销售量,奖金,一元线性回归分析,3、简单相关分析选择【分析】【相关】【双变量】,打开对话框,将变量“销售量”与“奖金”移入变量(variables)列表框点击确定运行,结果如表5 所示,一元线性
4、回归分析,从表中可得到两变量之间的皮尔逊相关系数为0.995,双尾检验概率p值尾0.0000.05,故变量之间显著相关。根据奖金与销售量之间的散点图与相关分析显示,奖金与销售量之间存在显著的正相关关系。在此前提下进一步进行回归分析,建立一元线性回归方程。,表1,一元线性回归,4、线性回归分析,步骤1:选择菜单栏“【分析】【回归】【线性】”,打开线性回归 对话框。将变量销售量y移入【因变量】列表框中,将奖金x移入【自变量】列表框中。在【方法】框中选择【进入】选项,表示所选自变量全部进入回归模型。,一元线性回归分析,步骤2:单击【统计量】按钮,如图在【统计量】子对话框。该对话框中设置要输出的统计量
5、。这里选中估计、模型拟合度复选框。,一元线性回归分析,步骤3:单击【绘制】按钮,在【图】子对话框中的标准化残差图选项栏中选中正态概率图复选框,以便对残差的正态性进行分析,步骤4:单击【保存】按钮,在【保存】子对话框中【残差】选项栏中选中【未标准化】复选框,单击【继续】这样可以在数据文件中生成一个变量名尾res_1 的残差变量,以便对残差进行进一步分析。,一元线性回归分析,其余保持Spss默认选项。在主对话框中单击确定按钮,执行线性回归命令,其结果如下:,表3给出了回归模型的拟和优度(R Square)、调整的拟和优度(Adjusted RSquare)、估计标准差(Std.Error of t
6、he Estimate)以及DurbinWatson统计量。从结果来看,回归的确定系数和调整的可决系数分别为0.989和0.988,即销售量的95以上的变动都可以被该模型所解释,拟和优度较高。,表2,表3,一元线性回归分析,表4给出了回归模型的方差分析表,可以看到,F统计量为734.627,对应的p值为0,所以,拒绝模型整体不显著的原假设,即该模型的整体是显著的。,表4,一元线性回归分析,表5给出了回归系数、回归系数的标准差、标准化的回归系数值以及各个回归系数的显著性t检验。从表中可以看到解释变量x及常量其t统计量对应的p值都小于显著性水平0.05,因此,在0.05的显著性水平下都通过了t检验
7、。变量x的回归系数为2.964,即奖金每增加1%,销售量就增加2.964。,表5,为了判断随机扰动项是否服从正态分布,观察图5所示的标准化残差的PP图,可以发现,各观测的散点基本上都分布在对角线上,据此可以初步判断残差服从正态分布。,图5,一元线性回归分析,4、建立回归模型:根据一元回归模型:把表5中“非标准化回归系数”栏目中的“B”列系数代入上式得预报方程:,多元线性回归分析,一、多元线性回归模型,影响因变量的自变量有两个或两个以上的时候,称之为多元,如果他们之间有线性关系,就是多元线性回归。,多元线性回归分析在spss分析过程和一元线性回归分析差不多,下面列出不同点,多元线性回归分析,1、
8、做散点图多个变量则做出散点图矩阵、重叠散点图和三维散点图,重叠散点图,三维散点图,多元线性回归分析,2、在【线性回归】对话框中【方法】,自变量筛选方法全回归法Enter向前删除法Forward向后删除法Backward 逐步回归法Stepwise强迫剔除法Remove,多元线性回归,二、多元线性回归分析的要点 在多元线性回归中,有多个自变量,应当首先绘制各自变量与因变量之间的关系散点图,观察其与因变量之间是否具有线性关系。然后,将自变量进行组合,生成若干自变量的子集,再针对每一个自变量的子集生成回归分析报告。比较调整后的R2值,挑选最优的自变量子集,生成回归分析模型。,多元线性回归,三、线性回
9、归检验(一)复相关系数R及判定系数R2确定系数又叫判定系数,为回归的误差平方和占总误差平方和的比例,是对线性方程拟合优度的检验。R=S回/S总(-1R1)1、R=1时,样本点完全落在回归直线上,表示y与x完全线性正相关,R=-1时,表示y与x完全线性负相关2、当0R1时,表示y与x有一定线性正相关3、当-1R0时,表示y与x有一定线性负相关4、当R=0时,表示y与x之间不存在线性相关关系总结:R越接近1拟合度就越好,多元线性回归,(二)回归直线意义的F检验1、统计量F=平均回归平方和/平均残差平方和。若F值过小说明自变量对因变量的解释力度很差,拟合的回归直线没有意义,相反若概率值(SPSS中以
10、sig表示,越小越好)2、FFa且PFa,则拒绝H0假设,即P=Pa(sig)注:可查F-分布表得Fa的值。,(三)T检验1、是对回归方程每一个回归系数检验。2、T检验方法与F检验方法差不多,在spss分析结果表中以sig表示,即P值越小就说明回归系数与因变量的相关度高。3、假设检验H0:B1=0 B2=0,H1:B10 B2 0注:查T-分布表,(四)残差的独立性检验Durbin-Watson检验的参数D的取值范围是0D4,与2越接近表示残差与自变量越独立。见下图,多重共线性问题,1、多重共线性的标志R平方较大但没有几个显著的t统计量,预示着多重共线性的存在。实际上,有可能回归方程的F统计量高度显著,而每个t统计量不显著一对或多对解释变量的简单相关系数相对比较高可能意味着多重共线的存在,2、多重共线性克服在运用spss分析时,可采用逐步回归法来克服多重共线性问题,看例子“农民工流动的问题及需求分析基于多元线性回归分析”,“云南主要农产品出口贸易对云南经济增长的影响基于多元线性回归模型的实证分析”,