《第29章路径分析课件.pptx》由会员分享,可在线阅读,更多相关《第29章路径分析课件.pptx(44页珍藏版)》请在三一办公上搜索。
1、IBM-SPSS,第29章 路径分析,前面的多元回归分析常用于对影响因素的分析,但由于只考察变量之间的直接作用,而实际上变量之间的相关关系往往是一个复杂的传递过程,因此需要一种可以全面地考察变量间的相互作用,包括直接作用和间接作用的方法,即本章所介绍的路径分析(通径分析)。,路径分析通过构建路径图直观地显示变量间的结构关系,在多元回归的基础上计算变量间的相关系数,计算结果给出的线性回归方程的标准系数(Standardized Coefficients)也就是我们需要的路径系数。路径系数分为直接路径系数(某一自变量对因变量的直接作用)和间接路径系数(该自变量通过其他自变量对因变量的间接作用)两种
2、。在一个构造合适的路径图中,任何两个变量间的相关系数就是连结这两点之间的所有复合链上的路径系数的乘积之和,路径模型的假设条件和限制(1)首先要求模型中各变量的函数关系为线性、可加;否则不能采用回归方法估计路径系数。如果处理变量之间的交互作用,把交互项看作一个单独的变量,此时它与其它变量的函数关系同样满足线性、可加。(2)模型中各变量均为等间距测度。(3)各变量均为可观测变量,并且各变量的测量不能存在误差(4)变量间的多重共线性程度不能太高,否则路径系数估计值的误差将会很大。(5)需要有足够的样本量。Kline(1998)建议样本量的个数应该是需要估计的参数个数的10倍(20倍更加理想)。,路径
3、模型的调试,过程类似于多元回归过程的调试,如果某一变量的路径系数(回归系数)统计性不显著,则考虑是否将其对应的路径从模型中删去;如果多个路径系数同时不显著,则首先删除最不显著的路径继续进行回归分析,根据下一步的结果再决定是否需要删除其它原因变量。进行调试的一般原则,实际进行调试时,还必须考虑模型的理论基础。作为研究焦点的因果联系必须要有足够的理论根据,即使其统计不显著,仍然应当加以仔细考虑,并寻找其统计不显著的原因:是否是多重共线性的影响,还是其它路径假设的不合理而影响了该路径的显著性。,模块解读,1变量转换因为性别为属性变量,我们无法对字串变量进行回归分析,所以需要用转换功能将性别m(男)和
4、f(女)转换分别成虚拟数字变量1和0。单击“转换”|“重新编码为不同变量”命令,弹出变量转换对话框,如图29-4所示。“输出变量”框中“名称”栏输入一个新的变量“gender1”,“标签”是“性别”,然后单击“更改”。,2“旧值和新值”按钮单击“旧值和新值”按钮,弹出图29-5所示的“旧值和新值”对话框,此对话框可用于对目标变量进行具体变量的转换。在“旧值”的“值”栏里输入需要转换的目标变量“m”,“新值”的“值”中输入新的值“1”,单击“添加”按钮,再以同样方法添加“f”和“0”,单击“确定”按钮,即生成一个新的变量“gender1”,如图29-6所示。,3年龄转换由于年龄比出生日期更简洁直
5、观,我们把出生日期转换成年龄进行分析,因为统计资料的时间不清楚,用现在时间计算并不影响结果,所以算当下时间的年龄。单击“转换”|“日期和时间向导”命令,弹出图29-7所示的对话框,选择“使用日期和时间进行计算”选项,单击“下一步”按钮,弹出图29-8所示的对话框,日期和时间向导第一步对话框。,4计算当前年龄在日期和时间向导第一步对话框中选择“计算两个日期之间的时间数”,单击“下一步”弹出图29-9第二步对话框,把变量列表中的“STIME”和“bdate”放入相应栏中,点开“单位”下拉列表,选择“年份”,在“结果”复选框中选择“取整”。,单击“下一步”按钮,弹出图29-10第三步对话框,在“结果
6、变量”栏里输入计算生成的新的变量名称“age”,“变量标签”栏中输入“年龄”给新的变量加上标签,单击“完成”即可生成一个新的变量,如图29-11所示。,5计算路径系数单击“分析”|“回归”|“线性”命令,弹出线性回归对话框,如图29-12所示。“因变量”框中放入本次需要比较的变量“salary”,把要比较的八个因素“educ”、“salbegin”、“minority”“jobcat”“gender1”“prevexp”和“jobtime”放入“自变量”框中,方法选择“进入”。,6.“统计量”按钮单击“统计量”按钮,弹出图29-13所示的“统计量”对话框,选择“描述性”,单击“继续”完成选择,
7、回到线性回归对话框单击“确定”按钮即可计算回归系数。,实例详解,例29.1:我们采用SPSS软件系统自带的数据文件Employee data.sav(可在SPSS软件的子目录下找到该数据)来进行路径分析。该数据收录了474个员工的人事工资资料,序号为434的缺失出生日期,所以有效为473个,在接下来的分析中,剔除该样品;该数据包含有:id(编码)、gender(性别)、bdate(Date of Birth,出生日期)、educ(Educational Level,受教育水平)、jobcat(Employment Category,职位类别)、salary(Current Salary,目前工
8、资)、salbegin(Beginning Salary,初始工资)、jobtime(Months since Hire,已工作时间),、prevexp(Previous Experience,以前的工作经验)、minority(是否是少数民族)等10个变量。gender为属性变量,用“f ”表示female女性,“m ”表示male男性;educ使用受教育的年数衡量;jobcat分为三类:“1”表示clerical(文员),“2”代表custodial(保管人员),以“3”表示manager(管理人员)。当前工资和初始工资以实际额为准。已经工作的时间和以前的工作经验均以月为单位来衡量;是否是
9、少数民族为“0”、“1”变量,“1”表示“Yes”,是少数民族,“0”表示“No”非少数民族。用出生日期的年份数来计算出新变量年龄代替出生日期进行分析。,1以“salary”为因变量操作步骤如下:(1)单击“分析”|“回归”|“线性”命令,弹出图29-12所示。“因变量”框中放入本次需要比较的变量“salary”,把“educ”、“salbegin”、“minority”“jobcat”“gender1”“prevexp”和“jobtime”放入“自变量”,方法选择“进入”。2)单击“统计量”按钮,弹出图29-13所示的对话框,选中“描述性”项,单击“继续”按钮,返回图29-7,单击“确定”运
10、行,输出结果。,结果解读:图29-16所示为模型汇总,R方=0.841,说明模型可解释的变异度较高。,图29-17所示为方差分析结果,F=358.914,P=0.000,说明回归模型有意义。,图29-18所示为回归模型的系数。,2以“educ”为因变量操作步骤同上,“因变量”框中放入“educ”,自变量为“minority”、“gender1”和“age”,输出结果图29-19所示为模型汇总,可见R方=0.212,解释效果不是很好。,图29-20所示为模型方差分析结果,可见F=42.098,P=0.000,模型有意义。图29-21所示为模型系数。,以“jobcat”为因变量,“educ”、“g
11、ender1”和“prevexp”为自变量,结果可见,图29-22所示为模型汇总情况,R方=0.329,解释度较低,,但图29-23所示为模型方差分析结果依然有统计学意义,P=0.00。图29-24所示为模型系数。,以“prevexp”为因变量,“gender1”和“age”为自变量输出结果可见,图29-25所示为模型汇总,R方=0.687,该模型对变异的解释度尚可,,,图29-26所示为模型方差分析结果,P=0.00,反映模型有意义,图29-27所示为模型系数。,以“salbegin”为自变量,“minority”、“educ”、“jobcat”、“gender1”和“prevexp”为自变量输出结果,其结果解释同上,此处不一一叙述。,以“job time”为因变量,“age”为自变量,输出结果,其结果解释同上,此处不一一叙述。,完成路径图根据以上6次回归的结果,6次输出的标准系数即是路径系数(直接效果),我们可以完成模型1的路径图,如图29-34所示。,图29-35所示为变量相关性列表,图29-36所示为路径系数分解表。,THE END,