结构模型的建立与检验.ppt

资源描述

《结构模型的建立与检验.ppt》由会员分享，可在线阅读，更多相关《结构模型的建立与检验.ppt（122页珍藏版）》请在三一办公上搜索。

1、管理研究方法,主讲：赵晓煜,研究生课程,第5章结构模型的建立与检验,研究生课程,主要内容,1.假设检验的基本概念2.卡方检验3.方差分析4.相关分析与回归分析5.调节效应和中介效应,1.假设检验的基本概念,在管理研究中涉及到对一些假设的检验，常见的假设包括,反映两个变量之间的相关性顾客满意度越高、顾客的忠诚度就越高两个不同样本间某个统计量是否有差异广泛采用了信息技术的企业，企业绩效是否要好于没有采用信息技术的企业？,假设检验的基本步骤,1.形成零假设（空假设）和备选假设（备择假设）2.选择正确的统计技术和合适的检验统计量3.设置显著性水平4.抽样、收集数据并进行检验统计量实现值的计算5.确

2、定在空假设的前提下检验统计量实现值发生的概率，看其是否比预先设定的显著性水平还小，如果是则拒绝原假设。,H0,H1,1.假设检验的基本概念,在假设检验中，一般要设立一个原假设而设立该假设的动机主要是企图利用人们掌握的反映现实世界的数据来找出假设与现实之间的矛盾，从而否定这个假设。,企图肯定什么事物很难，而否定却要相对容易得多。这就是假设检验背后的哲学。,备选假设应该按照实际世界所代表的方向来确定，即它通常是被认为可能比零假设更符合数据所代表的现实。,1.假设检验的基本概念,例如：某公司计划针对老客户开展一项新服务，如果有40%的老客户支持这项服务，则决定推行这项新服务，这是典型的单尾检验H0:

3、p 0.4,例如：某公司认为客户每周光临门店的次数是2次，于是作如下假设。这是典型的双尾检验H0:u=2 H1:u 2,1.假设检验的基本概念,1.假设检验的基本概念,数据的代表是作为其函数的统计量；它在检验中被称为检验统计量（test statistic）,根据零假设（不是备选假设！），可得到该检验统计量的分布；再看这个统计量的数据实现值（realization）属不属于小概率事件。,如果的确是小概率事件，那么就有可能拒绝零假设，或者说“该检验显著”；否则说“没有足够证据拒绝零假设”，或者“该检验不显著。”因此，假设检验也被称为显著性检验(significant test)。,1.假设检验的

4、基本概念,显著性水平a，表示允许小概率事件发生的最大可能,小概率并不能说明不会发生，仅仅发生的概率很小罢了。拒绝正确零假设的错误常被称为第一类错误（type I error）。,在备选假设正确时反而说零假设正确的错误，称为第二类错误（type II error）。,负责任的态度是无论做出什么决策，都应该给出该决策可能犯错误的概率,1.假设检验的基本概念,在零假设下，检验统计量取其实现值及更加极端值的概率称为p-值（p-value）。,如果得到很小的p-值，就意味着在零假设下小概率事件发生了。如果小概率事件发生，是相信零假设，还是相信数据呢？,当然多半是相信数据，拒绝零假设。,H0,H1,1.假

5、设检验的基本概念,小窍门,记住：如果计算出来的检验统计量比临界值大，或计算出来的检验统计量发生的概率比设定的显著性水平下，则拒绝零假设。,假设检验,相关检验,差异检验,均值,分布,比例,假设检验的广义分类,1.假设检验的基本概念,1.假设检验的基本概念,管理研究中理论模型的假设与假设检验的关系,员工满意度,顾客满意度,假设：顾客的满意度与员工的满意度正相关。,员工满意度4.5顾客满意度4.3,员工满意度2.5顾客满意度2.3,尽管对与某个变量相关的单个问题的回答是令人感兴趣的,但有时变量间的关系更为调研者所关心,对某品牌的忠诚度与性别有关吗?产品的使用程度与户外活动的兴趣有关吗?对某种新产品的

6、熟悉程度与年龄有关吗?某种产品的购买情况与收入有关吗?,2.卡方检验,列联表（交叉表）反映了两个或多个有限取值的类别变量的联合分布,卡方检验（Chi-square）被用来检验样本内每一类别的实际观测数目与某种条件下的理论期望数目是否存在显著差异,卡方检验中的零假设（H0）通常是认为变量间相互独立（不存在显著关联）,卡方检验涉及到自由度的概念，可以认为是观测值自由取值的程度:（r-1）*（c-1）,2.卡方检验,列联表的一般形式,列联表的形式,建立列联表的通常做法是设计一个表，在这张表中，各列列出各种不同因素，如人口统计和生活方式特征，它们可以作为各行所列因素如心理、行为或意愿的预测指标。采用这

7、种方法可以简单比较各种关系，如心理、行为或意愿数据与性别或年龄之间的关系。,列联表中的差异度量,卡方检验的例子,一个关于软饮料市场的调研活动，得到了按性别区分的最畅销品牌，二者存在明显联系吗？,卡方检验的例子,查表可知，在0.05显著水平。自由度为(8-1)(2-1)7的条件下，x2值为14.07。计算得到的值9.53314.07。这说明，购买者的性别和购买的品牌之间并没有显著的联系。,卡方检验的例子,3.方差分析,3.1 方差分析简介,方差分析（ANalysis Of VAriance,ANOVA）,在管理研究中，一些作为定类变量的自变量有两个以上的类别，这些自变量对定量因变量的作用可以通过

8、方差分析来考察，从中得出有用的信息,例如：需要考察不同类型的使用者（不使用者、轻度使用者、重度使用者）对某品牌的态度是否存在显著差异,方差分析是作为两组或两组以上均值差异的检验使用的，通常零假设为各组均值相等,方差分析最简单的形式中，必须有一个定量的（定距或定比）因变量，以及一个或多个自变量，通常，自变量是定类的，称为因素，一个因素水平的特定组合被称为一种处理,例如：检验对具有不同社会和经济风险的产品进行网上购物的偏好差异时，可采用方差分析，经济和社会风险都被分为两个水平（高、低），对电子化购物的偏好作为因变量,单因素（one-way）方差分析只涉及一个定类自变量或单一因素,3.1 方差分析简

9、介,如果涉及两个或两个以上的定类自变量（因素），就称为n因素方差分析,例如：在考虑调查对象对营养和早餐重要性态度的前提下，了解普通产品使用组和忠诚组对品牌偏好的差异时，就采用协方差分析,其中的定类自变量仍称为因素，定量自变量成为协变量（covariate）,如果自变量中即包含定类变量，也包含定量变量，这种分析就称为协方差分析（Analysis of Covariance,ANCOVA）,3.1 方差分析简介,方差分析与t检验和回归分析的关系,t检验只涉及一个二分的自变量，而ANOVA中的定类自变量可以由两个以上的类别回归分析也可以涉及一个以上的自变量，虽然有时将定类自变量表示成虚拟变量，但通常

10、情况下自变量是以定距尺度衡量的,ANOVA,3.1 方差分析简介,管理研究者通常需要考察因变量在单一自变量或因素的各种状态下均值的差异,对这些类似问题的答案，可以通过单因素方差分析来得出,3.2 单因素方差分析,各个细分市场的产品消费量有差异吗？接触不同电视广告的组对品牌的评价有差异吗？零售商、批发商、分销商对厂家分销政策的态度一致吗？,单因素方差分析的步骤,确定自变量和因变量,确定自变量和因变量总方差分解强度测量显著性检验结果解释,因变量以Y表示，自变量以X表示，X是定类变量，共有p类。,3.2 单因素方差分析,总变差分解因为方差分析考察的是样本的差异性或者变差，并根据这种差异性来

11、决定组均值是否相等,线性模型,模型中的假定,涉及的假设,H0:m1=mp,3.2 单因素方差分析,总变差分解和显著性检验,总平方和=组间平方和+组内平方和,其中,SST 有自由度 n-1,SSB有自由度 p-1,SSE 有自由度 n-p,在正态分布的假设下,如果各组均值相等(零假设),则检验统计量,服从自由度为 p-1 和n-p 的F 分布,3.2 单因素方差分析,总变差分解,3.2 单因素方差分析,强度测量eta的平方在0-1范围内取值,结果解释如果组均值相等的假设没有被拒绝，自变量对因变量就没有显著作用；如果被拒绝，自变量的作用就是显著的，即因变量在自变量不同组中的均值各不相同，比较组均值

12、能够显示出因变量作用的特点,3.2 单因素方差分析,单因素方差分析举例,单因素方差分析举例,单因素方差分析举例,单因素方差分析举例,单因素方差分析举例,可以证明,X对Y作用的强度,就是说，销售额变差中有57.1是出店内促销(X)决定的说明作用中等。,单因素方差分析举例,检验零假设,查F分布表可知，在分子自由度为2，分母自由度为27时，a=0.05的F临界值为3.35，因此，零假设被拒绝结论：店内促销3个水平下的样本均值存在差异。这3个类别均值的相对重要性表明，店内促销水平高，销售额也显著增加。,单因素方差分析举例,在管理研究中，研究者经常需要同时研究一个以上的因素，例如,为考察上述作用，可以使

13、用n因素方差分析，其主要优点在于研究者可以考察因素之间的交互效应，交互效应是指一个因素对因变量的影响与另一个因素的水平有关,3.3 多因素方差分析,广告水平和价格水平相互作用如何影响销售教育程度和年龄会影响对一个品牌的消费吗？消费者对商店的熟悉程度和印象会影响偏好吗？,总效应显著性检验主效应显著性检验交互效应显著性检验,检验过程,3.3 多因素方差分析,两个因素方差分析的计算公式,3.3 多因素方差分析,多因素方差分析举例,多因素方差分析举例,交互效应,对两个或两个以上因子进行方差分析时可能产生的不同交互效应。当一个自变量对因变量的作用，随着另一个自变量的变化而变化时，就存在交互效应从A

14、NOVA可能显示变量间无交互效应(交互效应不显著)，或者交互效应显著。,交互效应,无交互效应同序的交互效应非同序的交互效应：交叉和非交叉,3.3 多因素方差分析,X1对Y的作用在X2的2种状态下都是平行的这种平行可能存在微小的偏离，但处于可接受的范围内。平行说明X22比X21多出的净作用在X1的3种状态下相同。在没有交互作用对X1和X2的联合作用就是两者各自主效应的简单加总。,3.3 多因素方差分析,同序交互效应，图中线段显示X1和X2的作用是不平行的。X22和X21之间的差异从X11到X12到X13，逐渐增加，但X1作用的排序在X2的两种状态下相同。这种排序为升序，并从X21到X22保持

15、一致。,3.3 多因素方差分析,非交叉的非同序交互效应如图所示。在X21的状态下，X1的最低作用为X11，其作用排序为X11,X12，X13。但是,在X22的状态下，X1的最低作用为X12，其排序为X12，X11，X13。由于作用排序发生了变化，非同序交互效应比间序交互效应要强。,3.3 多因素方差分析,在交叉非同序交互效应中，两条线段互相交叉，一个因子状态的相对作用随着另一个因子状态的变化而改变。注意当X1为X11和X12时，X22比X21的作用大；当X1为X13时，情况正好相反，交叉非同序交互效应代表最强的交互效应。,3.3 多因素方差分析,考察与受控自变量作用有关的因变量的均值差异时，通

16、常有必要考虑非受控自变量的影响，例如,在这些情况下，可以使用协方差分析。协方差分析至少包含一个定类的自变量和定量的自变量协变量，协变量常用于去除因变量中的额外变差,3.4 协方差分析,在研究收看不同电视广告的组别对品牌的评价时，需要了解品牌的先期知识对因变量的影响在研究不同价格水平会如何影响某产品的消费量时，考虑家庭规模也是重要的,利用协变量的系数可以判断协变量对因变量的作用，协方差常用于协变量与因变量线性相关并与因素无关的情况,在这些情况下，可以使用协方差分析。协方差分析至少包含一个定类的自变量和定量的自变量协变量，协变量常用于去除因变量中的额外变差,如果协变量的作用是显著的原始系数的符号就

17、可以用于解释协变量对因变量作用的方向。,3.4 协方差分析,3.4 协方差分析,3.5 样本均值的假设检验,市场调查中一个最普遍的问题就是推断总体平均数,对样本的均值进行推断可以分为以下的情况,单个样本均值的检验两个独立样本平均差的检验,t-检验（自由度为n-1）是在总体方差未知，或样本量很小的时候进行统计推断的合适检验，如n30,对样本量较大的情况也适合（接近正态分布）,t-检验中检验统计量的计算,df=n-1,3.5.1 t检验,如果利用十点制量表进行的调查中获得的均值为7以上，一个新的配件就将被安装在新产品中。通过向20位采购工程师出示该配件并进行评估，评价的均值为7.9，标准差为1.

18、6，可以引入该配件吗？,1.形成原假设和备择假设,单个样本t检验的例子,2.确定检验方法和检验统计量,3.确定显著性水平,4.根据样本计算检验统计量的实现值,单个样本t检验的例子,5.根据检验统计量进行检验,自由度为n-1=20-1=19，在显著性水平0.05的情况下，临界值为1.729，因此，拒绝原假设,6.进行营销决策,决定引入该配件,H0,单个样本t检验的例子,两个独立样本t检验的例子,平均差的假设,检验统计量的计算,df=n1+n2-2,3.5.2 z检验,在总体方差已知且样本量较大的情况下利用样本对总体均值假设进行检验,某大型连锁快餐企业以往的顾客平均的等待时间为1.1分钟。但近年来

19、却不断听到消费者抱怨，说等待时间变长，随机对其国内36家分店中的400位顾客进行了调查，结果发现其平均等待时间为1.14分钟，由同行调查的经验知道等待时间的标准差为0.2分钟，是否可由调查结果判定近年来服务出现了问题？,1.形成原假设和备择假设,H0:H1:,2.计算检验统计量,拒绝H0,3.5.2 z检验,M企业拟进行新产品开发。为了解市场需求情况，随机地对1000名消费者进行了市场调查，发现其中有18的消费者表示愿意购买新产品。根据其它资料显示，新产品投入市场后，市场占用率必须超过15才能保证获利。假定表示愿意购买新产品的18的消费者在新产品投入市场后将全部成为现实的消费者。问M企业应否开

20、发这个新产品。,比例z检验的例子,1.形成原假设和备择假设,比例z检验的例子,2.确定检验方法和检验统计量,3.确定显著性水平,H0:H1:,比例z检验的例子,4.根据样本计算检验统计量的实现值,5.根据检验统计量进行检验,因此，拒绝H0,4.相关和回归分析,4.1 相关分析,积矩相关系数,在管理研究中我们经常需要概括两个定量变量之间联系的强度，例如：,顾客满意和顾客忠诚的关系有多强?,信任程度是否与购买量有关?,信息系统的可用性、易用性是否与信息系统采纳意愿有关?,在这些情况下积矩相关系数(product moment correlation)是最常用于概括两个定量(定距或定比尺度)变且x和

21、y的关系的统计量,积矩相关系数,它也是一个决定x与y是否存在线性关系的指标，能够表明x变量变差与y变量变差的相关程度。对于n个观测值的样本，积矩相关系数r的计算式为：,4.1 相关分析,例如，假设一个研究者希望以居住年限来解释一个调查对象对其居住城市的态度。态度的测量采用11级量表(1-不喜欢这个城市，11-非常喜欢这个城市)，居住年限则以调查对象在该城市居住的年数来测量。预备调查中共有12个调查对象，数据见下表,4.1 相关分析,r2测量的是一个变量变差中能被另一个变量的变差解释的比例,r和r2都是测量二个变量联系的对称性指标也就是x和y的相关性与y和x的相关性是完全相同的，哪个变量是自变量

22、或因变量都没有关系。,测量的是线性关系的强度，它不能测量非线性关系，因此r0只能说明x和y不存在线性相关，而不能说明x和y不相关。,4.1 相关分析,以r测量的两个变量之间关系的统计显著性很容易检验,假设,检验统计量,它服从t分布，自由度为n-2,利用前面的例子,4.1 相关分析,自由度为12-210。从t分布表可知。a0.05时双尾检验的临界值为2.228。因此，x与y没有关系的零假设被拒绝。r的符号为正，说明对城市的态度与在该城市的居住年限正相关，而且，r值很高说明二者关系很强。,4.1 相关分析,在进行多变量数据分析时考察每对变量之间的简单相关是很有用的。这些结果可以通过相关系数矩阵表示

23、，列出每对变量之间的相关系数。通常，只考虑矩阵的下半个三角就可以了。,对角线元素均为1，且为对称矩阵,4.1 相关分析,4.2 二元回归分析,回归分析是分析定量因变量与个或多个自变量之间相关关系的有效且易用的方法,确定是否存在相关关系关系的强度有多大确定二者关系的数学形式预测因变量的值尽管自变量可能解释一部分因变量的变差，但这并不表示必然存在因果关系，自变量和因变量只是根据变量之间的数学关系决定的，并不表示因变量在因果关系上依赖于自变量,第一步绘制散点图就是根据两个变量的所有观察值绘制的图表，通常绘制时以因变量为纵轴，自变量为横轴,不相关,正线性相关,负线性相关,非线性相关,4.2 二元

24、回归分析,第二步建立二元回归模型直线的一般形式,这个模型隐含一种决定关系，因为Y完全是由X决定的，但是在管理研究中很少能遇到变量之间为决定性关系的情况，所以回归分析中需要加上误差项，以便考察变量之间关系的随机性,4.2 二元回归分析,第二步建立二元回归模型确定模型参数一般用最小二乘法,a和b的计算公式为：,4.2 二元回归分析,第三步显著性检验（与前面的检验等价）,假设,检验统计量,它服从t分布，自由度为n-2,利用前面的例子,4.2 二元回归分析,4.3 多元线性回归,多元回归涉及到个因变量与两个或两个以上自变量。二元回归能解决的问题通过多元回归增加更多自变量同样能回答,多元回归模型的一般形

25、式如下,该模型通过以下公式进行估计,4.3.1 多元回归分析基本概念,在多元回归中计算回归系数通常采用最小二乘法，公式涉及到矩阵知识，主要采用计算机软件包进行估计，本节侧重在计算机输出结果的解释上,回归系数的解释当所有其他自变量均保持不变时，bi是因变量y对应于自变量xi改变一个单位时所作的改变的估计值,4.3.1 多元回归分析基本概念,多元判定系数可以理解为因变量的变异性能被估计多元回归方程解释的百分比,多元判定系数,修正的多元判定系数,4.3.1 多元回归分析基本概念,显著性检验,F检验用于确定因变量和所有自变量之间是否存在一种显著性关系，称为总体的显著性检验 t检验如果F检验显示了总体的

26、显著相关，则t检验用于确定每一个单独的自变量是否显著，模型中的每个单独自变量均进行t检验，称为单独显著性检验,4.3.1 多元回归分析基本概念,显著性检验F检验,4.3.1 多元回归分析基本概念,显著性检验t检验,4.3.1 多元回归分析基本概念,例1：某地区为研究不同家庭的消费Y与收入X2的关系，在此基础上，还引进了消费者家庭财富状况X3作为第二个解释变量。回归方程为：,SE=（6.7525）（0.8229）（0.0807）,t=（3.6690）（1.1442）（-0.5261）,F924020,X2、X3的 t 值小。且X3的系数符号与经济意义不符和。原因？,4.3.2 多重共线性,多重共

27、线性,在多元回归问题中大部分自变量在一定程度上都是彼此相关的，自变量之间的这种关系称为多重共线性（Multicollinearity）,根据自变量之间是否有严格的线性关系，可以将多重共线性分为以下两种类型：,完全的多重共线性不完全（近似）的多重共线性,4.3.2 多重共线性,多重共线性产生的后果,完全的多重共线性导致参数的估计值不确定参数估计值的方差无限大不完全（近似）的多重共线性可以估计参数，但参数估计不稳定参数估计量的方差增大可能导致模型误差，t检验失败,4.3.2 多重共线性,多重共线性的检验,简单线性线性相关系数法X1,X2,X3为模型中将要引进的解释变量，计算相关系数矩

28、阵，观察两两之间的线性相关是否密切局限性：该方法的局限性主要在于相关系数只能测度两个解释变量之间线性相关的程度，而不能测度三个或更多解释变量之间的线性相关程度。,4.3.2 多重共线性,多重共线性的检验,综合判断法R2（或R2）大，F值大，t值小，说明模型可能存在多重共线性。原因：R2，F值大，表明因变量的离差可以较好的由回归模型解释，各自变量对因变量的联合线性作用显著。在此前提下，若各个t值很少，说明各自变量之间存在共线性，对因变量的独立作用不能分辨。,4.3.2 多重共线性,多重共线性的检验,辅助回归法计算模型中每个自变量和其他自变量的辅助回归,如果有辅助回归方程的R2值较大，说明模型存在

29、严重的多重共线性,4.3.2 多重共线性,多重共线性的处理方法,逐步回归法用因变量Y对每一个自变量Xi分别进行回归，从中确定一个基本回归方程。然后，逐一引入其它解释变量，再作回归，逐步扩大模型的规模。引入新变量后，如果：（1）拟合优度得以改进，而且每个参数统计检验显著，则引入的变量保留;,4.3.2 多重共线性,多重共线性的处理方法,逐步回归法续引入新变量后，如果：（2）拟合优度无明显提高甚至下降，对其他参数无明显影响，则舍弃该变量，（3）拟合优度提高，但方程内其他参数的符号和数值明显变化，可以肯定产生了严重的多重共线性。,4.3.2 多重共线性,4.4 包含虚拟变量的回归模型,许多管理变量是

30、可以定量度量的，如：商品需求量、价格、收入、产量等。但也有一些影响经济变量的因素无法定量度量，如：职业、性别对收入的影响；战争、自然灾害对GDP的影响；季节对某些产品（如冷饮）销售的影响等等。为了在模型中能够反映这些因素的影响，并提高模型的精度，需要将它们“量化”。,4.4.1 虚拟变量的基本含义,这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型，构造只取“0”或“1”的人工变量，通常称为虚拟变量（dummy variables），记为D。例如，反映文化程度的虚拟变量可取为：1，本科学历 D=0，非本科学历,4.4.1 虚拟变量的基本含义,例如：一个以性别为虚拟变量考察企

31、业职工薪金的模型：,4.4.1 虚拟变量的基本含义,其中：Yi为企业职工的薪金，Xi为工龄，Di=1，若是男性，Di=0，若是女性。,虚拟变量做为解释变量引入模型有两种基本方式：加法方式和乘法方式。,4.4.2 虚拟变量的引入,上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式。在该模型中，如果仍假定E(i)=0，则企业女职工的平均薪金为：,男职工的平均薪金为：,加法方式的几何意义,4.4.2 虚拟变量的引入,假定2不等于0，则两个函数有相同的斜率，但有不同的截距。意即，男女职工平均薪金对工龄的变化率是一样的，但两者的平均薪金水平相差2。可以通过传统的回归检验，对2的统计显著性进行检验，以

32、判断企业男女职工的平均薪金水平是否有显著差异。,在横截面数据基础上，考虑个人保健支出对个人收入和教育水平的回归。,4.4.2 虚拟变量的引入,教育水平考虑三个层次：高中以下，高中，大学及其以上。这时需要引入两个虚拟变量：,D1=1高中学历；D2=1大学及以上学历,乘法方式,4.4.2 虚拟变量的引入,加法方式引入虚拟变量，考察：截距的不同。许多情况下：往往是斜率也有变化，或斜率、截距同时发生变化。斜率的变化可通过以乘法的方式引入虚拟变量来测度。,根据消费理论，消费水平C主要取决于收入水平Y，但在一个较长的时期，人们的消费倾向会发生变化，尤其是在自然灾害、战争等反常年份，消费倾向往往出现变化。这

33、种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察,4.4.2 虚拟变量的引入,设，消费模型建立如下,这里，虚拟变量D以与X相乘的方式引入了模型中，从而可用来考察消费倾向的变化。假定E(i)=0，上述模型所表示的函数可化为：,正常年份：,反常年份：,4.4.2 虚拟变量的引入,4.4.3 虚拟变量的设置原则,虚拟变量的个数须按以下原则确定：每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1，即如果有m个定性变量，只在模型中引入m-1个虚拟变量。例如：已知冷饮的销售量Y除受k种定量变量Xk的影响外，还受春、夏、秋、冬四季变化的影响，要考察该四季的影响，只需引入三个虚拟变量即可。,5.调

34、节效应和中介效应,主要内容,调节变量和调节效应分析中介变量和中介效应分析调节变量与中介变量的比较调节效应与中介效应实例,调节变量(moderator)和中介变量(mediator)是两个重要的统计概念。相对于人们关注的自变量和因变量而言，调节变量和中介变量都是第三者，经常被人混淆。,从文献上看，存在的问题主要有如下几种:(1)术语混用或换用，两个概念不加区分。(2)术语和概念不一致。(3)术语和统计分析不一致。,研究意义,1.调节变量与调节效应,1.1 调节变量的定义,如果变量Y与变量X的关系是变量M 的函数，称M 为调节变量。就是说，Y与X 的关系受到第三个变量M 的影响。,1.1 调节变量

35、的定义,调节变量可以是定性的（如性别、种族、学校类型等），也可以是定量的（如年龄、受教育年限、刺激次数等），它影响因变量和自变量之间关系的方向（正或负）和强弱。例如，学生的学习效果和指导方案的关系，往往受到学生个性的影响：一种指导方案对某类学生很有效，对另一类学生却没有效，从而学生个性是调节变量。,1.1 调节变量的定义,在做调节效应分析时，通常要将自变量和调节变量做中心化变换即变量减去其均值。考虑最简单常用的调节模型，即假设Y与X 有如下关系：,把上式重新写成：,Y与X 的关系由回归系数a+cM 来刻画，它是M 的线性函数，c衡量了调节效应(moderating effect)的大小。,1.

36、2 调节效应分析方法,调节效应分析方法根据自变量和调节变量的测量级别而定。变量可分为两类，一类是类别变量(categorical variable)，包括定类和定序变量，另一类是连续变量(continuous variable)，包括定距和定比变量。,根据自变量和调节变量类型的不同，需要采用不同的分析方法来验证调节效应的存在。,1.2 调节效应分析方法,自变量和调节变量都是类别变量时做方差分析,Y,X1,X2,M1,M2,1.2 调节效应分析方法,当调节变量是类别变量、自变量是连续变量时，做分组回归分析。若回归系数的差异显著，则调节效应显著。,Y,X,M1,M2,a1,b2,a2,b1,1.2

37、调节效应分析方法,当自变量和调节变量都是连续变量时，用带有乘积项的回归模型，做层次回归分析：（1）做Y对X和M 的回归，得测定系数R12。（2）做Y对X、M 和XM 的回归得R22，若R22显著高于R12，则调节效应显著；或者，做XM 的偏回归系数检验，若显著，则调节效应显著,当自变量是类别变量、调节变量是连续变量时，而是将自变量重新编码成为伪变量(dummy variable)，用带有乘积项的回归模型，做层次回归分析。,2.中介变量与中介效应,2.1 中介变量的定义,考虑自变量X 对因变量Y的影响，如果X 通过影响变量M 来影响Y，则称M 为中介变量。,调节变量：引入五日工作周（自变量）将提高办公室的工时效率（因变量），尤其是对年轻员工（调节变量）。,中介变量：引入五日工作周（自变量）将通过提高工作满意度（中介变量）来提高办公室的工时效率（因变量），尤其是对年轻员工（调节变量）。,中介效应示意,2.1 中介变量的定义,2.2 中介效应的分析,中介效应的检验,Sobel检验,检验统计量是：,其中：,上式中的各符号分别是参数a,b的估计值，以及各估计值的标准误。,2.2 中介效应的分析,3 调节变量和中介变量的比较,本章结束谢谢大家！,本章结束，谢谢大家！,

展开阅读全文