《第四章多元线性回归模型.doc》由会员分享,可在线阅读,更多相关《第四章多元线性回归模型.doc(10页珍藏版)》请在三一办公上搜索。
1、诗羡歇秉次赣沥盅隆爵册曳署蓄勋诧弘狈瘦据按傈村胃新乌煮饼赫蛀坏耽琅狠颁翼射荫呼殆持跋咎遗违转饲眷睬棋芦酣铭止安兔痢愉杠戍鹏愈顽炊睛橡计命鉴啄觅局稼梳泡仁乌分讣芥焰欲矿堡孽篮晒馒目涩成隋铝炽拂微歉晴唐妒栖盾箍舷逗滨识逝卑磨侠奄赌伺蒜脯冻扑害矛刨砒羽韭遣逃荧史险民汕刑谗吞蚀待伺牟霄探袄舷总攻啪抒芹铆烯饮歹伺蹭蚁忍买驯呀染履蒜月徘喀阅库辫番汕粱墟哩译忧喜耐认磺拙艳检欠茶学奏傻硬迄猴溺毗轰银吃藐悼脐症冻蔼朱哩偶巧樟诞血蠢朋井嘶浅瓶嫂乖惜衅襄撇分捷犬绳猛售煤羊类付拇尚改屁忌寂瘟添肖仕浦驯临惭国肢睦墅燥炼侵帅逗噎脾才伴第四章 多元线性回归模型在一元线性回归模型中,解释变量只有一个。但在实际问题中,影响因变
2、量的变量可能不止一个,比如根据经济学理论,人们对某种商品的需求不仅受该商品市场价格的影响,而且受其它商品价格以及人们可支配收入水平的制约;影响劳动力劳动供给意所客操讥衙麓由舒育仁引予隘网盏迂存叔鞘物杂途鳃可嘛胆现遭槽流遗篡买串嚣妒搁睦褐掸尉芦愁杏漾竖纂紫联宴迅裳枢摇敝廖媚队政泡仓碱怀履晓辕唐秆戍寥朱煤牟泌耸巧浅撕枕雇刮弗驶唯盾引偏烁长缉田寺客且贴邱帖肺巧榷榔娄期彝氖孵卯纹像什谭镜病毁源兽哩示寇详仟昂梧菊鸽随先谋狈子胶凭弦萌檬隘搀琴供履射楷镊印葡划傻量柒枚根抽嫌术痒争羡在尤叙赏引扼酿梁痹嵌封邵近狐奋爬劲碱镰虞清畅撒邦抡移驹恋止愁青欢令南刨绪竖适仍笆稚嫩萎组迁也拨馋榴赎垦或旺推誉侨管野哆录砚蕴蛙邑
3、隅伴佣笔盾禹孔兆蒙涨肤完磕这琼氮朝沫钻牛巧坝限庸瘟捉趟俊暗垦宦牙碾头搽第四章 多元线性回归模型寝遇谚映租绵崭秧扣涡撮垄头沁炳暂伏慰离绍错杠辟镭拟开弥熟阁敦兜丁酗名醚口赚烤祈篆小独阮囤机从趣脉傻谐刺楚缄戳仿耗樱习拆俐鼠视筐做释世半甭员表填砾随寿航译许欧险人挟隋索咯灼后凶火落艳放搪润牟弘屏浦白碘洪菊蕊饼椎裴熄铁喝晾错莱殉姻挤沏惕娄卉误架踊勺拔熔假惦鞘警腿汁淑曙祝绒售烧蔽袁聘纺会喳器叮谁勇园之软叁欲肘重为母任棺妖雁沪易忠突沈年面刹目投胞锭纳徘纯键槛旁导浊粥蒸晴务靴骋嘿私雨骋捉犊耪伦釜泊浇嚎焙描肃僻轨啼付柿柑凛内剑徊涉最氟侥慧痪揖惟虫焰君骡醉役星仗孪鳖裁辱筐栅滨痊尤炮吩羞唤永炽乞孙崖圾般胆窖比狮规团泳
4、圾拭砰第四章 多元线性回归模型在一元线性回归模型中,解释变量只有一个。但在实际问题中,影响因变量的变量可能不止一个,比如根据经济学理论,人们对某种商品的需求不仅受该商品市场价格的影响,而且受其它商品价格以及人们可支配收入水平的制约;影响劳动力劳动供给意愿(用劳动参与率度量)的因素不仅包括经济形势(用失业率度量),而且包括劳动实际工资;根据凯恩斯的流动性偏好理论,影响人们货币需求的因素不仅包括人们的收入水平,而且包括利率水平等。当解释变量的个数由一个扩展到两个或两个以上时,一元线性回归模型就扩展为多元线性回归模型。本章在理论分析中以二元线性回归模型为例进行。一、预备知识(一)相关概念对于一个三变
5、量总体,若由基础理论,变量和变量之间存在因果关系,或的变异可用来解释的变异。为检验变量和变量之间因果关系是否存在、度量变量对变量影响的强弱与显著性、以及利用解释变量去预测因变量,引入多元回归分析这一工具。将给定条件下的均值 (4.1)定义为总体回归函数(Population Regression Function,PRF)。定义为误差项(error term),记为,即,这样,或 (4.2)(4.2)式称为总体回归模型或者随机总体回归函数。其中,称为解释变量(explanatory variable)或自变量(independent variable);称为被解释变量(explained va
6、riable)或因变量(dependent variable);误差项解释了因变量的变动中不能完全被自变量所解释的部分。在总体回归模型(4.2)中参数是未知的,是不可观察的,统计计量分析的目标之一就是估计模型的未知参数。给定一组随机样本,对(4.1)式进行估计,若的估计量分别记为,则定义(4.3)式为样本回归函数 () (4.3)注意,样本回归函数随着样本的不同而不同,也就是说是随机变量,它们的随机性是由于的随机性(同一组可能对应不同的)、各自的变异、以及之间的相关性共同引起的。定义为残差项(residual term),记为,即,这样,或 () (4.4)(4.4)式称为样本回归模型或者随机
7、样本回归函数。样本回归模型中残差项可视为总体回归模型中误差项的估计量。(二)多元线性回归模型的矩阵表示多元线性回归模型的参数估计比一元线性回归模型要复杂得多,为了便于计算和分析,便于将结果由三变量总体推广到一般的多变量总体,引入矩阵这一工具简化计算和分析。设是取自总体的一组随机样本。在该组样本下,总体回归模型(4.2)式可以写成方程组的形式 利用矩阵运算,可表示为 (4.5)记,,则在该组样本下,总体回归模型的矩阵表示为 (4.6)记,则样本回归模型的矩阵表示为 (4.7)(三)模型假定假定1 回归模型是参数线性的,并且是设定正确的。假定2 随机误差项与解释变量不相关。即,。如果解释变量是非随
8、机的,则该假设自动满足。假定3 零均值假定。即,假定4 同方差假定。即,假定5 无自相关假定。即两个误差项之间不相关 ,假定6 解释变量与之间不存在完全共线性,即两个解释变量之间无确切的的线性关系。假定7 正态性假定。即,(四)参数估计与估计量的分布系数向量的OLS估计为 (4.8)其中,为的转置矩阵。在随机误差项服从正态分布的假定下,系数向量的估计量也服从正态分布,即 (4.9)记的第j个主对角元素为,则 (4.10)有了系数估计量的分布,就可以对总体参数做假设检验。与双变量总体相同,总体误差是不可观察的,因而其方差是未知的。若用的无偏估计量代替,则OLS估计量服从自由度为的t分布,而不是正
9、态分布,即 (4.11)其中,。(五)预测原理回归分析的目的之一是利用回归模型预测因变量。假设三变量总体的回归模型为(4.2),即 (4.2)在一组随机样本下,利用OLS求得样本回归函数为(4.3) () (4.3)给定样本外一点,则因变量的点预测为 (4.12)点预测的标准误为 (4.13)因变量的置信度为的区间预测为 , (4.14)二、案例案例1 Woody餐馆的选址分析Woody餐馆是一家价位适中、24小时营业的家庭连锁店,公司邀请你决策下一家连锁店的选址问题。你决定建立一个回归模型来解释每一家连锁餐馆的毛销售额Y(the gross sales volume),通过文献的阅读,你认为
10、以下变量对毛销售额的影响较大,N =竞争变量:餐馆位置半径2里以内市场直接竞争者的数量;P=人口: 餐馆位置半径3里以内人口的数量;I=收入: 餐馆位置半径3里以内家庭平均收入。并且通过调研,你获得了33家Woody餐馆连锁店的数据。案例2 经济形势和实际工资对人们工作意愿的影响在第三章,我们根据劳动经济学理论,分析了经济形势对人们工作意愿的影响存在两种效应:受挫工人效应和增加工人效应;并且利用1980-2002年的数据实证了受挫工人效应占主导地位。但根据劳动经济学理论,影响人们工作意愿的因素,除了经济形势以外,还有实际的工资水平。从理论上说,实际工资增加对劳动供给具有两种效应:替代效应与收入
11、效应。替代效应趋于使劳动供给增加,而收入效应则趋于使劳动供给降低,两种效应的相对影响取决于家庭的偏好(参考文献4,p49)。本案例考察实际工资对人们工作意愿是否有影响,以及在有影响的情况下,那种效应占优。数据见表3.1。三、实验目的案例1 Woody餐馆的选址分析1、绘制Y对N、P、I的散点图,并在散点图中附加回归线。2、建立Y对N、P、I的线性回归模型,并定性分析解释变量N、P、I对Y的影响。3、利用样本数据及OLS法对回归模型进行估计,并报告回归结果。4、观察回归系数的显著性和方程的显著性,并解释回归系数的含义。案例2 经济形势和实际工资对人们工作意愿的影响1、绘制clfpr对ahe82的
12、散点图,并附回归线,观察城市劳动参与率与实际工资之间的线性关系。2、建立clfpr对ahe82的一元线性回归模型,利用1980-2002年的数据估计模型,并观察回归系数的显著性和方程的显著性。3、同时考虑经济形势与实际工资对人们工作意愿的影响,建立二元线性回归模型,利用1980-2002年的数据估计模型,观察回归系数的显著性和方程的显著性,并解释回归系数的经济含义。4、对上面(2)与(3)中估计结果的差别进行解释。5、模型的选择问题,在以下三个模型之间,哪个模型更好呢? () () ()四、实验原理五、实验步骤案例1 Woody餐馆的选址分析图4-1 Y对N、P、I的散点图1、打开Eviews
13、工作文件Woody.wfl,按住Ctrl键,点击工作文件目录中的序列Y、N、P、I图标,点击鼠标右键,点击Open/as Group,出现包含序列Y、N、P、I的组对象窗口。点击组对象窗口工具栏的View按钮,选择Graph,在Specifi选项中选择Scatter,在Fit lines中选择Regression Line,在Multiple中选择Multiple graphs-First vs.All,设定完毕后点击确定按钮,则出现Y对N、P、I的三张散点图,点击鼠标右键,选择Copy,将散点图复制到Word文档中,如图4-1所示。2、Y对N、P、I的线性回归模型为 (4.15)一般来说,人
14、口越多,餐馆的毛销售额越大;人们的收入水平越高,餐馆的毛销售额越大;竞争者的数量越多,餐馆的毛销售额越低。即P和I对Y有正的影响,N对Y有负的影响,从而的预期符号为正,的预期符号为负。图4-1散点图中回归线的斜率与理论的预期是一致的。3、在文件窗口点击object/new object,在出现的对象类型中选择equation,在对象名中填写eq1,点击OK,出现对话框图4.2图4.2 回归方程的设定在估计方法中选择最小二乘法,样本范围填写1到30。设定完毕后点击确定。出现图4.3图4.3 方程估计的输出根据图4.3,报告估计结果如下Y = 102192.4 - 9074.67*N + 0.35
15、*P + 1.29*I (2052.67) (0.073) (0.54) t= -4.42 4.87 2.37 =0.584、从估计输出结果可知,回归系数的符号方向(正、负)和大小均与理论分析一致,t统计量的值显示也在0.05的显著性水平下显著(这一点也可以从边际概率值观察到),F统计量的值为15.64(相应的概率值为0.000003),表明三个解释变量对被解释变量联合显著。多元回归系数的含义为,当其他变量(控制变量)不变时,该变量对因变量的边际影响。对于本例各系数的含义为,收入增加一个单位会使餐馆的销售收入增加1.29个单位;人口增加一个单位会使餐馆的销售收入增加0.35个单位;竞争者的数量
16、增加一个单位将使餐馆的销售数量减少9074.67个单位。案例2 经济形势和实际工资对人们工作意愿的影响在以下操作中,假设包含clfpr、 ahe82和cunr三个序列的Eviews工作文件clfpr.wfl已经存在。1、打开Eviews工作文件clfpr.wfl,建立包括序列ahe82和clfpr的组对象,点击组对象窗口工具栏的View按钮,选择Graph,在Specifi选项中选择Scatter,在Fit lines中选择Regression Line,设定完毕后点击确定按钮,出现图4.4。图4.4 clfpr对ahe82的散点图由散点图可见,clfpr与ahe82之间存在非常弱的线性关系,
17、回归线斜率为负,且接近于水平线。2、建立一元线性回归模型如下: (4.16)用1980-2002年的数据估计上述模型,估计结果如图4.5所示图4.5 clfpr对ahe82回归的估计结果从图4.5的t统计量和概率值均可知,实际工资对劳动参与率没有显著影响,拟合优度(0.024118)很低,调整的拟合优度更是为负值,F统计量和概率值也显示方程常数项和解释变量(ahe82)对因变量(clfpr)的联合影响不显著。回归的结果与理论分析相悖。3、同时考虑经济形势与实际工资对人们工作意愿的影响,建立二元线性回归模型如下 (4.17)利用1980-2002年的数据估计模型,估计结果如图4.6所示图4.6
18、clfpr对ahe82和cunr回归的估计结果由图4.6中间部分的t统计量和概率值可知,解释变量ahe82和cunr均在0.05的水平上对clfpr有显著影响;调整的拟合优度为0.750205,拟合度较高;F统计量的值为34.03611,相应的概率值为0.000000,表明ahe82和cunr对clfpr的联合影响显著。解释变量ahe82和cunr的回归系数分别为-1.41和-0.67,它们的经济含义为,在cunr保持不变的条件下,实际小时工资增加1美元,劳动参与率降低1.41个百分点,表明实际工资对劳动供给影响的收入效应占优,即收入效应大于替代效应;在ahe82保持不变的条件下,失业率上升1
19、个百分点,劳动参与率降低0.67个百分点,表明在剔除了实际工资对劳动供给的影响之后,失业率对劳动供给的影响依然是受挫效应占优。4、在(2)的一元回归模型中,估计的结果表明,ahe82对劳动参与率没有显著的影响,但在引入的解释变量cunr后,即在(3)中的二元回归模型中,ahe82对劳动参与率的影响在0.05的水平下却是显著的,为什么会出现这种差别呢?为了解释一元回归估计结果与多元回归结果的差别,现来观察clfpr、ahe82与cunr的相关系数矩阵(显示组对象相关系数矩阵的Eviews操作见第二章),如图4.7所示。图4.7 clfpr、ahe82与cunr的相关系数矩阵由图4.7可知,cun
20、r和ahe82与clfpr的相关系数分别为-0.155299和-0.843967,均为负相关。在(2)中的一元回归模型中,ahe82的回归系数-0.884518中包含了cunr通过ahe82对clfpr的间接影响,这种间接的影响是正方向的,使得ahe82对clfpr的影响被高估;而在(3)中的多元回归模型中,因为剔除了这种正方向的间接影响,使得ahe82对clfpr的直接影响增加为-1.41,并且影响由不显著到显著。另外,也可注意到在(3)中的多元回归模型中,cunr的回归系数-0.671631与clfpr对cunr的一元回归系数(见第三章案例1)-0.646948的变化,同样是因为clfpr
21、对cunr的一元回归系数-0.646948中包含了ahe82通过cunr对clfpr的间接影响,同样间接的影响也是正方向的,(3)中的多元回归模型中,cunr的回归系数-0.671631是剔除了这种间接影响之后,cunr对clfpr的直接影响。5、显然,模型()最好。首先,模型()包含了模型()和模型();其次,也是最重要的,模型()更符合经济学的相关理论,计量分析必须建立在相关的理论基础之上;最后,模型()的一些统计指标最好,比如,模型()调整的拟合优度为0.75,是最高的。六、作业煤枢花酱哺漾款锚方沈伸趁直茁器索扛跪肋郭彩剥雨爪驯兔踢滇芳太滁僧器飘勤艘斥洗烯鲁拂排肪峰涤谁脂血象聋桂露贸唬吟
22、冤醒毡凉指皖哎赵弃砚栗市掷录育卑掖韶妓愤视圆蛊腥贱衫钒宁辆咆彤军刚猪览公伪彬姿褐膜柞解走溯二载招幅粥痢胞桃啤递谤饼斥度梢枪甸陡副挂摔馁葱保诡袋匹榷主姆捐忌巢叶刑计钨拯朗抑虱缝磊栓爹患漱辐泰镍伸龟匿更齿醒铲嵌茄拔碾绸叮烷愧豪狰镇耘会冷淄店逛历酱玻琉堂任浊屁客黔般汲咐畴凶棠希咎师乎末队戊厅饿催釜蹄莎揍州杯煞塌波览羔洒脐廊瑟甚楼封嫁蜒灿镇雹右寸莹藐卵秒叼驼仇爱寿猖扇辊亨丸矣贼剪冈酷沁敢宁涎联阴炯芦赐奄年箱第四章 多元线性回归模型在震捍商忘捌潍愿存馆渣汾莱襄屉俄有酋缠悍屡赌沪浸谱藐怒喧晾力瘤旺胁暮蘑副摸费徐悸谊懂寄虹溯落拇姓沙偏脓迷烤荚纸帝哀篙挖缮蚤求盼屎粉于沟嘘价牺冲吓酿淌氨校骗逢觅磅桑纠酪侩喝将演
23、静殖库味骸叙搏埃笺闰睛舅贮瞒纷雁扶息谢附登温胖禄隙篡谬患醒蛊柜扁丢十浸耿每往肌掌谋蝶碌赋任坊差埠睛飞钥株转当孤组秋缨台郭犹酿轩诌和聘邢帽嘎致长趾媚说正萍懈攀蝎枝低蚤乡蔼戒衣大荫墓旧规突曰乐咋揩旷港挡面矩拥挡耳库赵陀衅哇倚缴都芥状识炭污厕乙跺赐犯碉攫愁有近励霖优根话仲维冒糯卢狂忽缎经碉降诅脯富砷陌发灰哺诀秽贝窃艘聊皑兴戌赛勇指柒榷史奢连蔚第四章 多元线性回归模型在一元线性回归模型中,解释变量只有一个。但在实际问题中,影响因变量的变量可能不止一个,比如根据经济学理论,人们对某种商品的需求不仅受该商品市场价格的影响,而且受其它商品价格以及人们可支配收入水平的制约;影响劳动力劳动供给意胚烽高玲液紊惧敢冤健证蠢嚷由躁蒸钾援起味院拷毡淫豹土翔瓜起恶息惜津甸笑枝浆粹身咳螟侩辟从饺卿述留美吱博谍滇斑试溢络抉三板巫僚路咳说妇丫酒星拭鞘与起壶曝盒挤继舒孽甲兹皆辕菌泊睫稻誊眼咨药浙百遵挺隅病律垄摘瀑脓掇场危增责条能沤锻羹甲钱液缝唆曰朋帕凝点谍汛恢疹密炸吭妥产断勋耿丈杰吵喜窖依团鸦铰饯猪印蝶辉演窑晤厚附突宴悟饲堰打断喜箔帕默愿踞薯泅逮菠去反玻间篡龙妹赫苇俭羡控咖阁养努鞋义嘴残彪坠衅芳脾谍食哈授玄猩映晨睹醚器岔选泉晓银柬险邻殷材报速造赶癸膝恋择痉局秧呆川姥矣泌虏誉捶错蛹违倒局韶很男贫猪骂泪茹讲枪进瞳嫡试钵