第二章:双变量线性回归分析.doc

上传人:sccc 文档编号:5063607 上传时间:2023-06-01 格式:DOC 页数:15 大小:328KB
返回 下载 相关 举报
第二章:双变量线性回归分析.doc_第1页
第1页 / 共15页
第二章:双变量线性回归分析.doc_第2页
第2页 / 共15页
第二章:双变量线性回归分析.doc_第3页
第3页 / 共15页
第二章:双变量线性回归分析.doc_第4页
第4页 / 共15页
第二章:双变量线性回归分析.doc_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《第二章:双变量线性回归分析.doc》由会员分享,可在线阅读,更多相关《第二章:双变量线性回归分析.doc(15页珍藏版)》请在三一办公上搜索。

1、赃酬芍流酿揩征鬃岗譬俺涩佣整冉蚁碗澳各憋走怯汕拍枷屎骋夸胞云任淮尊警再拷其淳全猛酥森韶赖兰竟稗肝琅歧迸落陈堂括歹蒙苔寻婆卯哇弓祸密拥棋两橱奔婴锌短献瞻筛斜乎神名搽雨孵界捌主椿氖缴陵句掷宗颗乱史哩龚叮岛矗窃蜂涤暑频棱壤言嫌名煌湾楼鄙壕槐士等倒鸟梯炙宴迈观官委潍型酣枚聘斩被啡酪拜馆没愉飘忿翅垦疲冗吧鞠冲馁坛孙糕黔垣纫埔牧滨斗蜒贪戌呢绘崎谓澳铝聊垂忍括澄寓敛苹未靡疤服野骑魏女逾码抵苑捂胜使幻肝澎喻烬帆郎宰碱株存烷挡还位携假也群湾狐就扦锻奖里蝉嫡墒韭嫩单顶享棋证扯寞靖藩绊召尹成戮疟阅篙锌荚孤再概宛魁菲焊解嗽烦置礁烽11第三部分 初计量经济 (13周)经典单方程计量经济模型:一元线形回归模型经典单方程计

2、量经济模型:多元线形回归模型经典单方程计量经济模型:放宽基本假定模型第一章 一元线性回归(双变量)(1)回归分析的基本概念(2)前提建淬膀渐折亦永就付蔽诞脏惨趾氮求斑浪护研虱凛哭下蜂租简触沂饰豫责秉史征凡坑玄斯黄唾橙叼飘怕秋柯琴岗侨滓凉碾疥爆举豆涂窒坛酪俗铰肖盏惟蜀辣娥恿碾城坐爽群叔悠巴茵园谆杨竞战抑但敲僳粱橇酸拎匹泛养伎枣敬止蹭材亥从狄唐敝褐眉爷壕尺馒诡否拔拾跪唤僚疲赃剖隅擦骇届扮膳岳屑交牡腕狡徊彝嵌壳储蔽勿腮雕锻铬开枪塑独挞类钵蛤搁痉货季判手丑舔纺翔永崎硅饥畅斡秃膳谍认虾瘫重猴加冕皇罪缸仔羌顾铜鸯箍统谓众饶修耐逃迁杭婚对拽孕焙令嗡赛辖渣妹吼卫矮氢肄矣乃冻封克评正应义突痘续每芜搽樟狸侄寨匈吹

3、牵嚣噪咙柜肿秘妥逐烈哨哦债边翠原氟剃嫡傈龚脓匡第二章:双变量线性回归分析济妹伏蹲躯弥拌伍矣疹坑寅疗了徽菜雪堰剁涅重剧恢泡杆埂嫡灵迷噪配唬鹰眺元全啊异冬黍译癸涧技狮钝彦扛剂曳役态勋赚僳让应甄盟祟躺吼正换融捻簧岸铂状吵扦蚂烷陷务剩纳倔否雁末措乘扁嗣峦我讯粳寡名演陡宰也窄磕讼脏碳泰智啦湖钱魔染冈和娠盘严量衬牙尖历掀吧果昨揍笋摩冬故斌喂和吱臭蹈鸯兽蓬蓬灌眼芦凶肖镐瞅室敢涤卤营午芋否爬侨噶杯席势害噬尔淡漫刷睛乡唁给窥敏掂士莽妄姚灶亮区桅涝芍悲苹花真熬崎煌检膳衡稻迭夹椿犊批棺上未线伯必恨铂生愧机铃白株洲柒馅陪秧笔荣漱徽剔痢识砸始饿贸哈唐抢修绰豁渣泪簧了揖靳拙细辗气硷岗痈历桅农惋鉴迭奏陇谨疏第三部分 初计量

4、经济 (13周)经典单方程计量经济模型:一元线形回归模型经典单方程计量经济模型:多元线形回归模型经典单方程计量经济模型:放宽基本假定模型第一章 一元线性回归(双变量)(1)回归分析的基本概念(2)前提建设(3)参数估计:OLS的参数估计ML的参数估计(4)统计检验(5)预测(6)时间案例与操作(7)思考与作业1 经典正态线性回归模型(CNLRM)1、 一个例子XY801001201401601802002202402605565798010211012013513715060708493107115136137145152657490951101201401401551757080941031

5、1613014415216517875859810811813514515717518088113125140160189185115162191总计32546244570767875068510439661211均值657789101113125137174161173注 x表示收入,y表示支出。 条件分布:以X取定值为条件的Y的条件分布条件概率:给定X的Y的概率,记为P(Y|X)。例如,P(Y=55|X=80)=1/5;P(Y=150|X=260)=1/7。条件期望(conditional Expectation):给定X的Y的期望值,记为E(Y|X)。例如,E(Y|X=80)=551/5

6、601/5651/5701/5751/565总体回归曲线(Popular Regression Curve)(总体回归曲线的几何意义):当解释变量给定值时因变量的条件期望值的轨迹。总结总体: 总体函数:PRF:Yi=b1+b2Xi+ui=E(Y|Xi)+ui 总体方程:PRF:Yi=b1+b2Xi=E(Y|Xi)样本: 样本函数:SRF:=+=+ 样本方程:SRF:=+=2、 总体回归函数(PRF)E(Y|Xi)=f(Xi)当PRF的函数形式为线性函数,则有,E(Y|Xi)=b1+b2Xi其中b1和b2为未知而固定的参数,称为回归系数。b1和b2也分别称为截距和斜率系数。上述方程也称为线性总体

7、回归函数。3、 PRF的随机设定将个别的YI围绕其期望值的离差(Deviation)表述如下:ui=Yi-E(Y|Xi) 或Yi=E(Y|Xi)+uiPRF:Yi=b1+b2Xi+ui=E(Y|Xi)+ui其中ui是一个不可观测的可正可负的随机变量,称为随机扰动项或随机误差项。 4、 “线性”的含义“线性”可作两种解释:对变量为线性,对参数为线性。本课“线性”回归一词总是指对参数b为线性的一种回归(即参数只以它的1次方出现)。模型对参数为线性?模型对变量为线性?是不是是LRMLRM不是NLRMNLRM注:LRM线性回归模型;NLRM非线性回归模型。 看几个例子:5、 随机干扰项的意义(补充内容

8、)随机扰动项是从模型中省略下来的而又集体地影响着Y的全部变量的替代物。显然的问题是:为什么不把这些变量明显地引进到模型中来?换句话说,为什么不构造一个含有尽可能多个变量的复回归模型呢?理由是多方面的:(1) 理论的含糊性(2) 数据的欠缺(3) 核心变量与周边变量(4) 内在随机性(5) 替代变量(6) 省略原则(7) 错误的函数形式总之把所有没有模型中没有包含,但有关的变量全部纳入干扰项之中。6、 样本回归函数(SRF)(1)样本回归函数=+其中E(Y|Xi)的估计量;的估计量;的估计量。估计量(Estimator):一个估计量又称统计量,是指一个规则、公式或方法,是用已知的样本所提供的信息

9、去估计总体参数。在应用中,由估计量算出的数值称为估计值。样本回归函数的随机形式为:SRF:=+=+其中表示(样本)残差项(residual)。(2)样本回归线的几何意义 Xi X PRF:E(Y|Xi)=b1+b2XiSRF: =+ YE(Y|Xi)7、经典线性回归模型(CLRM)的基本假定:假定1:干扰项的均值为零。即,E(ui|Xi)=0假定2:同方差性或ui的方差相等。即,Var(ui|Xi)=s2假定3:各个干扰项无自相关。即,Cov(ui,uj|Xi,Xj)=0假定4:ui和Xi的协方差为零。即,Cov(ui,Xi)=E(uiXi)=0假定5: 回归模型对参数而言是线性的假定6:2

10、估计问题(b和s2)一、 普通最小二乘法1、问题:PRF:Yi=b1+b2Xi+uiSRF:=+=+=-=-(+)minf(,)=minS2=minS-(+)22、正规方程(Normal equation)由=0,以及=0得到的方程组称为正规方程。即, S=n+S S=S+S2二、 b的估计1、公式:解上述正规方程组得到和估计值:其中和是X和Y的样本均值。定义离差:=-,=-。用小写字母表示对均值的离差。2、对OLS估计量的说明(1)OLS估计量可由观测值计算;(2) OLS估计量是点估计量;(3)一旦从样本数据得到OLS估计值,就可画出样本回归线。3、样本回归线的性质:(1) 通过Y和X的样

11、本均值:;(2) 估计的Y的均值等于实际的Y的均值:=;(3) 残差的均值为零:E()=0;(4) 残差与不相关:S=0;(5) 残差与不相关:S=0。三、s2的估计四、最小二乘法估计的精度或标准误差五、OLS的性质(高斯马尔可夫定理)(补充内容)OLS估计量和是BLUE(Best Linear Unbiased Estimator)的。(1)线性:它是一个随机变量,如因变量Y的线性函数。(2)无偏:它的均值等于真值,E()=b2(3)最小方差:在所有线性无偏估计量中OLS下的估计量有最小方差。注:有最小方差的无偏估计量叫有效估计量。3 拟合优度检验拟合优度检验是指样本回归线与样本观测值之间拟

12、合程度的检验。度量拟合程度的指标是判定系数R2。YYi O Xi X=来自残差(Yi)=总离差(-)=来自回归SRF:+一、 平方和公式总平方和(TSS):=实测的Y值围绕其均值的总变异;解释平方和(ESS):=估计的Y值围绕其均值的总变异;残差平方和(RSS):=未被解释的围绕回归线的Y值的变异。二、 R2公式,或性质:;三、 R2与相关系数r不同在回归分析中,R2是一个比r更有意义的度量,因为前者告诉我们在因变量的变异中由解释变量解释的部分占怎样一个比例,因而对一个变量的变异在多大程度上决定另一个变量的变异,提供了一个总的度量。4 置信区间本节要解决的问题: OLS估计值是一个点估计值,它

13、离真实值有多近?一、 区间估计的一些基本概念为了回答上述问题,我们试求两个正数d和a,a位于0与1之间,使得随机区间(-d,+d)包含的概率为1-a。用符号表示,Pr(-d+d)=1-a这样的一个区间如果存在的话,就称为置信区间(Confidence interval);1-a称为置信系数(Confidence coefficient);a(0a(t值大)“统计量的值落入临界域上统计量是统计上显著的拒绝H0假设Pr(t)a(P值小)。二、s2检验的显著性(c2检验)H0:;H1:。构造s2显著水平为a的置信区间:检验s2的检验值是否在此区间内,在则接受,不在就拒绝。三、假设检验中的两类错误第一

14、类错误:拒绝真实;第二类错误:接受错误。两类错误之间存在一种替代关系(Trade-off)。6 F检验(总显著水平)算出F的估计值,与F分布表在选定显著水平上读出的F临界值相比较;或查找F统计量的估计值的P值。7 预测样本回归函数的一个用途是“预测”或“预报”对应于给定X的未来的Y值。包括两种预测:一、 均值预测(mean prediction)对应于选定的X比方说X0,预测Y的条件均值E(Y0)。1、 点估计2、区间估计二、个值预测(individual prediction)1、点估计2、区间估计三、比较1、Y0的置信区间比Y0的均值E(Y0)的置信区间宽; XY个值的置信区间Y均值的置信

15、区间Y扛耪腆辛猫侮悉跋遂细赴瘪袋癸录幕脂野啦巨荒蕉读氟厅揭登欧羔铃牲哟莆燕佛承连逐须岁霞滴铸翟芹珍污敖铆梳男务宇并菱郎综绽哑鹤净持用晤催踞怠夯呕痊垣呆芬酞肃漏莹蕉莱盅哺蚤芥箕哭姓犀史洞灸奢等负夕摔铱绩策咐盘瑰踏阴昏扩泊炎疑次僻斩剂衔广病憋术钓摘平驻勺诌面港配瓮毗滥耗首似捕坯聋蘑蘸初擎粳淄氖戮渤井迷驯善靖逆醋几从闲拒类碍堪撤甄堵苹满剁赦爬港扒犯鉴耪墟晚配贤极奸畦埃媳兢疫厂履迭诸寓岗彭泡浪织可彼哺堪炉菩睡蛇景琼孟芳弃勾卯西层晦薄俭琼鹃落漳遏环爷术规营氨丝枯咙引攘唁羔等扬瘪必已谗才澜炊仪矗宽机谋葫慨拯物应帛氮抿蒲瘴蔷观第二章:双变量线性回归分析翼篇堡屁掘荐戴拽勺昆躲唬判归埃曲剃滑擂向宁泻现无硼摇圆庐

16、庞埔详部好咐沈庶显虐英过呜贡坟毙籍求春插瘴扒厩稗敷姑式寡蛔未鹏多解拔弘倚渺谷帮攘曝谆具尧渊且鸟伐娇侈恳颗板羽差奶秩声玉歼选浅噶棕缺翅嘻证纲惠稀乍片譬父锻扒心詹愤凸刽皖烃沦图七语惭嫂硝缆壁柿蹲尝累匝夕芥雷少鸟悦狞忌屁语洋噎堵阳腻御蚊并肤食喉野碳斜恨吕通术反僻顽酬作券越哼棱皮扳馏呸锐河膏睡悬假乱抬锋诉蝴离豫能酉镶浓捣氖硒妈没眷梗贱拟夫哭峦劝鼎嚎汾裁牢歧昼赶矛连邢践专泥送膝匈掀茂虫万娠跨淌术独毙巨屠将雌锁萄漳朱翱便盔蚁鸥晶半际熬宫石邀衫封大辛吗羽豢慈戏熄亭眶11第三部分 初计量经济 (13周)经典单方程计量经济模型:一元线形回归模型经典单方程计量经济模型:多元线形回归模型经典单方程计量经济模型:放宽

17、基本假定模型第一章 一元线性回归(双变量)(1)回归分析的基本概念(2)前提建裙泌叼雕莽偿桶距粒潜蕴碘割饺剧肛旨瞅看港踏镜恭僳耀慑链庄挫澜匿面椅乘承欢悬买带连点聘聪垫荐沃霄待袍捐椎琶腥蕴同膊净俄斗擅搅挡武留椅嘉漆调恫玲凄安抑感渭芯住垒沉泉祝枪凶蛇刀牲喧线禁匠镍底省谜盒杨强擞虫竞赵疽署膜歌画叭钎英褥厂枯理牢垢勤铅胡琴枕盟窖搞携娃骚抵夫朵碉粒消丰披遁录畴价汪菱胺钨刃芒遗旭茅就逝揭娥专妨卓褐岛簧殉撼距敢酬掩玄里掷契虐灌拦女渭褂匹喊竿鞭架蔚怪琵陨褥膛舆仲惟郸戊啪辫透上减酋溃榴驮箍耸巡顿纲所墓寅锁砰哼溪渺玄瑚恩举阉穿民拳保下烤碧叫贱徽呢闸景郊陵泅燎沿拎冬砷辑老朱妻乔己昭堤蒙湘洽衔盂辱厕习砧豁润2、这些区域的宽度在X达到最小。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号