《回归分析概述》PPT课件.ppt

上传人:小飞机 文档编号:5483130 上传时间:2023-07-11 格式:PPT 页数:42 大小:2.56MB
返回 下载 相关 举报
《回归分析概述》PPT课件.ppt_第1页
第1页 / 共42页
《回归分析概述》PPT课件.ppt_第2页
第2页 / 共42页
《回归分析概述》PPT课件.ppt_第3页
第3页 / 共42页
《回归分析概述》PPT课件.ppt_第4页
第4页 / 共42页
《回归分析概述》PPT课件.ppt_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《《回归分析概述》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《回归分析概述》PPT课件.ppt(42页珍藏版)》请在三一办公上搜索。

1、1,第二讲 回归分析概述,变量间关系的度量总体回归函数样本回归函数,引子:中国旅游业将达到世界旅游强国水平,中国旅游业“十二五”发展规划纲要 提出,到“十二五”期末,中国的旅游业初步建设成为国民经济的战略性支柱产业和人民群众更加满意的现代服务业。力争2020年我国旅游产业规模、质量、效益基本达到世界旅游强国水平。2015年中国旅游业总收入达到2.3万亿元,年均增长率为10%,旅游业增加值占全国GDP的比重提高到4.5%,占服务业增加值的比重达到12%,旅游消费相当于居民消费总量的比例达到10%。什么决定性因素能使中国旅游业总收入超过2.3万亿元?旅游业的发展与这种决定性因素的数量关系究竟是什么

2、?怎样具体测定旅游业发展与这种决定性因素的数量关系?,2,需要研究经济变量之间数量关系的方法,对旅游起决定性影响的因素有:“中国居民的收入水平”以及“入境旅游人数”等因素。“旅游业总收入”(Y)与“居民平均收入”(X1)或者“入境旅游人数”(X2)有怎样的数量关系呢?能否用某种线性或非线性关系式 Y=f(X)去表现这 种数量关系呢?具体该怎样去表现和计量呢?,4,三种情况:确定性的函数关系 Y=f(X)变量之间有确定的一一对应关系,可用数学方法计算 相关关系 Y=f(X)+(为随机变量)不确定的统计关系,可用统计方法分析 没有关系 不用分析,经济变量之间的相互关系,变量间的关系(函数关系),函

3、数关系的例子某种商品的销售额(y)与销售量(x)之间的关系可表示为 y=p x(p 为单价)圆的面积(S)与半径之间的关系可表示为S=R2 企业的原材料消耗额(y)与产量(x1)、单位产量消耗(x2)、原材料价格(x3)之间的关系可表示为y=x1 x2 x3,变量间的关系(相关关系),变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量 x 取某个值时,变量 y 的取值可能有几个各观测点分布在直线周围,统计分析的目的在于如何根据统计数据确定变量之间的关系形态及其关联的程度,并探索出其内在的数量规律性。,变量间的关系(相关关系),相关关系的例子商品的消费量(y)与居民收入

4、(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系子女身高(y)与父母身高(x)之间的关系,8,8,相关关系的类型,从涉及的变量数量看 简单相关 多重相关(复相关)从变量相关关系的表现形式看 线性相关,散布图接近一条直线 非线性相关,散布图接近一条曲线从变量相关关系变化的方向看 正相关,变量同方向变化,同增同减 负相关,变量反方向变化,一增一减 不相关,相关关系的图示,【例】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等

5、项目的贷款。几年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,管理者希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。,不良贷款与贷款余额、应收贷款、贷款项目和固定资产投资等因素有无关系?什么关系?关系强度?,不良贷款与各项贷款余额有明显线性关系,不良贷款与本年累计应收贷款有线性关系,不良贷款与贷款项目个数有线性关系,不良贷款与本年固定资产投资额无明显线性关系,相关系数 根据样本数据计算的度量两个变量之间线性关系强度的统计量。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为;若是根据样本数据计

6、算的,则称为样本相关系数,记为r。,相关程度的度量相关系数,13,相关程度的度量相关系数,如果 和 总体的全部数据都已知,和 的方差和协方差也已知,则 X和Y的总体线性相关系数:其中:-X 的方差-Y的方差-X和Y的协方差特点:总体相关系数只反映总体两个变量 和 的线性相关程度对于特定的总体来说,和 的数值是既定的,总体相关系数 是客观存在的特定数值。总体的两个变量 和 的全部数值通常不可能直接观测,所以总体相关系数一般是未知的。,14,如果只知道 X 和 Y 的样本观测值,则X和Y的样本线性相关系数为:其中:和 分别是变量X和Y的样本观测值,和 分别是变量 X 和Y 样本值的平均值注意:是随

7、抽样而变动的随机变量。,X和Y的样本线性相关系数:,相关系数较为简单,也可以在一定程度上测定变量间的数量关系,但是对于具体研究变量间的数量规律性还有局限性。,(1)-1r+1(2)对称性 rxy=ryx(3)r的大小与数据原点及尺度无关。(4)r仅仅是x与y之间线性关系的一个度量,它不能描述非线性关系。(5)r 虽然是两个变量线性关系的一个度量,却不一定意味着x与y之间有因果关系。(6)|r|0.8时,高度相关;0.5|r|0.8,中度相关;0.3|r|0.5,低度相关;|r|0.3,不相关。(7)样本相关系数是总体相关系数的样本估计值,由于抽样波动,样本相关系数是随抽样而变动的随机变量,统计

8、显著性还有待检验。,相关系数r的性质,【例】根据相关的数据,计算不良贷款、贷款余额、应收贷款、贷款项目个数、固定资产投资额之间的相关系数。,某市1996年 2003年的工资性现金支出与城镇储蓄存款余额的资料,第1步:提出假设 H0:=0;H1:0第2步:计算检验的统计量第3步:进行决策.若|t|t/2(n-2),则拒绝原假设.表明总体的两个变量之间存在显著的线性关系。,t(n-2),相关关系的显著性检验,统计理论已经证明,【例】根据计算的相关系数,检验不良贷款与贷款余额之间的相关系数是否显著(=0.05),第1步:提出假设H0:=0;H1:0第2步:计算检验的统计量,第3步:进行决策。查表得,

9、t/2(n-2)=2.0687,由于t=7.5344 t/2(n-2)=2.0687,所以拒绝原假设。表明不良贷款与贷款余额之间存在显著的正线性关系。,21,回归分析,回归的古典意义:高尔顿遗传学的回归概念(父母身高与子女身高的关系)子女的身高有向人的平均身高回归的趋势回归的现代意义:一个被解释变量对若干个解释变量依存关系的研究回归的目的(实质):由解释变量去估计被解释变量的平均值。,回归分析(regression analysis)是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。回归分析就是对具有相关关系的两个或两个以上的变量之间的数量变化进行测定,配合一定的数学模型后对因

10、变量进行估计或预测的一种统计分析方法。被解释变量(Explained Variable)或应变量(Dependent Variable)。解释变量(Explanatory Variable)或自变量(Independent Variable)。,回归分析的基本概念,回归分析目的:通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值。回归分析所要解决的问题:从一组样本数据出发,确定出变量之间的数学关系式;对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响是显著的,哪些是不显著的;利用所求的关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的

11、取值,并给出这种估计或预测的可靠程度。,回归模型的类型,相关分析的任务是确定两个变量之间相关的方向和密切程度。回归分析的任务是寻找因变量对自变量依赖关系的数学表达式;相关分析不必确定两变量中哪个是自变量,哪个是因变量,而回归分析中必须区分因变量与自变量;相关分析中两变量是对等的改变两者的地位,并不影响相关系数的数值,只有一个相关系数。而在回归分析中,互为因果关系的两个变量可以编制两个独立的回归方程;相关分析中两变量可以都是随机的,而回归分析中因变量是随机的,自变量不是随机的。,回归分析与相关分析的区别,回归分析与相关分析的联系,相关分析是回归分析的基础和前提。只有在相关分析确定了变量之间存在一

12、定相关关系的基础上建立的回归方程才有意义;回归分析是相关分析的继续和深化。只有建立了回归方程才能表明变量之间的依赖关系,并进一步进行预测。,27,被解释变量Y的条件分布和条件概率:当解释变量X取某固定值时(条件),Y 的值不确定,Y的不同取值会形成一定的分布,这是 Y 的条件分布。X取某固定值时,Y 取不同值的概率称为条件概率。被解释变量 Y 的条件期望:对于 X 的每一个取值,对 Y 所形成的分布确 定其期望或均值,称 为 Y 的条件期望或条件均 值,用 表示。注意:Y的条件期望是随X的变动而变动的,Y,X,明确几个概念(为深刻理解“回归”),28,回归线:对于每一个X的取值,都有Y的条件期

13、望 与之对应,代表Y的条件期望的点的轨迹形成的直线或曲线称为回归线。回归函数:被解释变量Y的条件期望 随解释变量X的变化而有规律的变化,如果把Y的条件期望表现为 X 的某种函数,这个函数称为回归函数。回归函数分为:总体回归函数和样本回归函数,X,Y,29,举例:假如已知由100个家庭构成的总体的数据(单位:元),总体回归函数(population regression function,PRF),30,消费支出的条件期望与收入关系的图形,对于本例的总体,家庭消费支出的条件期望与家庭收入 基本是线性关系。家庭消费支出的条件均值表示为家庭收入的线性函数:,31,总体回归函数的概念 前提:假如已知所

14、研究的经济现象的总体的被解释变量Y和解释变量X的每个观测值(难度较大!),那么,可以计算出总体被解释变量Y的条件期望,将其表现为解释变量X的某种函数:这个函数称为总体回归函数(PRF)本质:总体回归函数实际上表现的是特定总体中被解释变量随解释变量的变动而变动的某种规律性。计量经济学的根本目的是要探寻变量间数量关系的规律,也就要努力去寻求总体回归函数。,32,条件期望表现形式例如Y的条件期望 是解 释变量X的线性函数,可表示为:个别值表现形式(随机设定形式)对于一定的,Y的各个别值 并不一定等于条件期望,而是分布在 的周围,若令各个 与条件期望 的偏差为,显然 是个随机变量 则有,总体回归函数的

15、表现形式,PRF,作为总体运行的客观规律,总体回归函数是客观存在的,但在实际的经济研究中总体回归函数通常是未知的,只能根据经济理论和实践经验去设定。计量经济学研究中“计量”的根本目的就是要寻求总体回归函数。我们所设定的计量模型实际就是在设定总体回归函数的具体形式。总体回归函数中 Y 与 X 的关系可以是线性的,也可以是非线性的。,33,如何理解总体回归函数,34,计量经济学中,线性回归模型的“线性”有两种解释:就变量而言是线性的 Y的条件期望(均值)是X的线性函数 就参数而言是线性的 Y的条件期望(均值)是参数的线性函数例如:对变量、参数均为“线性”对参数“线性”,对变量”非线性”对变量“线性

16、”,对参数”非线性”注意:在计量经济学中,线性回归模型主要指就参数而言是“线性”的,因为只要对参数而言是线性的,都可以用类似的方法去估计其参数,都可以归于线性回归。,“线性”的判断,概念 在总体回归函数中,各个 的值与其条件期望 的偏差 有很重要的意义。若只有 的影响,与 不应有偏差。若偏差 存在,说明还有其他影响因素。实际代表了排除在模型以外的所有因素对 Y 的影响。性质 是其期望为 0 有一定分布的随机变量重要性:随机扰动项的性质决定着计量经济分析结 果的性质和计量经济方法的选择,35,随机扰动项,是未知影响因素的代表(理论的模糊性)是无法取得数据的已知影响因素的代表(数据欠缺)是众多细小

17、影响因素的综合代表(非系统性影响)模型可能存在设定误差(变量、函数形式的设定)模型中变量可能存在观测误差(变量数据不符合实际)变量可能有内在随机性(人类经济行为的内在随机性),36,引入随机扰动项 的原因,样本回归线:对于X的一定值,取得Y的样本观测值,可计算其条件均值,样本观测值条件均值的轨迹,称为样本回归线。样本回归函数:如果把被解释变量Y的样本条件均值 表示为解释变量X的某种函数,这个函数称为样本回归函数(SRF),37,X,Y,SRF,样本回归函数(population regression function,SRF),38,样本回归函数如果为线性函数,可表示为 其中:是与 相对应的

18、Y 的样本条件均值 和 分别是样本回归函数的参数 个别值(实际值)形式:被解释变量Y的实际观测值 不完全等于样本条件均值,二者之差用 表示,称为剩余项或残差项:则 或,样本回归函数的函数形式,条件均值形式:,样本回归线随抽样波动而变化:每次抽样都能获得一个样本,就可以拟合一条样本回归线,(SRF不唯一)样本回归函数的函数形式应与设定的总体回归函数的函数形式一致。样本回归线只是样本条件均值的轨迹,还不是总体回归线,它至多只是未知的总体回归线的近似表现。,39,样本回归函数的特点,SRF1,SRF2,Y,X,A X,40,PRF,SRF,样本回归函数与总体回归函数的关系,如果能够通过某种方式获得 和 的数值,显然:和 是对总体回归函数参数 和 的估计 是对总体条件期望 的估计 在概念上类似总体回归函数中的,可视 为对 的估计。,41,对比:总体回归函数 样本回归函数,对样本回归的理解,42,目的:计量经济分析的目标是寻求总体回归函数。即用样本回归函数SRF去估计总体回归函数PRF。由于样本对总体总是存在代表性误差,SRF 总会过高或过低估计PRF。要解决的问题:寻求一种规则和方法,使其得到的SRF的参数 和 尽可能“接近”总体回归函数中的参数 和 的真实值。这样的“规则和方法”有多种,如矩估计、极大似然估计、最小二乘估计等,其中最常用的是最小二乘法。,回归分析的目的,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号