第九章回归分析预测.ppt

上传人:文库蛋蛋多 文档编号:2935097 上传时间:2023-03-04 格式:PPT 页数:62 大小:1.49MB
返回 下载 相关 举报
第九章回归分析预测.ppt_第1页
第1页 / 共62页
第九章回归分析预测.ppt_第2页
第2页 / 共62页
第九章回归分析预测.ppt_第3页
第3页 / 共62页
第九章回归分析预测.ppt_第4页
第4页 / 共62页
第九章回归分析预测.ppt_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《第九章回归分析预测.ppt》由会员分享,可在线阅读,更多相关《第九章回归分析预测.ppt(62页珍藏版)》请在三一办公上搜索。

1、2023/3/4,1,第九章 回归分析预测,2023/3/4,第九章 回归分析预测,一、回归分析预测原理二、回归分析预测的一般步骤三、一元线性回归预测及应用四、多元线性回归预测及应用五、自回归预测,2023/3/4,学习目标,了解回归分析预测法的实质;熟悉回归分析预测法的预测步骤;掌握一元线性回归分析预测的具体方法;做到通过分析因变量与自变量之间的相互关系,建立对应的函数模型并进行预测。,2023/3/4,一、回归分析预测原理,1、函数关系和相关关系2、相关分析3、回归分析,2023/3/4,函数关系(确定关系)是指由某种确定的原因,必然导致确定的结果的因果关系。,相互关系事物之间的相互关系可

2、以分为确定性关系和非确定性关系。,相关关系(非确定关系)指变量之间相互关系中不存在数值对应关系的非确定性的依存关系。,1、函数关系和相关关系,2023/3/4,判断下面是什么关系,父亲身高y与子女身高x之间的关系,收入水平y与受教育程度x之间的关系,商品的消费量y与居民收入x之间的关系,某种商品的销售额y与销售量x之间的关系可表示为 y=px(p 为单价),圆的面积S与半径R之间的关系可表示为S=R2,2023/3/4,相关关系的类型,按照相关关系的性质正相关和负相关按照相关关系的形式线性相关和非线性相关按照变量之间的相关程度完全相关、不完全相关和不相关,2023/3/4,正相关,2023/3

3、/4,负相关,2023/3/4,0相关,2023/3/4,2、相关分析,相关分析是对变量之间的相关关系进行分析和研究的方法,主要包括两个方面:确定事物之间有无相关关系;确定相关关系的密切程度。,2023/3/4,3、回归分析,是对具有相关关系的变量,在固定一个变量数值的基础上,利用回归方程测算另一个变量的取值的平均数。,2023/3/4,二、回归分析预测的一般步骤,1、确定相关关系;2、估计参数,建立回归预测模型;3、对预测模型进行检验;4、计算与确定置信区间。,2023/3/4,1、确定相关关系,(1)确定相关变量主要指因变量的确定和自变量的确定,(2)确定变量之间相关类型一般可通过绘制相关

4、图直观地看出。,(3)确定变量之间相关的密切程度通常要通过计算相关系数来检验。,2023/3/4,相关系数计算公式,2023/3/4,相关系数检验,相关系数是描述两个变量之间线性关系能密切程度的数量指标。,一般地,|r|0.95 存在显著性相关;|r|0.8 高度相关;0.5|r|0.8 中度相关;0.3|r|0.5 低度相关;|r|0.3 关系极弱,认为不相关。,2023/3/4,2、估计参数,建立回归预测模型,回归方程分为线形方程和非线性方程,最小二乘法,2023/3/4,3、对预测模型进行检验,(1)标准离差检验;(2)拟合程度检验;(3)显著性检验。,2023/3/4,(1)标准离差检

5、验,用来检验回归预测模型的精度。,标准离差(S):表示变量诸观测值与回归直线估计值的绝对离差数额。,计算公式:,其中:k代表预测模型中参数的个数。,离散系数或标准离差系数:,一般希望V不超过15%,2023/3/4,(2)拟合程度检验,用来测定回归直线对各观测值点的拟合程度。,2023/3/4,变差,因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面由于自变量 x 的取值不同造成的除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差来表示,2023/3/4,变差的分解(图示),2023/3/4

6、,离差平方和的分解(三个平方和的关系),2023/3/4,三个平方和的意义,总平方和(SST)反映因变量的 n 个观察值与其均值的总离差回归平方和(SSR)反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和残差平方和(SSE)反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和,2023/3/4,拟合系数(判定系数)R2,回归平方和占总离差平方和的比例,反映回归直线的拟合程度取值范围在 0,1 之间 R2 1,说明回归方程拟合的越好;R20,说明回归方程拟合的越差判定系数等于相关

7、系数的平方,即R2r2(试证明),2023/3/4,(3)显著性检验,检验自变量与因变量之间的线性关系是否显著。将回归均方(MSR)同残差均方(MSE)加以比较,应用F检验来分析二者之间的差别是否显著回归均方:回归平方和SSR除以相应的自由度(自变量的个数p)残差均方:残差平方和SSE除以相应的自由度(n-p-1),2023/3/4,线性关系的检验,提出假设:H0:r0 线性关系不显著,计算检验统计量F,确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F 作出决策:若FF,拒绝H0;若FF,不拒绝H0,2023/3/4,课堂作业,若X表示在一家分店工作的售货人数,Y表示这家分店的

8、年销售额(千元),已经求出Y对X的回归方程的估计结果如下表,2023/3/4,回答以下几个问题,1、写出估计的回归方程2、在研究中设计多少家分店3、计算F统计量,在0.05显著性水平下检验关系的显著性4、说明各回归系数的含义并预测有12名售货员的某分店的年销售收入。,2023/3/4,4、计算与确定置信区间,由于预测值与实际值之间存在有不确定的偏差,因而需要确定预测值的有效区间,即置信区间。一元线性回归预测的置信区间有下述表达式确定:,2023/3/4,下表为我国1990-2001年城镇居民收入与消费支出情况,根据资料分析城镇居民人均可支配收入与消费支出之间的关系,并根据2002年、2003年

9、的人均收入预测消费支出。,三、一元线性回归预测及应用,2023/3/4,2023/3/4,2023/3/4,确定相关关系,r很接近于1,表明y与x之间为高度线性相关。,2023/3/4,估计参数,建立回归预测模型,一元线性回归预测的基本模型如下:,所以,我们应先求出:,2023/3/4,代入公式可得:,2023/3/4,对预测模型进行检验,标准离差检验,拟合程度检验,显著性检验,2023/3/4,标准离差检验,根据前表数据以及标准离差计算公式有:,离散系数或标准离差系数:,所以,回归预测模型的精度较高。,2023/3/4,拟合程度检验,根据前表数据以及可决系数计算公式有:,可决系数R2很接近于

10、1,表明回归直线与各观测点很接近,回归直线的拟合度很高。,2023/3/4,根据前表数据以及F检验统计量计算公式有:,取0.05有:F0.05(1,10)4.96,即有:F F0.05(1,10),所以y与x之间线性关系成立。,显著性检验,2023/3/4,计算与确定置信区间点预测法,由于预测值与实际值之间存在有不确定的偏差,因而需要确定预测值的有效区间,即置信区间。,如:令x0=7300,有,点预测法:将自变量的预测值x0 代入预测模型,求出因变量的预测值,即为点预测。假设2002年的人均可支配收入为7300元。,2023/3/4,计算与确定置信区间区间预测法,一元线性回归预测的置信区间由下

11、述表达式确定:,由自变量的估计值x0求出因变量预测值在一定可靠程度下的一个取值范围(即置信区间)。,2023/3/4,计算确定置信区间。,即在显著水平0.05下,y的置信区间为5612.97,5913.31,令x0=7300,,2023/3/4,若在预测过程中只希望获得置信区间的近似估计,则利用预测点估计值y0和回归分析的标准离差S,作出下述不同置信度的结论:(上例中:y0 5763.14,S58.23),预测值y0置信度为68.3%的近似置信区间为:,预测值y0置信度为95.4%的近似置信区间为:,预测值y0置信度为99.7%的近似置信区间为:,即:5588.45,5937.83,即:570

12、4.91,5821.37,即:5646.68,5879.60,2023/3/4,练 习,某地区农民10年人均年纯收入和该地区相应年份的销售额的资料:(1)用最小二乘法求出该一元回归方程中的参数,建立预测模型;(2)假设模型的各项检验均通过,用该模型预测当年纯收入为1400元的销售额(点预测)。,2023/3/4,四、多元线性回归预测及应用,当多元变量之间存在线性关系时,称为多元线性回归分析。,2023/3/4,回归方程:,采用最小二乘法:,二元线性回归预测的方法,2023/3/4,二元线性回归预测的实例,例:假设高级音响设备的销售量除同新结婚户数相关外,还同户均收入水平具有一定的关系。某地区高

13、级音响销售见下表:,2023/3/4,2023/3/4,方程预测,以上各相关数据代入上述方程组得:,解得方程组得:,所求方程:,2023/3/4,点预测与区间预测,当x1=430,x2=72.5时预测值,并计算置信度在95.4%时的置信区间。,预测值y0置信度为95.4%的近似置信区间为:,2023/3/4,五、自回归预测,自回归预测是利用因变量的时间数列中不同时间的取值存在自身相关关系(自相关),建立回归模型进行预测分析。,一元线性自回归预测的数学模型是,一元线性自回归模型与一元线性回归模型相似。因此。可以用类似的方法求出参数a与b。,2023/3/4,计算公式,2023/3/4,2023/

14、3/4,计算结果,故一元自线性模型为:,对2005年的人口进行预测:,2023/3/4,例题分析,已知身高与体重的资料如下表:,2023/3/4,已知身高与体重的资料如下表:,试计算:(1)拟合适当的回归方程;(2)判断拟合优度情况;(3)对模型进行显著性检验;(=0.05)(4)当体重为75时,求身高平均值的95%的置信区间。,例题分析,2023/3/4,(1)n=8,经计算得:,拟合回归方程,2023/3/4,回归直线的拟合优度不是很理想。,拟合优度情况,2023/3/4,所以拒绝原假设,认为所建立的线性回归模型是显著的。,对模型进行显著性检验,2023/3/4,95%的置信区间,2023/3/4,本章结束,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号