《线性回归案例》PPT课件.ppt

上传人:牧羊曲112 文档编号:5566972 上传时间:2023-07-28 格式:PPT 页数:58 大小:890KB
返回 下载 相关 举报
《线性回归案例》PPT课件.ppt_第1页
第1页 / 共58页
《线性回归案例》PPT课件.ppt_第2页
第2页 / 共58页
《线性回归案例》PPT课件.ppt_第3页
第3页 / 共58页
《线性回归案例》PPT课件.ppt_第4页
第4页 / 共58页
《线性回归案例》PPT课件.ppt_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《《线性回归案例》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《线性回归案例》PPT课件.ppt(58页珍藏版)》请在三一办公上搜索。

1、数学建模之统计模型,一、线性回归,人们关心的变量(因变量)受另外几个变量(自变量)的关联性(非因果性)的影响,需要建立这些变量的数学模型,使得能够根据自变量的数值预测因变量的大小,或者解释因变量的变化,达到预测、控制等目的。本课重点以案例为依托重点介绍方法。,一元线性回归,多元线性回归,回归分析,数学模型及定义,*模型参数估计,*检验、预测与控制,可线性化的一元非线性回归(曲线回归),数学模型及定义,*模型参数估计,*多元线性回归中的检验与预测,案例介绍,背景、目标、变量和分析,案例背景,目前中国的资本市场逐渐成熟,投资于股市成为众多企业乃至个人的重要理财方式。因此利用上市公司当年的公开的财务

2、指标对来年盈利状况予以预测就成为投资人最重要的决策依据。本案例随机抽取深市和沪市2002年和2003年容量分别为500个的样本,对上市公司的净资产收益率(return on equity,ROE)进行预测。,案例目标与变量,目 标:盈利预测因 变 量:下一年的净资产收益率(ROE)自 变 量:当年的财务信息(指标)样本容量:2002年500;2003年500 Dependent variableindependent variable(predictor,predictive variable,covariate),自变量,ROEt:当年净资产收益率ATO:资产周转率(asset turnov

3、er ratio)LEV:债务资本比率(debt to asset ratio)反映公司基本债务状况PB:市倍率(price to book ratio)反映公司预期的未来成长率ARR:应收账款/主营业务收入(account receivable over total income)反映公司的收入质量,PM:主营业务利润/主营业务收入(profit margin)反映公司利润状况GROWTH:主营业务增长率(sales growth rate)反映公司已实现的当年增长率INV:存货/资产总计(inventory to asset ratio)反映公司的存货状况ASSET:(对数)资产总计(lo

4、g-transformed asset)反映公司的规模,探寻因变量同自变量之是的数量关系,为此需假设它们之间的数量关系满足某种函数形式,而最简单最常用的函数形式就是线性函数。,其中 为第 j 个解释性变量 xij 的回归系数.线性针对未知系数,回归分析的根本目的,其中 为第 j 个解释性变量 xij 的回归系数.,公司当年的净资产收益率 xi1=ROEt 资产周转率 xi2=ATO 债务资本比率 xi3=LEV 市倍率 xi4=PB 应收帐款/主营业务收入 xi5=ARR 主营业务利润/主营业务收入 xi6=PM 主营业务收入增长率 xi7=GROWTH 存货/资产总计 xi8=INV 对数变

5、换后的资产总计 xi9=ASSET.,用 代表这500 个样本.,用 代表相关的 p个解释变量(p=9).,对模型的进一步分析,哪个自变量在预测方面最有用?哪个自变量是最重要的?如何使用模型进行预测?,Step 1 描述分析,获得对数据的整体性认识 发现异常值 重要的趋势,读取数据,在SPSS中打开数据文件roe.sav在R环境下将数据读入系统并显示,使用如下语句:,数据的概括性度量,SPSS:Analyze Descriptive Statistics ExploreR语句:,变量间相关性分析,SPSS:Analyze Correlate BivariateR语句:,SPSS:Graph S

6、catterR语句:plot(a1$ROEt,a1$ROE),Step 2 模型的建立,模型、假设和参数估计,模型形式及假设,线性回归模型模型假设独立性假设不同的观测之间是互相独立的;残差项同解释变量之间的独立.同方差假设残差项的方差不依赖于自变量的取值,为一个常数.正态性假设残差项服从正态分布.,参数估计,模型:最小二乘估计量:方差估计量:,拟合优度,总平方和残差平方和R-Square,参数估计的软件实现,SPSS:Analyze Regression LinearR语句:lm1=lm(ROEROEt+ATO+PM+LEV+GROWTH+PB+ARR+INV+ASSET,data=a1)su

7、mmary(lm1),Step 3 显著性检验,F检验模型的显著性 t 检验自变量的显著性,F检验,假设检验统计量拒绝域,T检验,假设检验统计量拒绝域,记(X)-1=(cii)i=0,1,2,p,显著性检验的结论,从F检验的结果看,模型的线性关系是显著的。从T检验的结果看,ROEt和LEV两个变量通过了检验,GROWTH变量在显著性水平降至0.1时也可以通过检验,因此这三个变量与因变量的线性关系较为显著。注意,这不说明应该删除其它变量!,Step 4 模型的诊断,异方差性、非正态性、异常值,同方差性检验,同方差性检验,同方差性检验,同方差性检验,正态性检验,若,并且则有,正态性检验,进一步可以

8、得到以及所以在正态性假设下,残差 与 应该成线性关系。,正态性检验,Q-Q 图残差:将残差排序:Y:X:,将上面的方法应用于本案例,目标1:检验模型是否符合三个假设目标2:找出异常值SPSS实现方法:以预测值为X轴,残差为Y轴画散点图;画Q-Q图R语句:par(mfrow=c(2,2)#设置画图为2x2的格式 plot(lm1,which=c(1:4)#画出lm1中对应于模型检验的4张图,包括残差图、QQ图和Cook距离图检验发现47号数据为异常值,需要将其消除 语句:a1=a1(-47)粗略的方法:Cook距离1时,认为是异常值点;,同方差性检验,多重共线性,含义及检验,什么是多重共线性?,

9、如果存在如下回归方程能不能把它变成下面这样如果对这个方程进行回归会发生什么事?,第一个例子,假如有两个变量x1和x2,用最小二乘法得到如下参数估计量。,第二个例子,假如有三个变量x1、x2和x3,用最小二乘法得到如下参数估计量。,方差膨胀因子,定义下面的回归形式为辅助回归令 为辅助回归的判定系数则方差膨胀因子为:它反映了在多大程度上第i个自变量所包含的信息被其他自变量覆盖,当VIF10时,说明存在多重共线性。,方差膨胀因子,R语句:所有的VIF值都小于10且接近1,所以没有多重共线性问题。,变量的选择,AIC 和 BIC准则,AIC(Akaike Information Criterion)赤池信息准则 BIC(Bayesian Information Criterion)贝叶斯信息准则,比较所含解释变量个数不同的多元回归模型的拟合优度,AIC 和 BIC,AIC方法比较保守,其中p为自变量个数,与RSS(拟合残差平方和)成反比。使AIC达到最小的模型是最优的BIC相对不那么保守,因此保留的变量可能会比较少。,预测,预测值与置信区间,预测值的方差等于期望值的方差加上新产生的误差项的方差。,数据准备,以2003年数据为检验数据,可以用如下方法对数据进行准备,预测,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号