回归分析-赵秀丽.ppt

上传人:小飞机 文档编号:6436986 上传时间:2023-10-31 格式:PPT 页数:25 大小:303.49KB
返回 下载 相关 举报
回归分析-赵秀丽.ppt_第1页
第1页 / 共25页
回归分析-赵秀丽.ppt_第2页
第2页 / 共25页
回归分析-赵秀丽.ppt_第3页
第3页 / 共25页
回归分析-赵秀丽.ppt_第4页
第4页 / 共25页
回归分析-赵秀丽.ppt_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《回归分析-赵秀丽.ppt》由会员分享,可在线阅读,更多相关《回归分析-赵秀丽.ppt(25页珍藏版)》请在三一办公上搜索。

1、线性回归分析,报告人:赵秀丽指导教师:谢邦昌日期:2007年11月6日,线性回归模型,Regression 节点生成线性回归模型。该模型是根据输入变量估计预测输出变量的最佳线性方程。回归方程代表一条直线或者平面,其预测值与真实输出值的离差最小,这是一种非常常用的用于概括数据并作出预测的统计方法。,要 求,要求:只有数值型变量可用于回归模型。必须只有一个“OUT”变量和一个以上的“IN”变量。变量方向为“Both”或“None”的变量将被忽略;同样被忽略的有非数值型变量。,线性回归模型的优点,优点:回归模型相对简单,并为生成的预测给出易于解释的数学方程。由于回归建模一个比较成熟的统计方法,回归模

2、型的特性容易理解。而且回归模型训练起来也非常快。线性回归节点提供自动选择变量的方法以删除方程中的不显著的输入变量。,线性回归节点模型选项,线性回归节点模型选项(如图),model name:指定要产生的模型名称;Method:指定建立回归模型的方法;Include constant in equation:方程中包括常数.,建立回归模型的方法,方法(1):进入法(Enter)这是预设的方法,将所有的变量直接选入方程,在建模中没有变量选择。,建立回归模型的方法,方法(2):逐步节选法(Stepwise)即逐步回归变量选择方法一步一步建立方程。初始模型是最可能简单的模型,方程中没有一个输入变量。在

3、每一步,对未进入方程的变量进行评估,如果这些变量中最好的变量能显著增强模型的预测效果,则添加该变量进入方程。此外,已经存在于防城中的变量将被重新评估,以决定其是否可被从方程中除去而不显著减损方程的效果,如果可以,则将被除去。随后,重新进行该步骤,添加或除去其他变量。在没有变量可添加到方程以改进方程,也没有变量可被除去而不显著减损方程时,生成最终模型。,建立回归模型的方法,方法(3):后退法(Backwards)后退法变量选择与逐步回归变量选择的相似之处都是逐步建立模型。不同之处是后退法下最初的模型包括所有的输入变量作为预测变量,变量只能被剔出模型而不能被添加到模型。对模型几乎没有贡献的变量被一

4、个一个的剔除出模型,知道剩下的每一个变量都显著影响模型预测效果,此时生成最终的模型。,建立回归模型的方法,方法(4):前进法(Forwards)前进法本质上与后退法相反。前进法下最初模型是没有任何输入变量的最简化模型,变量只能被添加到模型中而不能被剔除。在每一步,检验尚未进入模型的输入变量对模型的改进程度,对模型改进程度最大的变量进入模型,在没有变量可添加到模型或者最后的备选变量对模型没有多大改进时,生成最终模型。,方程中包含常数(Include constant in equation)该选项决定是否在最终方程中包含常数项。在大多数情况下,应选择该选项。如使用者有先验知识,只要预测变量为零时

5、输出变量总是为零,则该选项很有用。,线性回归节点高级选项,高级选项可以使使用者调整建模进程;要使用高级选项,将Expert项目中的模式项(Mode)中设置为Expert。,线性回归节点高级选项,ModeMissing valuesSingularity tolerance Stepping Output,线性回归节点高级选项,遗漏值(Missing values):在预设设置下,线性回归节点只使用模型中所有变量均有有效值的记录。如果有大量遗漏值,使用者可能会发现这种方法提出了太多的记录,使使用者没有足够的资料生成一个好的模型。在这种情况下可能取消选择Only use complete reco

6、rds 选项。Clementine会尝试用尽可能多的信息来估计回归模型,包括有些变量有遗漏值的记录。但是,在某些情况下,以这种方式使用不完整记录在估计回归方程时会引起计算问题。,线性回归节点高级选项,奇异值容许度(Singularity tolerance):这一选项允许使用者指定某一变量独立于模型中其他变量的最小方差比率。,线性回归节点高级选项,逐步方式(Stepping):这些选项允许控制逐步筛选法、前进法、后退法中变量进入和剔除的准则。(如果选择了Enter法,则按钮不可用)。要了解更详细的情况,参见“线性回归节点逐步选项”。,线性回归节点高级选项,输出(Output):这些选项允许要求

7、在该节点生成的模型的高级输出中所出现的附加统计量。要了解更详细的情况,参见“回归节点输出选项”。,线性回归节点逐步选项,选择两个准则中的一个作为前进中的准则,然后确定使用者需要的临界值。注意:两个准则之间具有返乡关系。变量对模型越重要,P值越小,F值越大。,线性回归节点逐步选项,Use probability of F(使用F的概率):该选项允许指定基于每个变量的关联统计概率(associated p value)作为选择准则。只有当P值比Entry值小时变量才会添加到模型,也只有当P值比Removal值大时变量才会被剔除。Entry值必须比Removal值小。,线性回归节点逐步选项,Use

8、F value(使用F值):該该选项允许指定基于每个变量的F统计量作为选择准则。F值是对每个变量对模型的贡献的度量。只有当F值比Entry值大时变量才会添加到模型,也只有当F值比Removal值小时变量才会被剔除。Entry值必须比Removal值大。,线性回归节点输出选项,选择在生成的线性回归模型的高级输出中的使用所 想要的输出项。要观察高级输出,浏览生成模型并点Advanced。要了解更多的信息,参见生成模型章的“线性回归方程高级输出”。,线性回归节点输出选项,模型拟合优度(Model fit):模型拟合概要,包括拟合优度(R2)。它表示输出变量方差中能够被输入变量解释的比例。R2改变量(

9、R squared change):逐步回归、前进法、后退法等估计方法中每一步的R2改变量。,线性回归节点输出选项,选取准则(Selection criteria):估计建模过程每一步模型所包含的信息内容的统计量,用以帮助评估模型的改进程度。统计量包括赤池信息量(Akaike Information Criterion)、阿米米亚预测准则(Amemiya Prediction Criterion)、马洛斯预测准则(Mallows Prediction Criterion)和施瓦茨贝叶斯准则(Schwarz Bayesian Criterion)。,线性回归节点输出选项,叙述统计量(Descri

10、ptives):输入和输出字段的基本叙述统计量。部分相关系数和偏相关系数(Part and Partial correlations):辅助决定每个输入变量对模型重要性及对模型的独特贡献的统计量。多重共线性诊断(Collinearity diagnostics):辅助判别多余输入变量问题的统计量。,线性回归节点输出选项,回归系数(Regression coefficients):回归系数相关统计量:(1)、Confidence interval(信赖区间)。方程中每个回归系数的95信赖区间。(2)、Covariance matrix(协方差矩阵)。输入变量的协方差矩阵。,线性回归节点输出选项,残差(Residuals):残差统计量,或说预测值与真实值之间的差异.DurbinWatson(DW统计量)。对自相关的DW检验。该检验检测样本顺序对回归模型的影响,样本顺序可能使回归模型无效。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号