《一元线性回归.ppt.ppt》由会员分享,可在线阅读,更多相关《一元线性回归.ppt.ppt(24页珍藏版)》请在三一办公上搜索。
1、一元线性回归分析,1.回归分析的基本概念,2.一元线性回归分析,3.应用范例与MATLAB实现,Linear Regression Analysis,LRA,1.回归分析的基本概念,函数关系与相关关系,函数关系变量之间确实存在的,且在数量上表现,为确定性的相互依存关系.,例如,圆的面积S与半径R有关,一旦半径R确定,则,相关关系变量之间确实存在的,但在数量上表现,为不确定的相互依存关系.,例如,人的体重y与身高x有关,一般而言,较高的人,体重较重,但同样身高的人体重却不会完全相同;又如居,民的储蓄存款额y与他的收入x有关,但同样收入的人储蓄,存款额也不会相同.,函数关系往往通过具有不确定性的相
2、关关系表现出来,,而完全的相关关系必定是函数关系.,相关关系的种类,按相关的方向划分|,正相关两个变量按照相同的趋势变化,或者说某,个现象的变量增加,另一个现象的变量也增加的现象.,负相关两个变量按照相反的趋势变化,或者说某,个现象的变量增加,另一个现象的变量反而减少的现象.,零相关两个变量在数量上完全独立,在一定的形,式下,互不影响,互不相干的关系.严格的讲,零相关不,是“不相关”,因为事物的联系是绝对的,而独立是相对,的,只有在某种形式下它才能互不影响,互不相干.,按相关形式划分,线性相关两个变量之间呈线性关系的相关.,非线性相关两个变量之间呈非线性关系的相关关系.,按变量多少划分,单相关
3、两个变量之间的相关关系.,复相关两个以上的变量之间的相关关系.,偏相关在多个变量相关的场合,考察其中两个变量,的相关关系(假定其他变量不变).,按相关性质划分,真实相关变量之间具有内在联系的相关关系.,虚假相关变量之间只是表面存在、而实质上并没,有内在联系的相关关系.,回归分析的一般概念,回归分析分析变量间相关关系的一种统计方法.根,据相关关系的具体形态,明确谁是自变量(可控变量),谁,是因变量(随机变量),选择一个合适的数学模型,来近似,地表达变量间的平均变化关系.,“回归”一词由英国统计学家道尔顿提出.道尔顿在研,究人的身高问题时,发现父母的身高与子女的身高有一定,关系,父母高的子女反而矮
4、一些,父母矮的子女反而高一,些,他称这种返祖现象为回归.此后,回归分析泛指遵循,道尔顿研究问题的思想和方法的一类统计分析方法.,回归分析的目的建立变量之间相关关系的具体的,数学表达形式,并藉此来探讨对因变量的预测问题.这不,仅依赖变量之间相关程度的度量(需要相关分析的辅助),,更依赖变量之间真实相关性的存在.然而,现象之间是否,存在真实相关,必须根据有关专业领域的学科理论来确定.,因此,回归分析必须要在定性分析前提下进行,不能进行,纯数量的计算.,2.一元线性回归分析,一元线性回归模型,模型的理论假设,设x是自变量(非随机变量,其值,是可以控制或精确测量),y是因变量(随机变量,对给,定的x值
5、不能事先确定y的取值),则一元线性回归模型的,理论假设是,模型的建立,求线性函数,的经验回归方程,计,称为回归系数.,模型的数据结构,模型参数 与 的最小二乘估计,参数估计的准则,时的误差平方和),合值.称,记,参数估计的算法,可以证明,并且,其中,回归方程的显著性检验,显著性检验的基本定理,定义,总偏差平方和,自由度,.,回归平方和,自由度,.,残差平方和,自由度,.,则有,显著性检验的基本方法,方差分析(F检验),检验假设,).,检验统计量及其分布,,于是检验统计量,检验的显著性概率,决策准则,回归方程有显著意义.,检验结果的报告(方差分析表),拟合程度测定,可决系数,(测定回归直线对各个观测点的拟合程度的,的统计量),可决系数的解释,的正负号相同.,估计的标准误差,定义,的值越小,表明回归直线对各个观测点的拟合程度越,点预测,的预测值为,是,的无偏估计.,区间预测,利用回归方程进行预测,因此,,3.应用范例与MATLAB实现,社会商品零售总额与税收总额的线性回归分析,