生物统计附试验设计第八章直线回归与相关分析ppt课件.ppt

上传人:牧羊曲112 文档编号:2096197 上传时间:2023-01-09 格式:PPT 页数:49 大小:448KB
返回 下载 相关 举报
生物统计附试验设计第八章直线回归与相关分析ppt课件.ppt_第1页
第1页 / 共49页
生物统计附试验设计第八章直线回归与相关分析ppt课件.ppt_第2页
第2页 / 共49页
生物统计附试验设计第八章直线回归与相关分析ppt课件.ppt_第3页
第3页 / 共49页
生物统计附试验设计第八章直线回归与相关分析ppt课件.ppt_第4页
第4页 / 共49页
生物统计附试验设计第八章直线回归与相关分析ppt课件.ppt_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《生物统计附试验设计第八章直线回归与相关分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《生物统计附试验设计第八章直线回归与相关分析ppt课件.ppt(49页珍藏版)》请在三一办公上搜索。

1、第八章 直线回归与相关分析,前述各章讨论的问题,都只涉及一个变量或性状,而在实际研究中常常要研究两个或两个以上变量的关系。变量间的关系分为两类:完全确定性关系;(没有随机误差)不存在完全确定性关系,不能由一个或几个变量的值精确地求出另一个变量的值;(相关关系),相关变量间的关系一般又分为两种:因果关系(一个变量的变化受一个或几个变量的影响,有自变量/依变量之分);平行关系(两个以上变量之间共同受到另外因素的影响,无自变量与依变量之分),x,y,施肥量(可以严格地人为控制),产量,自变量(independent variable),因变量(dependent variable),如果对x的每一个

2、可能的值,都有随机变量y的一个分布相对应,则称随机变量y对变量x存在回归(regression)关系。,因果关系(一个变量的变化受一个或几个变量的影响),因果关系(一个变量的变化受一个或几个变量的影响,有自变量/依变量之分);研究方法:采用回归分析 研究目的(任务):揭示变量间的联系形式,建立回归方程,并由自变量(原因)来预测、控制依变量(结果),平行关系/相关关系(两个以上变量之间共同受到另外因素的影响,无自变量与依变量之分),在大量测量各种身高人群的体重时会发现,在同样身高下,体重并不完全一样。在同样体重下,身高并不完全一样。但在每一身高/体重下,有一确定的体重/身高。,身高与体重之间存在

3、相关关系。,X身高,Y体重,X体重,Y身高,平行关系/相关关系(两个以上变量之间共同受到另外因素的影响,无自变量与依变量之分)研究方法:采用相关分析 研究目的(任务):研究两个变量之间相关的程度和性质或一个变量与多个变量之间相关的程度(计算相关系数),直线回归分析 一元回归分析 曲线回归分析 多元线性回归分析 多元回归分析(复回归分析)多元非线性回归分析,回归分析,简单相关分析直线相关分析 复相关分析 多元相关分析 偏相关分析,相关分析,第一节 直线回归分析,一、直线回归方程的建立 研究两个变量之间的关系时,一般先把n对观察值(x1,y1),(x2,y2),(xi,yi),(xn,yn)先以x

4、为横坐标,y为纵坐标在直角坐标纸上描出 n 个点,所描出的图形叫散点图。,在直线回归分析中主要是研究图中(b)与(d)的情况。设变量x与y间存在直线关系,根据n对观察值所描出的散点图如下图所示。,直线回归散点图,回归直线是所有直线中最接近散点图中全部散点的直线。设样本直线回归方程为:总体直线回归方程为:,其中:a称为回归截距;b称为回归系数,y=+x,回归值,回归值 与yi观察值间的偏差为:全部偏差平方和为:利用最小二乘法,即使偏差平方和最小的方法求a与b的值。,根据微积分学中求极值的原理,将Q对a与b求偏导数并令其等于0:,可以证明 称之为x与y的离均差乘积和,简称为乘积和,记为 SPxy。

5、回归方程的性质 回归直线必然通过 点。,线性回归方程建立的方法:用各组观察值(xi,yi)描点作散点图,确定变量x和y间是否存在直线关系;,平均温度()历期天数(d)11.8 30.1 14.7 17.3 15.6 16.7 16.8 13.6 17.1 11.9 18.8 10.7 19.5 8.3 20.4 6.7,研究黏虫孵化历期平均温度与历期天数关系,计算回归截距a和回归系数b;,建立样本直线回归方程,并进行偏离度估计和显著性检验,在散点图中,画出样本直线回归方程。,直线回归方程的偏离度估计,根据使偏差平方和 最小建立了直线回归方程。偏差平方和Q的大小表示了实测点与回归直线偏差的程度,

6、因而偏差平方和又称为离回归平方和或剩余平方和。Q的自由度df=n-2;离回归标准误,大小表示了回归直线与实测点的吻合程度,即回归估测值 与实际观察值y差异的程度。可以证明:,二、直线回归的显著性检验,能否利用所建立的直线回归方程来进行预测和控制,这取决于这个直线回归方程所反应的两个变量间的直线关系是否真实。因而还须对y与x间的直线关系进行检验。检验的方法有回归关系的F测验和回归系数的t测验二种。,(一)t 检验 对直线回归系数b的假设检验为:HO:=0;HA:0(为总体回归系数)。在HO成立的条件下,回归系数b服从t分布:,回归标准误:回归系数b抽样分布的标准差,离回归标准误,将计算出的 与根

7、据自由度df=n-2查表所得的临界t值 比较,作出结论。,否定H0:=0,接受HA:0,认为黏虫孵化历期平均温度与历期天数间有真实直线回归关系。,可以证明因此,(二)F 检验,y变量的平方和与自由度为,由于回归和离回归的均方比遵循df1=1,df2=n-2的F分布,所以,y的总平方和(SSy),dfy=n-1,离回归平方和(SS r),dfr=n-2,回归平方和(SS R),dfR=1,将计算出的F值与根据自由度df1=1,df2=n-2查表所得的临界F值 比较,作出结论。,回归关系方差分析表,上例中:H0:黏虫孵化历期平均温度x与历期天数y之间 不存在线性关系HA:两变量间有线性关系,F检验

8、的结果与t检验的结果一致。统计学已证明,在直线回归分析中这二种检验法是等价的,可任选一种进行检验。,线性回归方程的应用,应用线性回归方程建立并经显著性测验证明其真实存在后,可用回归方程对依变量进行预测或控制(但自变量必须在已知的观察值范围内)。特别要指出的是:利用直线回归方程进行预测或控制时,一般只适用于原来研究的范围,不能随意把范围扩大。,第二节 直线相关分析,进行直线相关分析的基本任务在于计算出表示x,y 两个变量间线性相关的程度和性质的统计量相关系数,并进行显著性检验。一、决定系数和相关系数 前面已证明了等式:,从等式不难看到:y与x直线回归效果的好坏取决于回归平方和 在y的总平方和 中

9、所占比例的大小。把比值 叫做x对y的决定系数记为r2,即,决定系数r2的大小表示了回归方程的可靠程度,显然有0r21。所以决定系数r2等于y对x的回归系数byx与x对y的回归系数bxy的乘积,即r2=byx bxy,若求r2的平方根,统计学把这样计算所得的统计量称为x与y的相关系数,记为r,即 显然相关系数-1r1,相关类型,二、相关系数和决定系数的计算,充分应用计算器的统计功能键,计算:将上述数值代入公式。,三、相关系数的显著性测验,样本相关系数r是否来自0的总体,还须对样本相关系数r 进行显著性检验。HO:=0,HA:0(为总体相关系数)可采用t测验法与F测验法对相关系数r进行测验。这里只

10、介绍常用的t 检验法。,t 测验的计算公式为:F 检验的计算公式为:,Sr相关系数标准误,此外,还可以直接采用查表法对相关系数r进行显著性检验。先根据自由度n-2查临界r值(附表8),得r0.05、r0.01。若|r|r0.05,P0.05,则相关系数r不显著;若r0.05|r|r0.01,0.01P0.05,则相关系数r显著,标记“*”;若|r|r0.01,P0.01,则相关系数r极显著,标记“*”。,X(个)120 121 123 126 128Y(尺)21 23 22 25 24,椰子树的产果树与树高之间无直线相关关系。,当样本太小时,即使r值达到0.7996,样本也可能来自总体相关系数

11、=0的总体。,不能直观地由r值判断两变数间的相关密切程度。,试验或抽样时,所取的样本容量n大一些,由此计算出来的r值才能参考价值。,椰子的产量X(个),椰子树高Y(尺),四、相关与回归的关系,r2=byx bxy r和b都是用一定的数值来表明两个变量之间的关系,二者变异的性质和方向完全一致;,r只能根据数值的大小的绝对值来判断两个变量间的相关程度;b则能根据自变量的变化去推算依变量的变化规律。相关系数和回归系数(方程)的显著性测验是等价的。即相关系数显著,回归系数亦显著;相关系数不显著,回归系数也必然不显著。,注意:在实际进行直线回归分析时,可用相关系数显著性测验代替直线回归关系显著性测验。,

12、计算相关系数r,对r检验(查表法),r不显著,则不建立直线回归方程,若r显著,计算回归系数b、回归截距a,建立直线回归方程,五、应用直线回归与相关的注意事项,回归分析和相关分析毕竟是处理变量间关系的数学方法,在应用时要考虑到客观实际情况。要考虑到回归系数、相关系数等这些统计数的适用范围。必须严格控制被研究的两个变量以外的各个变量的变动范围,使之尽可能为固定的常量。,为了提高回归和相关分析的准确性,两个样本的容量一般不应小于5,且使x 变量的取值范围尽可能地大一些。正确理解“相关不显著”和“回归不显著”一个显著的回归并不一定具有实践上的预测意义。,小 结,1、掌握直线相关分析、直线回归分析、回归系数、相关系数、决定系数的概念;2、掌握直线相关分析、直线回归分析的方法与步骤;3、了解直线相关分析和直线回归分析的关系及其注意事项。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号