EXCEL第10-2章数理统计及应用.ppt

上传人:小飞机 文档编号:6505484 上传时间:2023-11-07 格式:PPT 页数:43 大小:1.09MB
返回 下载 相关 举报
EXCEL第10-2章数理统计及应用.ppt_第1页
第1页 / 共43页
EXCEL第10-2章数理统计及应用.ppt_第2页
第2页 / 共43页
EXCEL第10-2章数理统计及应用.ppt_第3页
第3页 / 共43页
EXCEL第10-2章数理统计及应用.ppt_第4页
第4页 / 共43页
EXCEL第10-2章数理统计及应用.ppt_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《EXCEL第10-2章数理统计及应用.ppt》由会员分享,可在线阅读,更多相关《EXCEL第10-2章数理统计及应用.ppt(43页珍藏版)》请在三一办公上搜索。

1、许多实际问题往往需要对数据进行统计分析,建立合适的模型。Excel2007的统计函数和数据分析工具则为人们提供了一个强有力的统计分析工具。,第10章 数理统计及应用,数理统计的基本概念 描述性统计 假设检验 方差分析 回归分析,第10章 数理统计及应用,Excel 2007 能够支持范围广泛的统计计算任务,提供工程和科学统计的基本能力。其中包括:函数数据分析工具,第1节 数理统计的基本概念,描述性统计分析主要包括两类:数据集中趋势分析,表示数量的中心位置(平均数、中位数)数据的离散程度分析,表示数量的变异程度(极差、标准差)两者相互补充,共同反映数据的全貌。,第2节 描述性统计,总体均值的检验

2、:单个样本的假设检验(统计函数)大样本(Z 检验)、小样本(t 检验)成对观测值的假设检验(数据分析工具)t 检验(平均值的成对二样本分析 双样本等方差、双样本异方差)方差检验:F检验 Z 检验(方差已知),第3节 假设检验,1 方差分析的基本概念 方差分析(ANOVA)又称变异数分析或F检验,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。我们的主要内容包括单因素方差分析、双因素方差分析。,第4节 方差分析,下面我们用一个简单的例子来说明方差分析的基本思想:,第4节 方差分析,【例】某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘黄色

3、、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上收集了前一时期该饮料的销售情况,见下表。试分析饮料的颜色是否对销售量产生影响。,检验饮料的颜色对销售量是否有影响,也就是检验四种颜色饮料的平均销售量是否相同 设1为无色饮料的平均销售量,2粉色饮料的平均销售量,3为橘黄色饮料的平均销售量,4为绿色饮料的平均销售量,也就是检验下面的假设H0:1 2 3 4 H1:1,2,3,4 不全相等 检验上述假设所采用的方法就是方差分析,方差分析的应用条件(1)可比性,若资料中各组均数本身不具可比性则不适用方差分析。(2

4、)正态性,即偏态分布资料不适用方差分析。对偏态分布的资料应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析。(3)方差齐性,即若组间方差不齐则不适用方差分析。多个方差的齐性检验可用Bartlett法,它用卡方值作为检验统计量,结果判断需查阅卡方界值表。,第4节 方差分析,方差分析的步骤:提出假设 构造检验统计量 统计决策,第4节 方差分析,2 单因素方差分析 若只考虑一个因素对试验指标的影响,而且用方差进行分析,这种方法被称为单因素方差分析(analysis of variance)方差分析简称“ANOVA”,该方法的主要目的是通过试验数据

5、分析推断因素A对试验指标影响是否显著,即当因素A、不同水平时试验指标有无显著差异。,第4节 方差分析,2 单因素方差分析,第4节 方差分析,(Excel 基本结构),F的函数,当p 时,拒绝原假设H0,平方和,均方,因素影响,误差,显著性水平的临界值F,若FF,则拒绝原假设H0,否则接受原假设H0。,3 双因素方差分析 许多实际问题中,对试验指标的影响不仅仅只有一个因素,可能需要同时考虑几个因素对试验指标的影响。这种同时分析多个因素对试验指标的影响作用大小并且使用方差进行问题分析的方法称为多因素方差分析,特别是若只考虑两个因素被称为双因素方差分析,第4节 方差分析,双因素方差分析(无重复)(一

6、个例子),【例】有四个品牌的彩电在五个地区销售,为分析彩电的品牌(因素A)和销售地区(因素B)对销售量是否有影响,对每个品牌在各地区的销售量取得以下数据,见下表。试分析品牌和销售地区对彩电的销售量是否有显著影响?,双因素方差分析(无重复)(提出假设),对因素A提出的假设为H0:m1=m2=m3=m4(品牌对销售量没有影响)H1:mi(i=1,2,4)不全相等(品牌对销售量有影响)对因素B提出的假设为H0:m1=m2=m3=m4=m5(地区对销售量没有影响)H1:mj(j=1,2,5)不全相等(地区对销售量有影响),双因素方差分析(无重复),结论:FA18.10777F3.4903,拒绝原假设H

7、0,说明彩电的品牌对销售量有显著影响 FB2.100846 F3.2592,接受原假设H0,说明销售地区对彩电的销售量没有显著影响,双因素方差分析(有重复),【例】有一牧草栽培实验,因素A为品种,因素B为收获期,重复数为6,其产量(吨/公顷)如下表。试分析品种、收获期和交互作用产量是否有显著影响?,双因素方差分析(有重复)(提出假设),对因素A提出的假设为H0:m1=m2=m3(品种对产量没有影响)H1:mi(i=1,2,3)不全相等(品种对产量有影响)对因素B提出的假设为H0:m1=m2=m3=m4(收获期对产量没有影响)H1:mj(j=1,2,4)不全相等(收获期对产量有影响),双因素方差

8、分析(有重复)(提出假设),对因素A和因素B交互作用提出的假设为H0:ij=0,(i=1,2,3,j=1,2,4)(品种和收获期的交互作用对产量没有影响)H1:至少有一个 ij 0,(i=1,2,3,j=1,2,4)(品种和收获期的交互作用对产量有影响),双因素方差分析(有重复),23,第5节 回归与相关,回归分析的基本概念 使用Excel 2007 函数进行回归分析 使用数据分析工具进行回归分析,24,5.1 回归分析的基本概念,一、问题的提出,25,5.1 回归分析的基本概念,二、回归分析的基本概念 回归分析是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。回归分析按照涉及的

9、自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。,26,5.1 回归分析的基本概念,三、回归分析的主要内容 1、从一组数据出发确定某些变量之间的定量关系式,即建立数学模型并估计其中的未知参数。估计参数的常用方法是最小二乘法 2、对这些关系式的可信程度进行检验,27,5.1 回归分析的基本概念,三、回归分析的主要内容 3、利用所求的关系式对某一生产过程进行预测或控制 回归分析的应用是非常广泛的,使用Excel 2007进行回归分析十分方便(图表、函数、工具)。,28,5.2 使用函数进行回归分析,Excel提供了9个函数用于建

10、立 回归模型和回归分析,29,5.2 使用函数进行回归分析,30,5.2 使用函数进行回归分析,一元线性回归分析常用的函数:1、INTERCEPT功能:利用已知的x值与y值计算直线与y轴的截距语法:INTERCEPT(Y数据区域,X数据区域)2、SLOPE功能:返回线性回归模型的斜率语法:SLOPE(Y数据区域,X数据区域)3、RSQ 功能:返回线性回归模型的判定系数语法:RSQ(Y数据区域,X数据区域)4、FORECAST功能:根据线性回归模型返回一个预测值语法:FORECAST(预测点,Y数据区域,X数据区域),31,5.2 使用函数进行回归分析,例如:”家家有房”开发公司准备开发房产,但

11、是要想开发房产必须要拿到建筑许可证,经过调查研究发现:建筑许可证数量主要与该地区人口的密度有关,调查结果见表。试建立一个能反映许可证颁发数量与人口密度之间的关系的回归模型,并预测当人口密度为7000时许可证的颁发数量,32,5.3 使用工具进行回归分析,例如:”家家有房”开发公司经过调查研究发现:建筑许可证颁发数量既与该地区人口的密度有关,也与自由房屋的均值有着密切的关系,同时与平均家庭收入也有关系,现要求建立一个模型,用来预测建筑许可证的颁发数量,并给出当每平方英里的人口密度为7000,自由房屋的均值为300,平均家庭收入为800千元时,预测出建筑许可证的颁发数量是多少?,33,5.3 使用

12、工具进行回归分析,步骤1:单击“数据”选项卡,选择“分析”组中“数据分析”按钮,则打开“数据分析”对话框,选择“回归”,弹出“回归”对话框,34,5.3 使用工具进行回归分析,步骤2:单击“确定”按钮,弹出“回归”对话框,35,5.3 使用工具进行回归分析,步骤3:单击“确定”按钮,得回归分析结果,回归方程的显著性检验(步骤),2、计算检验统计量F,3、确定显著性水平,找出临界值F 4、作出决策:若FF,拒绝H0;若FF,接受H0,1、提出假设H0:12p=0 线性关系不显著H1:1,2,p至少有一个不等于0,回归系数的显著性检验(步骤),3、确定显著性水平,并进行决策 tt,拒绝H0;tt,

13、接受H0,1、提出假设H0:bi=0(自变量 xi 与 因变量 y 没有线性关系)H1:bi 0(自变量 xi 与 因变量 y有线性关系)2、计算检验的统计量 t,38,5.3 使用工具进行回归分析,Excel回归分析工具的输出结果包括3个部分:回归统计表 回归统计表包括以下几部分内容:Multiple R(复相关系数R):又称为相关系数,用来衡量变量x和y之间相关程度的大小R Square(复测定系数R2):用来说明自变量解释因变量变差的程度,以测定因变量y的拟合效果,39,5.3 使用工具进行回归分析,Excel回归分析工具的输出结果包括3个部分:回归统计表 回归统计表包括以下几部分内容:

14、Adjusted R Square(调整后的R2):仅用于多元回归才有意义,它用于衡量加入独立变量后模型的拟合程度。当有新的独立变量加入后,即使这一变量同因变量之间不相关,未经修正的R2也要增大,修正的R2仅用于比较含有同一个因变量的各种模型,用来说明自变量解释因变量变差的程度,以测定因变量y的拟合效果,40,5.3 使用工具进行回归分析,Excel回归分析工具的输出结果包括3个部分:回归统计表 回归统计表包括以下几部分内容:标准误差:用来衡量拟合程度的大小,也用于计算与回归相关的其他统计量,此值越小,说明拟合程度越好观测值:用于估计回归方程的数据的观测值个数,41,5.3 使用工具进行回归分析,Excel回归分析工具的输出结果包括3个部分:方差分析表 方差分析表的主要作用是通过F检验来判断回归模型的回归效果。回归分析行计算的是估计值同均值之差的各项指标;残差行是用于计算每个样本观察值与估计值之差的各项指标;“总计”行用于计算每个值同均值之差的各项指标,42,5.3 使用工具进行回归分析,Excel回归分析工具的输出结果包括3个部分:回归模型表,43,关于考试,考试时间:11月24日周日上午(初定,最后以通知为准):10:00 11:10考前辅导:11月19、20、22日 上午10:00 下午4:30 信电大楼572,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号