《数据、模型和决策学习指导.doc》由会员分享,可在线阅读,更多相关《数据、模型和决策学习指导.doc(57页珍藏版)》请在三一办公上搜索。
1、 同济大学经济与管理学院MBA数据、模型与决策学习指导 数据、模型与决策同济大学经济与管理学院内容第1章统计数据的获取第2章数据的整理和描述第3章概率与决策论第4章参数估计与假设检验第5章方差分析第6章相关与回归分析第7章时间序列与预测第8章线性规划 课程介绍本课程是MBA专业的一门核心课程,内容主要包括统计学和运筹学两部分。本课程教学采用问题引导型的基本教学方法,在讲清基本原理的基础上强调案例教学和计算机软件的应用这两个教学环节。统计学主要讲授数据收集方法和数据处理方法,包括抽样方法、样本分布、参数估计、置信区间、假设检验、方差分析和回归分析。运筹学主要讲述线性规划内容,包括线性规划模型的建
2、立、求解模型的软件使用。 本课程的教学目标是使学员了解和掌握数据、模型和决策的基本原理、基本方法及其在管理决策中的广泛应用和计算机数量分析软件的应用分析能力,以适应经济全球化所造成的高度不确定性的企业外部环境和信息技术飞速发展的需要,提高学员的科学分析能力、风险和优化的决策能力和创新能力,在未来成为一名合格的管理人才。掌握本课程的知识与软件运用技能,不仅对完成毕业论文将会有极大帮助,而且也将极大提高科研能力,有利于学术水平的提高和今后的职业发展了解统计学和线性规划的基本原理和基本方法,熟练掌握使用计算机软件求解各种定量分析问题的技术,并能运用所学知识分析和解决企业的实际问题。除认真听课以外,学
3、员在开课前应认真预习、博览课程实施大纲中所指定的教材及参考文献内容,完成分组讨论报告;课后按时完成作业和上机实验内容,认真准备分组讨论案例,积极参加案例讨论交流。教师背景教学安排章内容学时1统计数据的获取42数据的整理和描述43概率与决策论64参数估计与假设检验85方差分析66相关与回归分析87时间序列与预测48线性规划 10数据、模型和决策支持材料教材: (1)孙昌言,陈伟忠.工商管理中的定量分析方法.同济大学出版社 2003年(2)安德森等著 商务与经济统计 英文版.原书第9版 机械工业出版社2010参考书:(1)Douglas A.Lind, etc: Statistical Techn
4、iques in Business and Business and Economics,中信出版社 (2)Jon Curwin,Roger Slater:商务决策的数量方法QUANTITATIVE METHODS FOR BUSINESS DECISIONS),(第四版),东北财经大学出版社 1998年(3)戴维 M.莱文 (David M.levine)等著,张建同等译著: 以 Excel 为决策工具的商务统计(第5版)机械工业出版社 2009年5月(4)戴维M莱文(David M.Levine) 蒂莫西C克雷比尔(Timothy C.Krehbiel)商务统计学:(英文版第5版) 中国人
5、民大学出版社 2010年6月(5)詹姆斯.R.埃文斯等,杜本峰译著 数据模型与决策(附光盘第2版),中国人民大学出版社 2008年 Website: 案例列表:1. 新型洗衣机产品投资生产决策案例2. PCB制造公司3. 加拿大矾世通公司:”如果不下雪就不用付费”4. 道格拉斯公司5. 联合航空公司的往返班机6. 质量控制应用案例7. Alfonso百货公司8. 多米利恩钢铁厂的燃料管理9. 新英格兰饲料供应公司10. 某金属罐制造厂生产方案的优化11.The descriptive analysis of profitability for SSE50 constituents ;12.Qu
6、ality Associates, Inc.13.COMPENSATION FOR ID PROFESSIONALS 14.FORECASTING FOOD AND BEVERAGE SALES15.Chateau Macquin STGeorges Winery (CMS)16. Red Brand Canners第1章: 统计数据的获取 (4学时)学习目标本章将帮助你学习:n 统计学在商业中如何应用n 商业中数据的收集n 问卷和问卷设计n 商业中运用的变量类型1.1 统计学概述人类活动的各个方面都离不开统计工作和统计数据。在个人生活中,人们的任何决策都依赖于有关的统计信息。无论是报考学校、
7、选择工作单位、购买房屋、进行股票交易、外出旅游,还是购买日常生活用品、生活开支预算等,都离不开有关的统计信息。尽管个人生活中的许多统计信息是以非常简单粗糙的形式出现的,但正是在对过去发生的事情或经验所获得的信息进行综合的基础上,人们才能作出正确的判断和决策。在政府的层次上,统计更是渗透于每一个部门的管理工作之中。政府部门通过不断收集经济、社会、人口等各个领域的统计数据,在综合分析的基础上对国民经济的发展进行预测、规划、指导和调控,并对全社会提供各种统计信息。在科学和学术研究的各个领域,包括自然科学、经济学、社会学、体育、医疗卫生、环境保护等领域,都广泛使用统计学方法进行分析和推断。在商务活动中
8、,统计学有更多的应用,经营管理人员在作决策时需要应用统计方法来归纳分析各种可以获得的统计资料。商务活动中经常使用统计方法的有以下几个方面。1. 财务分析企业的财务报告和各种财务分析指标都是对企业的财务状况和经营成果的统计分析结果;管理会计各种方法的应用需要以成本和收益为基础的经营业绩的统计分析;企业的投资和融资决策更离不开各种内外部统计信息的支持。2. 产品开发企业产品开发计划的制定,需要对经济发展趋势、商业竞争、顾客需求、财务收支估算等方面的数据进行统计分析,并在此基础上进行产品开发的经济可行性分析。3. 计划企业各种计划的制定,都需要对销售、资金、人力资源需求、成本和利润等因素进行预测,而
9、预测就是以过去和当前的统计数据为依据,运用统计推断方法对未来情况进行的估计。4. 市场研究在市场研究中,需要对消费者的需求偏好及其变化趋势,竞争对手的情况,本企业产品和服务的顾客满意度等方面的数据进行统计分析。5. 工序管理和质量控制运用统计分析方法,可以帮助确定影响产品质量的主要因素,制定有效的质量控制标准和工艺规范,达到降低成本、提高生产效率的目标。质量控制和质量管理是企业经营管理中运用统计分析方法最多的领域。6. 人力资源管理在企业的人力资源管理中,需要经常使用统计方法来分析人事变动、出勤状况、工作业绩等情况,并在此基础上进行业绩评定、奖励和惩罚、制定有效的激励约束机制等。1.2 数据的
10、收集统计数据的收集是统计整理和分析,以及统计推断和预测的基础。统计数据的收集就是根据统计研究的目的和要求,有组织、有计划地向调查对象搜集原始资料的过程。确定数据最合适的来源和收集数据的合理方法是非常重要的任务,因为如果收集的数据有偏差,模糊不清或有其他类型的错误时,即使最复杂的统计方法也无法得到有用的信息,即需要避免“Garbage In Garbage Out(垃圾数据产生垃圾统计结果)”的统计应用情况。在实际应用中,我们要依据特定的研究目的或工作任务,结合研究对象所具有的性质和特点,相应地选择适合的调查方法,必要时也可以是几种调查方法结合使用。这里,我们介绍几种通常采用的调查方法,包括:普
11、遍调查、重点调查、典型调查、抽样调查和网上调查。 普遍调查普遍调查简称普查,是专门组织的一次性的全面调查。如全国的人口普查、能源普查、工业普查等。普查的组织方式一般有两种:一种是建立专门的普查机构,配备大量的普查人员;另一种是利用调查单位的原始记录和核算资料,发放调查表,由登记单位填报,如物资库存普查等。普查时必须注意以下几个原则。(1) 规定统一的标准时点。标准时点是指对被调查对象登记时所依据的统一时点。(2) 规定统一的普查期限。在普查范围内各调查单位或调查点尽可能同时进行登记。(3) 规定普查的项目和指标。普查时必须按照统一规定的项目和指标进行登记,不准任意改变或增减,以免影响汇总和综合
12、,降低资料质量。 重点调查重点调查是专门组织的一种非全面调查,它是在总体中选择个别的或部分重点单位进行调查,籍以了解总体的基本情况。这些单位虽然少,但它们调查的标志值在总体标志总量中占有绝大比重,通过对这些单位的调查,就能掌握总体的基本情况。例如,要了解全国钢铁企业的生产情况,只要调查宝钢、鞍钢、马钢、包钢、首钢等大型钢铁公司,就能达到调查的目的。因为这些钢铁企业虽在全国只占少数,但它们的产量在全国钢产量中占有绝大部分的比重。因此当调查的目的只要掌握调查对象的基本情况,而在总体中却有部分单位能较集中地反映所研究的问题时,采用重点调查是比较合适的。重点调查的特点:(1) 重点调查适用于调查对象的
13、标志值比较集中于某些单位的场合,这些单位的管理比较健全,统计力量比较充实,能够及时取得准确资料。(2) 重点调查的目的在于了解总体现象某些方面的基本情况,而不要求全面准确地推算总体数字。(3) 重点调查比实际调查的单位数目少,在满足调查目的所要求的前提下,可以比全面调查节省人力、物力和时间。典型调查典型调查是根据调查的目的,选择在同类对象中最具典型性的部分和个体进行调查。典型调查也是一种非全面调查。例如,选择第一汽车制造厂作为国有企业改革情况调查分析的样板。典型调查的作用如下: 典型调查可用来研究新生事物。 典型调查可用来研究事物变化的规律。 典型调查可用来分析事物的不同类型,研究它们之间的差
14、别和相互关系。 典型调查的资料可用来补充和验证全面统计的数字,推论和测算有关现象的总体。 抽样调查抽样调查是一种专门组织的非全面调查,它按照随机原则,从总体中抽取部分单位进行观察,把观察的结果,用来推算全部总体的某些数值,即以部分推断全体。抽样调查是现代推断统计的核心,因为无论是对总体的参数估计或假设检验,都是以测定样本得到样本指标 统计量为依据的。1.3 问卷设计统计调查采用问卷的形式比较普遍,如网上调查、抽样调查、重点调查和典型调查等。问卷是一种特殊形式的调查表。其特点是表中用一系列按照严密逻辑结构组成的问题,向被调查者调查具体事实和个人对某问题的反映、看法,它不要求被调查者填写姓名。问卷
15、设计一般要遵循以下原则。 合理性合理性指的是问卷必须紧密与调查主题相关。违背了这样一点,再漂亮或精美的问卷都是无益的。而所谓问卷体现调查主题其实质是在问卷设计之初要找出与“调查主题相关的要素”。 一般性一般性,即问题的设置是否具有普遍意义。 应该说,这是问卷设计的一个基本要求,但我们仍然能够在问卷中发现这类带有一定常识性的错误。这一错误不仅不利于调查成果的整理分折,而且会使调查委托方轻视调查者的水平。 逻辑性问卷的设计要有整体感,这种整体感即是问题与问题之间要具有逻辑性,独立的问题本身也不能出现逻辑上的谬误。从而使问卷成为一个相对完善的小系统。 明确性所谓明确性,事实上是问题设置的规范性。这一
16、原则具体是指:命题是否准确?提问是否清晰明确,便于回答;被访问者是否能够对问题作出明确的回答,等等。 非诱导性不成功的记者经常会在采访中使用诱导性的问题。这种提问方式如果不是刻意地要得出某种结论而甘愿放弃客观性的原则,就是彻头彻尾的职业素质的缺乏。在问卷调查中,因为有充分的时间作提前准备,这种错误大大地减少了。但这一原则之所以成为必要,是在于高度竞争的市场对调查业的发展提出了更高的要求。 便于整理、分析成功的问卷设计除了考虑到紧密结合调查主题与方便信息收集外,还要考虑到调查结果的容易得出和调查结果的说服力。这就需要考虑到问卷在调查后的整理与分析工作。首先,这要求调查指标是能够累加和便于累加的;
17、其次,指标的累计与相对数的计算是有意义的;再次,能够通过数据清楚明了地说明所要调查的问题。 只有这样,调查工作才能收到预期的效果。1.4 变量类型统计学中将变量分为分类变量或数值变量。图1.1显示了变量之间的关系,并举例说明了每种变量。数据类型问题类型答案分类你现在购买股票或债券吗?是 否数值 离散型你订阅多少杂志? 数字 连续型你有多高? 厘米图1.1 变量类型分类变量(也称为定性变量)的值只能按类别分开,例如图1.3中的“是”和“否”。分类变量也可以有多个答案。例如,顾客写出他们在周几购买了商品,可能是周一到周日中的一天或几天。数值变量(也称为定量变量)的值表示数量。数值变量可进一步分为离
18、散变量和连续变量。自测题1. 样本和总体的区别是什么?2. 统计量和参数的区别是什么?3. 什么是普查,其特点和作用如何?4. 什么是重点调查、典型调查和抽样调查?它们各自有哪些特点和作用。5. 一家大型百货连锁商店的市场研究主管想要在某大城市进行一项调查,以确定某个月内上班女性在购买衣服上所用时间。(1)描述总体和样本,并指出主管可能想要收集的变量类型。(2)草拟(1)中所需的问卷,写出你认为适合这项调查的三个分类变量和三个数值变量问题。第2章: 数据的整理和描述 (4学时)学习目标在这一章中,你要学习:n 为分类数据制作图表n 为数值数据制作图表n 折线图制作原则n 数值变量的集中趋势,变
19、异与形状的度量方法2.1 分类数据的图表当数据是分类数据时,对每一分类数据制作频率或百分比表格和图表。汇总表 汇总表列出了一系列分类数据的频率、总数或百分比,可以看出不同类数据间的区别。汇总表在一列内列出不同数据的分类,其他列列出相应的频率、总数或百分比。表2.1是由最近一项调查人们如果有1,000美元会做什么(“If you had an extra $1,000 to spend, what would you do with the money?” USA Today, January 11, 2006, p. A1)的问卷得出的汇总表。如表2.1所示,最通常的选择是储蓄及还债,接着是购
20、买奢侈品、旅游或礼物,必需品。极少有人会捐款或其他。表2.1 1000美元用途的汇总表用钱做什么百分比(%)购买奢侈品、旅游、或礼物20向慈善机构捐款2还贷24储蓄31购买必需品16其它7条形图在条形图中,每个条代表一个分类,其长度表示该分类的总数、频率或百分比。图2.1是对应表2.1中1,000美元花费情况的条形图。条形图能在不同类别数据间进行百分比的比较。在图2.1中可以清楚地看出1000美元的花销意愿。图 2.1 1,000美元用途的条形图圆饼图圆饼图是一个圆分割成几部分,表示不同类别的数据。饼图每部分的大小因其分类数据的百分比不同而不同。在表2.1中,例如,31%的答卷人表示他们将1,
21、000美元用于储蓄。在制作饼图时,将组成一个圆的360度乘以0.31,得出的111.6度就是这一类别所占的角度。如图2.2所示,圆饼图呈现了整个饼的每部分,即每个分类数据。在这个图中,储蓄占图的31%,捐款仅占2%。图 2.2 1000美元用途的圆饼图帕累托图在帕累托图中,不同类别的数据根据其频率降序排列的,并在同一张图中画出累积百分比图。帕累托图可以体现帕累托原则:数据的绝大部分存在于很少类别中,极少剩下的数据分散在大部分类别中。这两组经常被称为“至关重要的极少数”和“微不足道的大多数”。帕累托图能区分“微不足道的大多数”和“至关重要的极少数”,从而方便人们关注于重要的类别。帕累托图是进行优
22、化和改进的有效工具,尤其应用在质量检测方面。2.2 数值数据的图表当数据量很大时,排序和茎叶图都很难得出结论。此时需要使用图表。有很多类型的图表可以用来精确描述数值数据。包括频数分布表,折线图,面积图,柱形图和条形图,直方图,频数多边形,圆饼图,散点图、时间序列和曲线图以及对数图等等。频数分布表实际应用中的统计表格有许多种类型,其中在整理原始数据时应用得最为广泛的是频数分布表。频率分布表本质上是一种汇总表,在其中,数据被分成有序组。数值数据统计图确定频数分布只是整理数据的第一步。通常还可以用统计图形来反映统计资料。统计图可以形象、直观、生动、简洁地反映数据的特征。在Microsoft Exce
23、l中使用【插入图表】工具按钮可以方便地绘制出各种类型的统计图。2.3 度量中心趋势的指标常用的这类指标有以下5种:算术平均数、中位数、众数、四分位数、几何平均数,并介绍五数汇总和箱线图。算术平均数、中位数和众数间的关系当频数分布呈完全对称分布时,算术平均数、中位数和众数三者相同,如图3.2所示。图3.2 对称分布当频数分布为右偏态时,众数小于中位数,算术平均数大于中位数,如图3.3所示。图3.3 右偏分布当频数分布为左偏态时,众数大于中位数,算术平均数小于中位数,如图3.4所示。图3.4 左偏分布2.4 度量离散程度的指标要分析总体的分布规律,仅了解中心趋势指标是不够的,还需要了解数据的离散程
24、度或差异状况。几个总体可以有相同的均值,但取值情况却可以相差很大,如图3.8所示。图3.8 均值相同但离散程度不同变异指标就是用来表示数据离散程度特征的指标。变异指标主要有:极差、四分位数极差、平均差、标准差和变异系数。2.5 度量偏斜程度的指标总体分布的特征不仅与均值和离散程度有关,而且与数据分布的偏斜程度有关,如对称分布、右偏分布和左偏分布。这种分布形态上的数量特征,往往具有重要的社会经济意义。偏度系数是度量偏斜程度的指标,主要有以下两种计算方法。用标准差为单位计量的偏度系数该偏度系数记为SK,计算公式为(3.3.1)SK是无量纲的量,取值通常在-3+3之间,其绝对值越大,表明偏斜程度越大
25、。当分布呈右偏态时,SK0,故也称正偏态;当分布为左偏态时,SK0,称事件A已发生的条件下事件B发生的概率为B对A的条件概率,记为P(B|A)。 全概率公式有时为了计算复杂事件的概率,常将它们分解为若干互斥的简单事件之和,再利用概率的可加性求出该事件的概率。设为样本空间S的一个完备事件组,即满足条件(1) (2) (3) 则对任一事件B都有贝叶斯公式若为样本空间S的一个完备事件组,则对任一事件B(P(B)0),有,i=1,2,n由概率的乘法公式和全概率公式,很容易推导出贝叶斯公式:P(Ai|B)= =3.3 随机变量 随机变量在前两节中我们讨论了随机事件及其概率,这仅是对随机现象的局部性有所认
26、识。为了全面深刻地研究随机现象的统计规律性,就需要引进随机变量的概念。通常随机现象都可以用数量来描述,如抽检一批产品时所抽到的次品数;某种产品的月销售额;某种产品的使用寿命等。有些事件本身虽然不具备数量标识,但总可以用适当方法对其进行数量描述。如在抛硬币试验中,可用1代表出现硬币正面,0代表出现硬币反面;同样在产品检验中,可用1代表合格品,0代表次品等。因此我们总可以建立事件与数量间的对应关系。将随机事件定量化后,就能更深入更方便地研究随机现象的本质。为此我们引入随机变量的概念。设试验E的样本空间为S=e,若对每一个eS,都有惟一的实数X(e)和它对应,则称变量X(e)为随机变量,简记为X。对
27、于随机变量,在试验前只知道它的可能取值范围,但不能确定它将取何值。与随机事件的概率相对应,随机变量的取值或取某一范围内的值也有一定概率,这就是随机变量与普通变量之间的本质区别。随机变量可以分为两大类:一类是其取值可以一一列举出来的,称为离散型随机变量,它们可以仅取有限个值,也可以取无限可列个值;另一类是非离散型随机变量,它们的取值无法一一列举出来。在非离散型随机变量中,最重要的是连续型随机变量,其取值范围是某一实数域。本书仅讨论离散型和连续型随机变量。上面第一个例子中的X是连续型随机变量,而第二个例子中的X是离散型随机变量。3.4 中心极限定理在本节中我们曾指出,正态分布是概率论中最重要的一种
28、分布,大量的自然、经济和社会现象都服从或近似服从正态分布,中心极限定理就说明了其中的原因。下面是用描述性的语言给出的中心极限定理。设随机变量Xi(i=1,2,n)相互独立,且都存在数学期望和方差,即E(Xi)=i,D(Xi)=,i=1,2,n若每个Xi对总和的影响都不大,则随机变量就近似服从分布;或者说,经标准化后的该随机变量就近似服从N(0, 1) 分布。自测题1. 在一批产品中连续抽取3个产品进行检验,记Ai=第i个抽到的是次品,i=1, 2, 3,试用Ai间的关系表示以下事件:(1) 至少有一个正品; (2) 全部是正品; (3) 恰有一个次品;(4) 不多于2个次品; (5) 不多于2
29、个正品; (6) 不多于1个次品。2. 一批产品有200件,其中有6件次品,从中任取3件,求(1) 恰有1件次品的概率;(2) 全是正品的概率;(3) 至少有2件正品的概率。3. 利用Excel的统计函数制作任意参数的超几何分布表。4. 某厂生产产品的次品率是2%,每50件产品为1箱出厂。用户对该厂产品采用如下抽样检验方法:从一箱中任取10件进行检验,如果发现其中有次品,则判定该箱产品为不合格品并作退货处理。问该厂产品遭退货的概率是多少?5. 某地区的人口寿命统计资料表明,该地区人口死亡年龄不超过50岁的占10%,死亡年龄不超过70岁的占75%,问该地区现为50岁的人能活到70岁的概率是多少?
30、6. 某石油公司考虑在某地钻井,结果可能出现三种情况:无油、少量出油和大量出油,根据以往对类似地质情况的统计资料表明,以上三种情况出现的可能性分别为0.5、0.3、0.2。钻井费用为700万元,如果少量出油,可收入1200万元;如果大量出油,可收入3000万元。该公司为减少可能的损失,可在决定是否钻井前先委托地震勘探公司进行地震勘探,以进一步了解该地区的地质构造情况。地震勘探的结果可能是“构造较差”、“构造一般”、“构造良好”。根据以往的统计资料,在地质构造与油井出油的关系(条件概率)如表4.3所示。表4.3 地质构造与油井出油的关系项 目无 油少 量 出 油大 量 出 油构造较差0.60.3
31、0.1构造一般0.30.40.4构造良好0.10.30.5(1) 求该石油公司的最优决策(是否应进行地震勘探?若进行地震勘探,如何根据勘探结果作出决策?)及最优期望收益;(2) 求地震勘探所提供信息的价值。 第4章 参数估计与假设检验 (8学时)在本章你将学习到:n 均值、比例和方差的置信区间估计n 均值和比例置信区间估计中的样本容量确定n 单个总体的假设检验n 两个总体的假设检验4.1 置信区间估计统计推断是一个运用样本结果来推断总体样本特性的过程。统计推断使你能估计总体样本中未知的特征值,比如总体均值和总体比例。有两种对总体样本参数估计的类型:点估计和区间估计。点估计是对一个总体参数的单值
32、估计。置信区间估计是数据的范围,叫做区间,覆盖在点估计的周围。置信区间是构造一个区间,而总体的参数落在该区间内的概率已知。假设你要对你们学校所有学生的GPA做估计。所有学生的平均GPA是一个未知总体的均值,记为。你选出了学生样本,得出的样本均值为2.80。样本均值记作,就是对总体样本均值的点估计。那么2.80的正确率是多少?为了解决这问题,你就要做置信区间的估计。在本节中,你将学习到如何来估计置信区间。样本均值,是对总体均值的点估计。但是在从总体抽取的样本中,样本均值是改变的,因为样本均值取决于从总体中所抽取出来的个体。要考虑不同样本的变化情况,可以对总体均值运用区间估计来分析。构造置信区间时
33、,要确定所估计参数落在区间内的置信度。换句话说,就是所估计的参数落在置信区间内的概率。假设经过本节的学习,你求出了在95%的置信度下对你所在的大学GPA均值的置信区间是(2.752.85)。这一区间估计表明你所在的大学GPA均值从2.75到2.85之间的概率为95。有5的概率GPA均值小于2.75或大于2.85。在学习均值置信区间之后,你将学习如何对总体比例做区间估计。接着你将学到为构造合适的置信区间估计如何选择样本容量,以及审计时如何使用一些重要估计的方法。4.2 单个总体的假设检验公司规定每袋的平均含量是368克。你的责任是当每袋的填装的量不等于368克时,调整操作流程。在不能对每袋包装量
34、进行称量的情况下,你如何能够合理的确定是否要去调整操作流程。你开始抽取和测量一个有25袋谷物的随机样本,在计算了样本均值之后,你该做什么呢?假设检验要求你给出一个明确的声明。在这个例子中,声明总体的均值等于368克。你需要判断样本的统计量是否支持对总体的声明,这个声明叫做原假设,或叫做互斥的备择假设(在这个例子中是总体均值不等于368克。)本节,你将会学到若干假设检验的应用方法。你将学到如何根据观察到的结果和样本统计量,与在假设本质上是正确的情况下你希望得到的一些结果之间的差异,来推断在总体参数的情况。对于Oxford Cereal案例,假设检验可以让你得出以下的推论结果: 谷物包装样本均值的
35、量与你期望得到的结果368克一致。 总体均值是不等于368克的,因为样本均值显著不等于368克。4.3 两个总体的假设检验在超市中产品的摆放方式是否会影响产品销售?作为BLK食品的地区销售经理,你要比较BLK可乐销售量,也就是当产品放置在其正常的货架位置时的销售量,与产品放在过道展示的销售量是否有差异.。为了验证过道展示的效果,你从BLK连锁超市选择20个各种商品基本相同的店面, 然后你随机安排20家店中的10家作为第1组,剩余的10家作为第 2组。10家店面的经理,把BLK可乐布置在正常货架上的位置。 另外10家店使用特殊过道推广展示。一周后,记录BLK可乐的销售额。你如何判断两种摆放位置的
36、BLK可乐的销量是否相同?你如何判断BLK可乐商店销售的变化是否由于展示方式的不同?你如何利用这些问题的答案去提高BLK可乐的销售?假设检验提供了一种数据分析的确定方法,你已经学习了单样本的各种情况的假设检验。本节,你将学到怎样拓展假设检验去解决双样本数据的比较问题,比如下面的问题:“用过道展示时每周BLK可乐的平均销量是否等于摆在货架上正常位置时每周BLK可乐的平均销量?” 自测题1. 某车床加工的缸套外径尺寸X N(m,s2),下面是随机测得的10个加工后的某种缸套外径尺寸(mm),分别用计算器和Excel软件求 90.01,90.01,90.02,90.03,89.99,89.98,89
37、.97,90.00,90.01,89.99(1) 求m和s2的无偏估计;(2) 求m的置信度为95%的置信区间;(3) 求m的置信度为95%的单侧置信下限;(4) 求s2的置信度为95%的置信区间;(5) 求s2的置信度为95%的单侧置信上限。2. 一份关于705名劳动者在工作中使用网络频率的调查。423名劳动者表示他们在工作中有限地使用,183个人说他们在工作中没有使用网络。(1)求劳动者工作中有限使用网络的比例的95置信度的区间估计;(2)求劳动者工作中没有使用网络的95置信度的区间估计。3. 对于给定的样本容量,如果从0.05变动0.01,会怎么变化?4. 对于:, 对于给定的样本量,为
38、什么当的实际值是90时的大于的实际值是70时的?5. 一台自动包装奶粉的包装机,其额定标准为每袋净重0.5kg,设该包装机所包装奶粉的重量服从正态分布。某天开工时,随机抽取了10袋产品,称得其净重为:0.497,0.506,0.509,0.508,0.497,0.510,0.506,0.495,0.502,0.507(1) 在水平a = 0.20下,检验该天包装机的重量设定是否正确?(2) 该包装机包装的精度指标为所包装重量的标准差为0.005,在水平a = 0.25下,检验该天包装机的包装精度是否符合要求?(3) 在本题的检验问题中,为什么要将a取得较大?7. 为提高某种金属材料的抗拉强度,
39、试验了新的热处理工艺。对新,旧工艺处理的各13批材料进行了抗拉强度试验,测得数据如下。新工艺:31,34,30,27,33,35,38,34,30,36,31,32,35原工艺:28,24,26,29,30,31,28,27,29,28,30,25,26设两总体服从同方差正态分布,在给定显著性水平a = 0.01下,分别用计算器和Excel求:(1) 新、旧工艺处理材料的平均抗拉强度间是否有显著差异?(2) 新工艺生产的材料抗拉强度是否比原工艺有显著提高?(3) 在水平a = 0.20下,关于两总体方差相等的假定是否成立?8. 设新车的首次故障行驶里程数服从正态分布,现测得甲、乙两种品牌轿车首次故障行驶里程的数据如下: 甲品牌:1200,1400,1580,1700,1900 乙品牌:1100,1300,1800,1800,2000,2400用Excel求:(1) 在a = 0.20下,检验两种轿车的首次故障行驶里程是否是同方差的;(2) 在a = 0.05下,检验乙品牌轿车的平均首次故障行驶里程是否显著高于甲品牌轿车。第5章: 方差分析 (6学时)学习目标n 方差分析的基本概念n 了解方差分析可以解决那些实际问题;n 了解应用方