应用统计学课件.ppt

上传人:牧羊曲112 文档编号:1453171 上传时间:2022-11-26 格式:PPT 页数:44 大小:1.23MB
返回 下载 相关 举报
应用统计学课件.ppt_第1页
第1页 / 共44页
应用统计学课件.ppt_第2页
第2页 / 共44页
应用统计学课件.ppt_第3页
第3页 / 共44页
应用统计学课件.ppt_第4页
第4页 / 共44页
应用统计学课件.ppt_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《应用统计学课件.ppt》由会员分享,可在线阅读,更多相关《应用统计学课件.ppt(44页珍藏版)》请在三一办公上搜索。

1、2022-11-26,2022-11-26,统计思维总有一天会像读与写一样成为一个有效率公民的必备能力。 H. G. Wells,统计名言,2022-11-26,你相信下面的统计结果吗?,吸烟对健康是有害的不结婚的男性会早逝10年身材高的父亲,其子女的身高也较高第二个出生的子女没有第一个聪明,第三个出生的子女没有第二个聪明,依此类推两天服一片阿司匹林会减少心脏病第二次发作的机会身体超重30%会使寿命减少1300天每天摄取500毫升维生素C,生命可延长6年怕老婆的丈夫得心脏病的机会较大学生们在听了莫扎特钢琴曲10分钟后的推理测试会比他们听10分钟娱乐磁带或其他曲目做得更好上课坐在前面的学生平均考

2、试分数比坐在后面的学生高,第 1 章 统计能为你做些什么?,1.1 统计无处不在1.2 统计研究什么?1.3 统计能做什么和不能做什么?1.4 怎样获得数据?,Statistics,1.1 统计无处不在,2022-11-26,不同原因引起的寿命损失,2022-11-26,理解统计对大众的必要性,在外出旅游时,需要关心一段时间内的详细天气预报在投资股票时,需要了解股票市场价格的信息,了解某只特定股票的有关财务信息如果你关心足球世界杯,在有关媒体上,你可以看到详细的报道如果你关心宏观经济形式,在有关媒体上你可以得到有关报道,2022-11-26,理解统计对管理者更重要,一个统计办公室的主管也是一个

3、行政事务官,一次与一些统计学者开会,统计学者抱怨从其他部门收到的一些估计值没有给出标准误差(估计时的误差大小,表示估计的精度),这个主管马上问道:“对误差也有标准吗?”一个统计顾问提交给茶叶委员会的报告中,含有标题为“饮茶人数的估计值(含标准误差)”的附表。不久,一封信被送到这个统计学者手中,问道什么是人们喝红茶时的“标准误差”,2022-11-26,理解统计对管理者更重要,皇家委员会审查一份统计报告,报告中提到中产阶级家庭平均有2.2个子女,委员会评述说:“每一个成人女性有2.2个子女的数字是荒谬的。这是为要求对中产阶级提供财政援助以便通过四舍五入把平均值提高到一个更合适的整数健康大臣对一个

4、统计学者的报告中提到的去年由于某种疾病,平均1000中死亡人数为3.2这个数字发生了兴趣。他问他的私人秘书,3.2个人是如何死法?他的秘书说:“先生,当一个统计学家说死了3.2个人时,意味着3个人已经死了,两个人正要死”,2022-11-26,假定你是市场部的新任经理,一次广告活动的统计结果摆到了你面前,声称某个结果是“统计显著”的。你如何解释这份报告而又是暴露你对该术语的无知? 赶快学点统计,这对你和你的事业都非常有用。 Gudmund R. Iversen,避免尴尬,2022-11-26,让你说出哪些领域不使用统计,这很困难,因为几乎找不到一个不用统计的领域;让你说出哪些领域应用统计,同样

5、也很困难,因为几乎所有的领域都应用统计出一个统计没有用途的领域名称比举出一个统计作为其组成部分的领域名称要困难得多(Robert Johnson),几乎所有的领域都要用统计,2022-11-26,统计应用用统计识别作者,用统计识别作者:17871788年,三位作者Alexander Hamilton,John Jay和James Madison为了说服纽约人认可宪法,匿名发表了著名的85篇论文。这些论文中的大多数作者已经得到了识别,但是,其中的12篇论文的作者身份引起了争议通过对不同单词的频数进行统计分析,得出的结论是,James Madison最有可能是这12篇论文的作者。现在,对于这些存在

6、争议的论文,认为James Madison是原创作者的说法占主导地位,而且几乎可以肯定这种说法是正确,2022-11-26,统计应用质量管理中的6,统计在许多领域都有应用:在统计中,表示一个总体的标准差,它说的是数据之间的差异程度。比如,在企业生产的产品中,同一种产品也没有两个是完全一样的,因为在生产过程中,由于各种因素的影响而使产品质量产生波动。在服务领域就更是如此。产品或服务的这种差异称为质量的波动性,也正是由于波动性的存在才需要进行质量管理6是质量管理中使用的一个术语,它的含义是指偏离正态分布的中心6个标准差。就产品生产或服务而言,它表示在生产或服务过程中缺陷率不超过百万分之3.4,通俗

7、地说,如果生产100万个产品或进行100万次服务,产品的不合格率或服务达不到要求的比率平均来说不超过3.4个或3.4次。这样的不合格率非常低以致于可以忽略不计,2022-11-26,统计应用质量管理中的6,6质量管理已成为最新的质量管理理念,近年来,它已成为一些著名国际大企业的质量管理方法,并在这样的管理理念下使企业受益匪浅。例如,实行了6质量标准,使摩托罗拉公司在3年中节省的资金超过9.4亿美元。实行6管理的大公司还有美国通用电器公司(简称GE)、宝利来(Polaroid)h和德州仪器(Texas Instruments)等GE的前CEO杰克.韦尔奇1999年4月曾说过这样一段话:“6培训计

8、划是GE下一个世纪领导层得以产生繁衍的园地,6是我们曾经尝试过的最重要的管理培训方法,它胜过到哈佛工商学院就读,也胜过到克顿维尔(注:克顿维尔是GE公司内部的质量培训部)进修,它教会你一种完全与众不同的思维方式。”在推广6质量管理策略不到10年的时间内,通用电器公司总市值从世界排名第十位跃升到第二位,2022-11-26,统计应用用简单的描述量得到一个重要发现,费舍(RAFisher)在1952的一篇文章中举了一个例子,说明如何由基本的描述统计量的知识引出一个重要的发现20世纪早期,哥本哈根卡尔堡实验室的施密特(J.Schmidt)发现不同地区所捕获的同种鱼类的脊椎骨和鳃线的数量有很大不同;甚

9、至在同一海湾内不同地点所捕获的同种鱼类,也发现这样的倾向。然而,鳗鱼的脊椎骨的数量变化不大。施密特从欧洲各地、冰岛、亚速尔群岛以及尼罗河等几乎分离的海域里所捕获的鳗鱼的样本中,计算发现了几乎一样的均值和标准偏差值施密特推由此断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的。后来名为“戴纳(Dana)”的科学考察船在一次远征中发现了这个场所,2022-11-26,统计的应用领域,actuarial work (精算) agriculture (农业)animal science (动物学) anthropology (人类学)archaeology (考古学) auditing (审计学)c

10、rystallography (晶体学) demography (人口统计学)dentistry (牙医学) ecology (生态学)econometrics (经济计量学) education (教育学) election forecasting and projection (选举预测和策划)engineering (工程) epidemiology (流行病学)finance (金融)fisheries research (水产渔业研究)gambling (赌博) genetics (遗传学)geography (地理学) geology (地质学)historical researc

11、h (历史研究) human genetics (人类遗传学),2022-11-26,统计的应用领域,hydrology (水文学) industry (工业) linguistics (语言学) literature (文学)manpower planning (劳动力计划)management science (管理科学)marketing (市场营销学) medical diagnosis (医学诊断)meteorology (气象学) military science (军事科学)nuclear material safeguards (核材料安全管理)ophthalmology (眼

12、科学) pharmaceutics (制药学)physics (物理学) political science (政治学)psychology (心理学) psychophysics (心理物理学)quality control (质量控制) religious studies (宗教研究)sociology (社会学) survey sampling (调查抽样)taxonomy (分类学) weather modification (气象改善),1.2 统计研究什么?,2022-11-26,统计学是一门独立的科学吗?,物理学研究的是像热、光、电等这类自然现象的运动规律化学家测定物质的组成及化

13、学元素之间的交互作用生物学家研究植物和动物的生活数学家则在给出的假定之下推演各种命题这些学科中的每一门都有它自己的问题,而且有解决这些问题的各自的方法,各学科因此而成为一门单独的学科,2022-11-26,统计学有自己的研究对象吗?,统计学(statistics)没有任何固定的对象,是一门独特的学问统计学研究的是来自各领域的数据,由解决其他领域内的问题而存在并兴旺发达。按萨维奇(L.J.Savage)的说法:统计学基本上是寄生的。靠研究其他领域内的工作而生存。这不是对统计学的轻视,这是因为对很多寄主来说,如果没有寄生虫就会死。对有的动物来说,如果没有寄生虫就不能消化它们的食物。因此,人类奋斗的

14、很多领域,如果没有统计学,虽然不会死亡,但一定会变得很弱,2022-11-26,什么是统计学? (statistics), 统计学研究的是数据,提供的是一套通用于所有学科领域的获取数据、分析数据并从数据中得出结论的原则和方法,Statistics,2022-11-26,统计学是什么?,统计学是一门科学它提供一套方法和技术,使用者在给定的情况下必须根据所掌握的专门知识选择使用的方法,如果需要还要进行必要的修正统计方法是通用的数据分析方法。这些方法不是为某个特定的问题领域而构造的 统计学是一种技术如同工业生产过程中的质量控制程序一样,统计方法是为保证产品达到所希望的质量和保持其稳定性的的管理系统中

15、建立起来的统计方法也能用于控制、减少和考察不确定性统计学是一门艺术提供一种归纳推理的方法,推理就是一种艺术。既然是归纳推理,就不能保证结论百分之百正确,就不能没有争议怎样让别人看懂并理解统计结论,要看统计表达这些结论的技巧和艺术,2022-11-26,统计方法,统计方法,描述统计,推断统计,参数估计,假设检验,2022-11-26,0,25,50,¥,描述统计(descriptive statistics),研究数据收集、整理和描述的统计学分支 内容搜集数据整理数据展示数据描述性分析 目的描述数据特征找出数据的基本规律,2022-11-26,推断统计 (inferential statisti

16、cs),研究如何利用样本数据来推断总体特征的统计学分支内容参数估计假设检验目的对总体特征作出推断,1.3 统计能做什么和不能做什么?,2022-11-26,统计帮助你分析数据,大量数据如果不去分析它,那也仅仅是一堆数据而已,没有什么用处。因为有用的信息恰恰藏在数据的里面统计可以在多个方面帮助你分析数据利用统计简化繁杂的数据用图表重新展示数据,进行比较分析建立数据模型进行预测,2022-11-26,统计不能解决你的所有问题,统计仅仅是一种数据分析的方法,与数学一样统计是一种工具,是数据分析的工具统计结论需要你的专业知识去解释统计在自然科学和管理科学中的作用不同,管理人员所需要的,统计未必能提供,

17、Tools,2022-11-26,统计的误用与滥用,大约在一个世纪以前,政治家Benjamin Disraeli曾有一个著名的论断:“有三类谎言:谎言、糟透的谎言和统计” 。他还说:“图并没有说谎,是说谎者在画图”历史学家Andrew Lang说,一些人使用统计“就像喝醉酒的人使用街灯柱支撑的功能多于照明”统计滥用不好的样本过小的样本误导性图表局部描述故意曲解,False,2022-11-26,统计应用的两个极端,不懂或不太懂统计的人认为统计没什么用,他们因为不懂统计而瞧不起统计,他们不用或几乎不用统计方法分析数据,即使做些统计分析,也往往是表面上的 把简单问题复杂化,特别是在管理领域把本来可

18、以用简单方法解决的问题故意复杂化为证明管理的科学性,建立一个别人看不懂的模型,编一大堆程序,输出了一大堆数字和符号得出用统计语言陈述的结论,提出一些似是而非的建议,1.4 怎样获得统计数据?,2022-11-26,变量与数据(variable & data),从一次观察到下一次观察会出现不同结果 “企业销售额”、“上涨股票的家数”、“生活费支出”、“投掷一枚骰子出现的点数” 观察变量得到的结果即数据变量可以分为数值变量(metric variable) :可以用阿拉伯数据来记录其观察结果分类变量(categorical variable) :观察结果表现为不同的类别顺序变量(rank vari

19、able):有序类别,2022-11-26,你不必吃完整头牛,才知道它的肉是咬不动的。(You dont have to eat the whole ox to know that it is tough.) Samel Johnson,2022-11-26,怎样获得一个样本?(概率抽样方法),简单随机抽样(simple random sampling)从含有个元素的总体中,抽取个元素组成样本,使得总体中的每一个元素都有相同的机会(概率)被抽中如果抽取一个个体记录下数据后,再把这个个体放回到原来的总体中参加下一次抽选,叫做重复抽样(sampling with replacement如果抽中的个

20、体不再放回,再从所剩下的个体中抽取第二个元素,直到抽取个个体为止,这样的抽样方法叫做不重复抽样(sampling without replacement)简单随机抽样得到的样本称为简单随机样本(simple random sample),2022-11-26,怎样获得一个样本?(概率抽样方法),分层抽样(stratified sampling)在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本系统抽样(systematic sampling) 先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个元素,直至抽取个元素组成一

21、个样本整群抽样(cluster sampling)先将总体划分成若干群,然后在以群作为抽样单位从中抽取部分群,再对抽中的各个群中所包含的所有元素进行观察,2022-11-26,简单随机抽样(用Excel对分类数据随机抽样),【例】某班级共有30名学生,他们的名单如右表。用Excel抽出一个由5个学生构成的随机样本,2022-11-26,简单随机抽样(用Excel产生一个简单随机样本),第1步:将30个学生的名单录入到Excel工作表中的一列第2步:给每个学生一个数字代码,分别为1,2,30 ,并按顺序排列,将代码录入到Excel工作表中 的一列,与学生名单相对应(数值型数据直接抽取)第3步:选

22、择【工具】下拉菜单,并选择【数据分析】选项 ,然后在【数据分析】选项中选择【抽样】第4步:在【抽样】对话框中的【输入区域】中输入学生代码 区域,在【抽样方法】中单击【随机】 。在【样本 数】中输入需要抽样的学生个数。在【输出区域】中 选择抽样结果放置的区域。【确定】后即得到要抽取 的样本, 用Excel对分类数据抽样,2022-11-26,简单随机抽样(用Excel生成随机数),生成位于两个指定数之间的一个随机数(RANDBETWEEN函数) 第1步:在Excel表格界面中,直接点击【f(x)】命令 第2步:在复选框“函数分类”中点击【全部】选项,并在“函数 名”中点击【RANDBETWEEN

23、】选项,然后【确定】 第3步:在【Bottom】输入要返回的最小整数(本例为100) 在【Top】输入要返回的最大整数(本例为1) 单击【确定】即可得到一个随机数(要得到多个随机数 向下复制即可), 用Excel生成1100之间的20个随机数,2022-11-26,简单随机抽样(用Excel生成随机数),生成位于01之间的均匀分布随机数 (RAND函数)第1步:在Excel表格界面中,直接点击【f(x)】命令 第2步:在“函数分类”中点击【全部】选项,并在“函数名”中点击 【RAND】选项,然后【确定】,单击【确定】即可得到一 个随机数(要得到多个随机数向下复制即可)若要生成 a 与 b 之间

24、的随机实数,请使用 RAND()*(b-a)+a若要对结果四舍五入为整数,请使用ROUND(RAND()*(b-a)+a,0)如果要使用函数 RAND 生成一随机数,并且使之不随单元格计算而改变,可以在编辑栏中输入“=RAND()”,保持编辑状态,然后按 F9,将公式永久性地改为随机数, 用Excel生成1100之间的20个随机数,2022-11-26,几个统计概念,总体(population)所研究的全部个体(数据) 的集合,其中的每一个个体也称为元素分为有限总体和无限总体有限总体的范围能够明确确定,且元素的数目是有限的无限总体所包括的元素是无限的,不可数的样本 (sample)从总体中抽取

25、的一部分元素的集合构成样本的元素的数目称为样本容量或样本量 (sample size),2022-11-26,几个统计概念,参数(parameter)描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值所关心的参数主要有总体均值()、标准差()、总体比例()等总体参数通常用希腊字母表示 统计量(statistic)用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等样本统计量通常用小写英文字母来表示,2022-11-26,几种常用的统计软件(Software),典型的统计软件SASSPSSMINITABSTATISTICAExcel,2022-11-26,本章小节,正确认识统计统计研究数据,提供通用方法统计为你所用,但不能滥用抽取样本获得数据几个基本概念,结 束,THANKS,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号