统计和统计数据.ppt

上传人:牧羊曲112 文档编号:6015712 上传时间:2023-09-14 格式:PPT 页数:46 大小:242KB
返回 下载 相关 举报
统计和统计数据.ppt_第1页
第1页 / 共46页
统计和统计数据.ppt_第2页
第2页 / 共46页
统计和统计数据.ppt_第3页
第3页 / 共46页
统计和统计数据.ppt_第4页
第4页 / 共46页
统计和统计数据.ppt_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《统计和统计数据.ppt》由会员分享,可在线阅读,更多相关《统计和统计数据.ppt(46页珍藏版)》请在三一办公上搜索。

1、,统 计 学(第三版),统计思维总有一天会像读与写一样成为一个有效率公民的必备能力。H.G.Wells,统计名言,理解统计对每个人都是必要的,统计在许多领域都有应用。在日常生活中,我们也常会接触到各种统计数据,比如,媒体报道中使用的一些数据、图表等。下面就是统计研究得到的一些结论:吸烟对健康是有害的;不结婚的男性会早逝10年;身材高的父亲,其子女的身材也高;第二个出生的子女没有第一个聪明,依此类推;统计调查表明,怕老婆的丈夫得心脏病的几率较大。这些结论正确吗?你相信这些结论吗?要正确阅读并理解这些数据,就需要具备一些统计学知识。,课程的性质 统计学是为高等院校经济与管理学科各专业学生开设的一门

2、必修的重要的基础课,也是经济管理工作者和经济研究人员所必备的一门课程。,考核方式及成绩评定方法,平时30%(考勤+作业+实践)期末闭卷考试占70%,要求,按时上课课前预习课后复习独立完成作业,统计学教学参考书介绍,1.贾俊平编著,应用统计,中国人民大学出版社,20082.贾俊平编著,统计学(第二版),清华大学出版社,2007 3.贾俊平统计学(第二版),中国人民大字出版社,20064.袁卫、庞皓、曾五一主编,统计学,高等教育出版社5.(美)Gudmund R.Iversen、Mary Gergen 著,吴喜之等译,统计学基本概念和方法.北京:高等教育出版社、施普林格出版社,2000 6.(美)

3、戴维 R.安德森,丹尼斯 J.斯威尼,托马斯 A.威廉姆斯著,张建华,王健,冯燕奇等译.商务与经济统计.北京:机械工业出版社,2000,衷心祝愿:全体同学都能认真对待,共同努力,顺利的完成统计学课程的学习!,第 1 章 统计和统计数据,1.1 统计及其应用领域1.2 怎样获得统计数据?,学习目标,统计学的含义统计学的研究内容统计的应用领域统计数据的类型获得统计数据的途径,你相信这样的一些统计结论吗?,吸烟对健康是有害的,吸香烟的男性减少寿命2250天不结婚的男性会减少寿命3500天,不结婚的女性会减少寿命1600天身体超重30%会使寿命减少1300天每天摄取500毫升维生素C,生命可延长6年身

4、材高的父亲,其子女的身高也较高二个出生的子女没有第一个聪明,第三个出生的子女没有第二个聪明,依此类推学生们在听了莫扎特钢琴曲10分钟后的推理测试会比他们听10分钟娱乐磁带或其他曲目做得更好上课坐在前面的学生平均考试分数比坐在后面的学生高,1.1 统计及其应用领域 1.1.1 统计学研究什么?1.1.2 统计的应用,第 1 章 统计和统计数据,1.1.1 统计学研究什么?,1.1 统计及其应用领域,什么是统计学?(statistics),1.收集数据:取得数据2.处理数据:图表展示 分析数据:利用统计方法分析数据数据解释:结果的说明得到结论:从数据分析中得出客观结论,收集、处理、分析、解释数据并

5、从数据中得出结论的科学,统计方法,描述统计和推断统计(inferential statistics&)descriptive statistics),研究数据收集、整理和描述的统计学方法 搜集数据、整理数据、展示数据、描述性分析描述数据特征找出数据的基本规律研究如何利用样本数据来推断总体特征的统计学方法参数估计、假设检验对总体特征作出推断,统计学研究什么?,物理学研究的是如热、光、电、运动规律那样的自然现象化学家测定物质的组成及化学元素之间的交互作用生物学家研究植物和动物的生活数学家则在给出的假定之下沉溺于他自己推演各种命题的游戏这些学科中的每一门都有它自己的问题,而且有解决这些问题的各自的方

6、法,各学科为此而成为一门单独的学科,统计学研究什么?,统计学没有任何固定的对象,是一门独特的学问统计学研究的是来自各领域的数据,由解决其他领域内的问题而存在并兴旺发达。按萨维奇()的说法:统计学基本上是寄生的。靠研究其他领域内的工作而生存。这不是对统计学的轻视,这是因为对很多寄主来说,如果没有寄生虫就会死。对有的动物来说,如果没有寄生虫就不能消化它们的食物。因此,人类奋斗的很多领域,如果没有统计学,虽然不会死亡,但一定会变得很弱,统计学研究什么?,统计学是一门科学统计学提供一套方法和技术,这些方法和技术不能用于固定模式,使用者在给定的情况下必须根据所掌握的专门知识选择使用的方法,而且,如果需要

7、还要进行必要的修正统计方法是通用的数据分析方法。这些方法不是为某个特定的问题领域而构造的统计学是一种技术如同工业生产过程中的质量控制程序一样,统计方法是为保证产品达到所希望的质量和保持其稳定性的的管理系统中建立起来的统计方法也能用于控制、减少和考察不确定性统计学是一门艺术作为归纳推理的统计方法不是没有争议的。不同的人对同一组数据的分析可能得到不同的结论一本印度小说红色城堡(The Red Fort)说:使用数字讲故事取决于统计学家的技巧和他们的经验。在这个意义下,统计学也是一门艺术,统计是一种思维方式,统计思维总有一天会像读与写一样成为一个有效率公民的必备能力()在终极的分析中,一切知识都是历

8、史;在抽象的意义下,一切科学都是数学;在理性的基础上,所有的判断都是统计学(),1.1.2 统计的应用,1.1 统计及其应用领域,统计的应用领域,【例1.1】用统计识别作者 17871788年,三位作者Alexander Hamilton,John Jay和James Madison为了说服纽约人认可宪法,匿名发表了著名的85篇论文。这些论文中的大多数作者已经得到了识别,但是,其中的12篇论文的作者身份引起了争议 通过对不同单词的频数进行统计分析,得出的结论是,James Madison最有可能是这12篇论文的作者。现在,对于这些存在争议的论文,认为James Madison是原创作者的说法占

9、主导地位,而且几乎可以肯定这种说法是正确,统计的应用领域,【例1.2】用简单的描述统计量得到一个重要发现 费舍(RAFisher)在1952的一篇文章中举了一个例子,说明如何由基本的描述统计量的知识引出一个重要的发现。20世纪早期,哥本哈根卡尔堡实验室的施密特(J.Schmidt)发现不同地区所捕获的同种鱼类的脊椎骨和鳃线的数量有很大不同;甚至在同一海湾内不同地点所捕获的同种鱼类,也发现这样的倾向 然而,鳗鱼的脊椎骨的数量变化不大。施密特从欧洲各地、冰岛、亚速尔群岛以及尼罗河等几乎分离的海域里所捕获的鳗鱼的样本中,计算发现了几乎一样的均值和标准偏差值。由此,施密特推断所有各个不同海域内的鳗鱼是

10、由海洋中某公共场所繁殖的。后来名为“戴纳(Dana)”的科学考察船在一次远征中发现了这个场所,统计的应用领域,【例1.3】挑战者号航天飞机失事预测 1986年1月28日清晨,载有7名宇航员的挑战者号进入发射状态。就在发射前,有冰片牢附在机壳上。几分钟后,正当电视新闻报道它已进入轨道时,航天飞机在毁灭性的爆炸声中化成碎片,机上的宇航员片骨未存 推动航天飞机进入太空的两个固体燃料发动机是由Thiokol公司制造的。失事前一天晚上,Thiokol公司的经理们和国家航空航天局就如期发射还是推迟发射产生了争执。天气预报发射时的气温为310F。争执的结果采纳了Thiokol公司经理们的建:按计划发射航天飞

11、机。因为他们觉得没有确凿证据表明低温会对固体燃料火箭推进器的性能产生影响,统计的应用领域,【例1.3】挑战者号航天飞机失事预测 在此次失事前,该航天飞机24次发射成功。将航天飞机送入太空的两个固体燃料推进器由6只O型项圈密封。在几次飞行中,曾发生过O型项圈被腐蚀或气体泄漏事故。这样的事故是及其危险的。前24次发射中有一次发动机遭到了永久性破坏。根据23次飞行中发生腐蚀或泄漏事故的次数(因变量)及火箭连接处的温度(自变量)数据,进行线性回归得到的回归方程为当温度为310F时,O型项圈发生事故的预计次数为2.225次。结果显示连接处的温度与O型项圈事故之间有一定的相关性。如果当时那些经理们看到了回

12、归的预测结果,也许推迟发射会成为其谨慎的选择,统计的误用与滥用,大约在一个世纪以前,政治家Benjamin Disraeli曾有一个著名的论断:“有三类谎言:谎言、糟透的谎言和统计”。他还说:“图并没有说谎,是说谎者在画图”历史学家Andrew Lang说,一些人使用统计“就像喝醉酒的人使用街灯柱支撑的功能多于照明”统计滥用不好的样本过小的样本误导性图表局部描述故意曲解,统计的误用与滥用,统计应用上的两个极端不用或几乎不用统计简单问题复杂化在统计应用中,这两个极端都是不可取的简单的方法不一定没用,复杂的方法也不一定有用。正如有的学者所说的,最简单的模型往往是最有用的统计应该恰当地应用到它能起作

13、用的地方。不能把统计神秘化,更不能歪曲统计,把统计作为掩盖实事的陷阱,1.2 怎样获得统计数据 1.2.1 变量与数据 1.2.2 数据的来源,第 1 章 统计和统计数据,1.2.1 变量与数据,1.2 怎样获得统计数据,变量与数据,变量(variable)从一次观察到下一次观察会出现不同结果的某种特征观察一个企业的销售额,这个月和上个月有所不同;观察股票市场上涨股票的家数,今天与昨天数量不一样;观察一个班学生的生活费支出,一个人和另一个人不一样;投掷一枚骰子观察其出现的点数,这次投掷的结果和下一次也不一样“企业销售额”、“上涨股票的家数”、“生活费支出”、“投掷一枚骰子出现的点数”等就是变量

14、数据(data)观察到的变量的结果,变量与数据,定量变量(quantitative variable)或数值变量(metric variable)可以用阿拉伯数据来记录其观察结果如“企业销售额”、“上涨股票的家数”、“生活费支出”、“投掷一枚骰子出现的点数”定量变量的观察结果称为定量数据或数值型数据(metric data)分类变量(categorical variable)表现为不同的类别如“性别”、“企业所属的行业”、“学生所在的学院”等分类变量的观察结果就是分类数据(categorical data)顺序变量(rank variable)或有序分类变量具有一定顺序的类别变量如考试成绩按等

15、级,一个人对事物的态度顺序变量的观察结果就是顺序数据或有序分类数据(rank data)分类变量和顺序变量统称为定性变量(qualitative variable),1.2.2 数据的来源,1.2 怎样获得统计数据,数据的来源,寻找二手数据抽取样本总体(population):包含所研究的全部个体(数据)的集合样本(sample):从总体中抽取的一部分元素的集合样本量(sample size):构成样本的元素的数目概率抽样方法,概率抽样(probability sampling),根据一个已知的概率来抽取样本单位,也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会

16、被抽中每个单位被抽中的概率是已知的,或是可以计算出来的 当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率,简单随机抽样(simple random sampling),从总体N个单位(元素)中随机地抽取n个单位作为样本,使得总体中每一个元素都有相同的机会(概率)被抽中 抽取元素的具体方法有重复抽样和不重复抽样特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其他辅助信息以提高估计的效率,简单随机样本(simple random sample),由简单随机抽样形成的样

17、本从总体N个单位中随机地抽取n个单位作为样本,使得每一个容量为n样本都有相同的机会(概率)被抽中 参数估计和假设检验所依据的主要是简单随机样本,分层抽样(stratified sampling),将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计,系统抽样(systematic sampling),将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位先从数字1

18、到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难,整群抽样(cluster sampling),将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差,几种常用的统计软件(Software),典型的统计软件SASSPSSMINITABSTATISTICAExcel,自测题,指出下面的数据哪一个属于分类数据()A.某种产品的销售价格(元):21,26,19,22,28B.

19、某汽车生产企业各季度的产量(万辆):25,27,30,26C.产品的质量等级:一等品,二等品,三等品D.上网的方式:有线宽带,无线宽带2.指出下面的变量哪一个属于顺序变量()A.每月的生活费支出B.产品质量的等级C.企业所属的行业D.产品的销售收入3.质检部门从某业生产一天生产的手机中随机抽取20部进行检查,推断该批手机的合格率。这项研究的总体是()A.20部手机B.一天生产的全部手机C.20部手机中合格的手机 D.一天生产的手机中合格的手机,4.一所大学从全校学生中随机抽取300人作为样本进行调查,其中80%的人回答他们的月生活费支出在500元以上。这里的300人是()A.总体B.样本C.变

20、量D.统计量5.一项调查表明,在所抽取的2000个消费者中,他们每月在网上购物的平均花费是200元,这项调查的样本是()A.2000个消费者B.所有在网上购物的消费者C.所有在网上购物的消费者的网上购物的平均花费金额D.2000个消费者的网上购物的平均花费金额6.最近发表的一项调查表明,“汽车消费税率调整后,消费者购买大排量汽车的比例显著下降”。这一结论属于()A.对样本的描述B.对样本的推断C.对总体的描述 D.对总体的推断,7.下列数据分析方法中,属于推断统计方法的是()A.画出一个班考试分数的茎叶图B.学生的生活费支出分成400元以下、400元500元、500元600元、600元以上,列

21、出每一组的人数C.随机抽取2000个家庭计算出它们的平均收入D.随机抽取2000个家庭,根据2000个家庭的平均收入估计该地区家庭的平均收入8.分层机抽样的特点是()A.使得总体中的每一个元素都有相同的机会被抽中B.在抽样之前先将总体的元素划分为若干类,使得每一类都有相同的机会被抽中C.先将总体划分成若干群,使得每一群都有相同的机会被抽中D.先将总体各元素按某种顺序排列,使得总体中的每一个元素都有相同的机会被抽中9.为了解大学生的上网时间,从全校所有学生宿舍中随机抽取50个宿舍,然后对抽中宿舍中的每个学生进行调查,这种抽样调查方法是()A.分层抽样B.简单随机抽样C.系统抽样D.整群抽样,10.在抽取样本时,一个元素被抽中后不再放回总体,然后再从所剩下的元素中抽取第二个元素,直到抽取 个元素为止,这样的抽样方法称为()A.重复抽样B.不重复抽样C.分层抽样D.系统抽样,本章小节,统计学的含义统计学的研究内容统计的应用领域统计数据的类型获得统计数据的途径,结 束,THANKS,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号