《统计学及其基本概念.ppt》由会员分享,可在线阅读,更多相关《统计学及其基本概念.ppt(61页珍藏版)》请在三一办公上搜索。
1、,南京财经大学统计学系,第一章 统计学及基本概念,本 章 内 容,第一节 统计学简介一、统计的涵义 二、统计的过去与现在 三、统计学在经济管理中的应用第二节 数据及其分类一、认识数据 二、数据类型 三、数据类型 四、数据类型III 五、数据类型IV第三节 总体、个体与样本一、统计总体和个体 二、总体的特点 三、样本第四节 标志、指标与指标体系一、统计标志 二、统计指标 三、统计指标体系第五节 统计计算工具一、统计分析软件简介二、Excel实现数据处理的主要途径,一、统计的涵义,1.统计工作(statistical work)2.统计资料(statistics,statistical data)
2、3.统计学(statistics),主要做三件事:收集数据 整理数据 分析数据,1.统计工作(statistical work),统计工作是为了管理或认识的需要,对社会经济现象和自然现象进行数据收集的活动。统计局系统 企业信息化,2.统计资料(statistical data),统计资料是统计工作过程中所取得的各项数字资料以及与之相关信息的总称。统计资料是统计工作取得的能够说明所研究对象的数据。例如国内生产总值数据,说明整个国家的生产规模。这些数据经常会在报纸、杂志上出现。,存在形式:纸质,电子版,网站数据库,部分网上数据资源,3.统计学(statistics),统计学是在统计工作的经验积累到
3、一定程度时自然产生的,它是收集、整理、描述分析统计数据的方法和技术,为我们的决策提供“量”方面的依据。不列颠百科全书对统计学的定义为:“统计学是关于收集和分析数据的科学和艺术”。,统计学的分类按研究内容:理论统计学 应用统计学按研究方法 描述统计学 推断统计学,描述统计学,描述统计学研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。,Descriptive Statistics,推断统计学,推断统计学是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作
4、出以概率形式表述的推断。,Inferential Statistics,案例,收集数据 整理数据 分析数据 展现结果 作出决策,早点起床,在网上飞驰,互联网的用户人数及分布、信息流量分布、域名注册、用户通常在什么时间上网等信息都可以从电讯局或网络公司的业务记录中获得。汇总每天某个时间点上,在线用户占注册用户的比例来反映用户通常上网的时间,二、统计的过去与现在,(一)统计学中的各大著名学派 1.国势学派 2.政治算术学派 3.数理统计学派 4.社会统计学派(二)统计学的现代格局,国势学派,人物:【德国】康令和阿亨瓦尔贡献:提出世界公认的名词统计学(Statistics)评价:“有统计之名,无统计
5、之实”的学派,政治算术学派,人物:【英国】威廉配第和约翰格朗特贡献:开用数量方法研究社会经济现象之先河评价:“有统计之实,无统计之名”的学派,数理统计学派,人物:【比利时】人才济济。如:凯特勒、戈赛特、费希尔、内曼、卡尔.皮尔逊贡献:(1)完成统计学和概率论结合(2)建立了丰富的数理统计理论,社会统计学派,人物:【德国】克尼斯、恩格尔和梅尔观点:统计学的研究对象是社会现象,目的在于明确社会现象的内在联系和相互之间的关系。在研究过程中,要用全面调查,也可以适量的使用抽样调查。,恩格尔系数,(二)统计学的现代格局,以社会经济问题为主要研究对象的社会经济统计以方法和应用研究为主的数理统计学科的角度,
6、前者从属于应用经济学;后者从属于数学对计算机的依赖越来越统计学从有关领域中吸取的养分也越来越多交叉发展的趋势越来越强,三、统计学在经济管理中的应用,统计给我们智慧与力量统计学在经济领域的应用(案例1 案例2)统计学在管理领域的应用(案例1 案例2),案例1,1995年9月,美国斯坦福大学经济学教授刘遵义就通过实证比较,数量分析和模糊评价等方法,预测出菲律宾、韩国、泰国、印尼和马来西亚有可能发生金融危机。,案例2,2005年3月16日上证平均指数中30支股票的市盈率是21.08。东方电子集团有限公司的市盈率是17.92。这时,市盈率方面的统计信息显示:与上证指数股票的平均收入相比,东方电子集团有
7、限公司的股票价格较低。因此,投资顾问可以得出结论:东方电子集团有限公司的现行价格低估了。,案例1,一家会计师事务所想确定客户的资产负债表中所显示的应收账款的数量是否公正地体现了实际的应收账款的数量。通常,应收账款的账目数量很大,要审查和验证每个账户既费时又费钱。怎么办?抽样调查可以解决问题!,案例2,零售付账柜台使用电子扫描仪收集数据,可供各种营销研究应用。数据挖掘的典型:啤酒与纸尿裤,一、认识数据,1.中国历年主要宏观经济指标数据集(数据集01),2.1995年世界各国基本情况数据集(数据集02),3.公司人力资源部数据集(数据集03),4.企业流水线上的抽样数据集(数据集04),现代汉语词
8、典对数据的解释是:进行各种统计、计算、科学研究或技术设计等所依据的数值。我们提供四个数据集,让大家对数据有一个直观的了解。,EXCEL,数据集1,中国历年主要宏观经济指标数据集,数据集2,1995年世界各国基本情况数据集,数据集3,公司人力资源部数据集,数据集4,工厂流水线上的抽样数据集,数据类型,1.分类数据(categorical data)2.顺序数据(rank data)3.数值型数据(metric data),定性数据品质数据,分类数据(categorical data),分类数据是对事物进行分类的结果,数据的主要特征是采用文字、数字的代码和其他符号对事物进行简单的分类和分组。分类数
9、据以定类尺度(nominal scale)来衡量。,顺序数据(rank data),即:等级数据 也是对事物进行分类的结果,只是这些分类在语义上表现出明显的等级或顺序关系;例如,学生的成绩;对商品和服务的满意程度顺序数据以定序尺度(ordinal scale)来衡量。,数值型数据,数值型数据是使用自然或度量衡单位对事物进行测量的结果,其结果表现为具体数值。两种衡量尺度:定距尺度(interval scale)温度 定比尺度(ratio scale)区别:“绝对零点”,定量数据或数量数据,数据类型,截面数据(cross-sectional data)时间序列数据(time series data
10、)面板数据(panel data),截面数据,截面数据(cross-sectional data)是对多个不同的个体在相同或近似相同的时间点上收集的数据,它所描述的是现象在某一时刻或某一时间段的变化情况。,时间序列数据,时间序列数据(time series data)是对同一个研究对象在不同时间上收集到的数据,它所描述的是现象随时间而变化的情况。,面板数据,是对若干个单位在不同时间进行重复跟踪调查所形成的数据。例如,我们连续20年收集得到的企业工人的工资、受教育程度和就业情况的数据。,数据类型III,绝对数(absolute number)相对数(relative number)平均数(ave
11、rage),绝对数,是统计数据的基本表现形式,是其他指标形式形成的基础。现象的总体规模和水平一般都以绝对数形式表现,如:总人口、国内生产总值、货物周转量等都是绝对数;其计量单位有实物单位、价值单位和复合单位三种。分为:时期数和时点数。时期数是反映现象在一段时期内的总量。如产品产量、产值、销售额等。特点:可以连续计数,并可以累积。时点数是反映现象在某一瞬间时刻上的总量,如人口数、商品的库存量、银行储蓄余额等。特点:只能间断计数,各时点不能累积。,相对数,是由两个相互联系的绝对数相比得到,反映事物的相对数量。常用的相对数:结构相对数、动态相对数、比较相对数、计划完成相对数。结构相对数是在对资料进行
12、分组的基础上,以总体的总量作为比较的标准而得到的相对数。动态相对数是将不同时期的同类事物的水平加以比较求得的相对数。比较相对数是将不同单位的同类现象对比得到的相对数。计划完成相对数将实际完成数与计划完成数对比用以反映计划的执行情况,对于产出类指标,如产量,大于100%说明完成了规定的任务,而对于投入类指标,如成本,则小于100%说明完成任务。,平均数,反映现象总体的一般水平。,思考:平均数和相对数的区别,五、变量,最常见的分类是:离散型变量和连续型变量。离散型变量一般用“点数”的方法取得,数值往往是整数,如职工人数、企业个数、设备台数等。连续型变量用“测量”取得,如人的身高、体重;产品的长度、
13、重量等。变量还可分为确定性变量和随机变量。受确定性因素影响的变量称为确定性变量。受随机性因素影响的变量称为随机变量,所谓随机因素,是指各种不确定的、偶然性的因素,这种因素对变量影响的大小和方向都是不确定的,通常是微小的。定性变量和定量变量,总体与个体,统计总体,简称总体(population),就是统计所要研究的事物或现象的全体,即由客观存在的,具有某种共同特征的许多个别事物构成的整体。个体(Item Unit)是构成统计总体的个别事物,又称为单位。,总体的特点:1、大量性 2、同质性 3、差异性 4、相对性,总体容量有限总体无限总体,样本,样本(Sample)是指从统计总体中抽取出来作为代表
14、这一总体的、由部分个体组成的集合体。代表性 样本量(sample size)抽取原则:随机、非随机非随机抽样:判断抽样、配额抽样、滚雪球抽样,总体、样本和个体间的关系,标志,统计标志,简称标志,是指每个个体所共同具有的属性或特征,它是说明个体的属性或特征的具体名称。标志值分类:品质标志和数量标志 不变标志和可变标志是非标志,指标,统计指标,简称指标(indicator),是反映总体数量特征的,由各个个体的标志值汇总综合而成。任何一个统计指标都是经过了从个别到一般、从具体到抽象的过程,它体现总体特征,具有综合性。(一)口径一致是统计指标的基本要求(二)统计指标按反映问题的数量特征分类(三)统计指
15、标按核算的范围分类,(一)口径一致是统计指标的基本要求 1.统计指标是反映研究对象总体特征的,确定研究对象往往与一定的理论相联系,理论定义的范畴应该和实际获得的指标数值的口径统一。2.统计口径包括两个方面:一是计算口径外延的明确定义,二是计算口径维度的正确把握。,高速行驶比中速行驶更安全吗?,(二)统计指标按反映问题的数量特征分类1.数量指标 它是反映客观事物的规模或水平的指标,它表现为汇总后直接得到的绝对数或总量,又称之为总量指标或绝对指标。数量指标是最基本的指标,它是计算其他指标的基础。数量指标包括标志总量和单位总量,如总产值、工资总额、人口总数、企业个数等。2.质量指标 它是反映客观现象
16、之间的相互联系、比例关系、发展速度、内部结构的指标,一般用相对数或平均数表示。如劳动生产率、成本利润率、人均国民收入等。质量指标是由两个数量指标对比求得的,它是由数量指标派生的。,(三)统计指标按核算的范围分类 1.总体指标 即总体参数,简称参数(parameter),是想要了解的总体的某个特征值。如总体均值、总体标准差、总体成数(比例)2.样本指标 即样本统计量,简称统计量。统计量是根据样本数据计算出来的一个量。如样本均值、样本标准差、样本成数(比例),指标体系,一系列相互联系、相互制约的多个统计指标就构成统计指标体系。指标体系内各指标间的关系建立指标体系的原则:客观、科学、可行、预见举例1
17、:工业企业统计指标体系 企业管理与信息处理指标子体系 举例2:宏观统计指标体系 国民经济核算体系,企业管理与信息处理指标子体系,工业企业经营管理指标 工业企业企业管理指标 信息获取与利用指标,工业企业财务管理指标 工业企业经济效益评价指标,国民经济核算体系,一、统计分析软件简介,SAS SPSS Statistica MiniTab 马克威分析系统,EviewsStata S-PlusRMATLABExel,1SAS系统全称为StatisticsAnalysisSystem,最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出了SAS软件。SAS早期的
18、主要功能是统计分析,其产品与解决方案除统计分析外,新增了数据整合、企业智能等。SAS统计系统有多个功能模块,其基本部分是BASESAS模块,它是SAS统计分析系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。其他模块有:SAS/STAT(统计分析模块)、SAS/GRAPH(绘图模块)、SAS/QC(质量控制模块)、SAS/ETS(经济计量学和时间序列分析模块)、SAS/OR(运筹学模块)、SAS/IML(交互式矩阵程序设计语言模块等。大而全;需要编写程序,比较适合统计专业人员,而对非统计专业人员则比较困难;有些功能也可以通过菜单操作实现,如
19、Insight,2.SPSS是软件英文名称的首字母缩写,原意为StatisticalPackagefortheSocialSciences,即“社会科学统计软件包”,2000年SPSS公司将英文全称更改为StatisticalProductandServiceSolutions,标志着SPSS的战略方向做出了重大调整。逐渐由原来的单一统计产品开发与销售转向企业、教育科研及政府机构提供全面信息统计决策支持服务,成为走在了最新流行的“数据仓库”和“数据挖掘”领域前沿的一家综合统计软件公司。SPSS最突出的特点就是操作界面友好,是非统计专业人员的首选统计软件。最新版本:PASW Statistics
20、 18.0,3.Statistica是由美国俄克拉荷马州的StatSoft公司研制的大型专业统计图表分析软件包。数据统计分析项目有15个主命令,130多个子命令.功能是:基本统计分析、非参数统计分析、方差分析、多元回归分析、非线性估计、时间序列/预测、聚类分析、因子分析、判别分析、典型分析、多维尺度分析、路径分析、可靠性/项目分析、对数线性分析和生存分析。Statistica的图形功能很完备,显示输出的图形细腻美观,有13个主命令,80多个子命令,主要包括:快速统计图、二维统计图、三维序列统计图、三维XYZ统计图和统计矩阵等。,4.MINITAB是由美国宾夕法尼亚州立大学在1972年研制的统计
21、分析软件包,它以无与伦比的易学性、可靠性以及完善的功能而著名于世,是教授统计学,实施六西格玛和其他质量改进项目的理想选择。MINITAB包括统计分析模块和绘制图形模块,统计分析模块有13个主命令:基本统计分析、回归分析、方差分析、实验设计、控制图、质量编制计划工具、可靠性/生存分析、多变量分析、时间序列分析、统计报表和列联表检验、非参数检验、探索性数据分析、功效与样本量分析。,5.马克威是由上海天律信息技术有限公司开发的中国第一套完全自主知识产权的大型统计分析和数据挖掘系统。,技术上的特点:将数据挖掘、统计分析、图形展示和智能报表融为一体,为用户提供完整配套的决策支持工具;提供独创的优化算法体系和完备的数据挖掘模型;将可视化数据分析与数据挖掘有机地融合在一起,并将自主开发的嵌入式数据库管理系统同其它关系型数据库实现了无缝连接;它在设计上充分考虑了中国用户的实际情况和使用习惯.,二、Excel实现数据处理的主要途径 1.公式和函数 2.数据分析工具,