《统计学复习总结 课件.ppt》由会员分享,可在线阅读,更多相关《统计学复习总结 课件.ppt(80页珍藏版)》请在三一办公上搜索。
1、第一章 总 论统计资料、统计工作、统计学研究对象 、,统计调查,统计整理,统计分析,统计工作,统计学,统计资料,统计的含义,统计学的研究对象,数量性,总体性,变异性,客观现象的数量特征和数量关系,通过数量关系和数量特征反应客观现象发展变化的规律性。,其特点:,统计学的研究方法,1、大量观察法2、综合指标法3、统计推断法,统计学中的几个基本概念总体 单位特 特 征 征 品质标志(具体表现用文字)指标汇总、变换标志 数量标志 (具体表现标志值) 数量指标( 绝对数) 变量:离散变量连续变量) 相对数 质量指标 平均数,标志与指标的联系与区别:,统计指标与标志的区别表现为: (1)概念不同。标志是说
2、明总体单位属性的,一般不具有综合的特征;指标是说明总体综合数量特征的,具有综合的性质。 (2)统计指标都可以用数量来表示;标志中,数量标志的具体表现可以用数量来表示,品质标志的具体表现只能用文字表示。统计指标与统计标志的联系表现为: (1)统计指标的指标值是由各单位的标志值汇总或计算得来的; (2)随着研究目的不同,指标与标志之间存在变换关系。,统计调查,统计整理,统计分析,调查概念调查种类调查方式调查方案设计,整理概念统计分组频数分布表,综合指标抽样与抽样估计假设检验相关与回归时间数列分析统计指数,3.统计调查的种类,(1)按调查的组织形式可分为 统计报表 专门调查(2)按调查对象所包括的范
3、围可分为 全面调查 非全面调查(3)按调查登记的时间是否连续可分为 连续调查 一次性调查,4.统计调查方式,全 报表制度-制度化的经常性调查面调查 普 查 非 抽样调查 专门组织的调查 全 重点调查 面 典型调查,返回,(1)统计报表制度,特点:由政府部门组织,采用统一的表格,自上而下布置,自下而上报告。 任务:搜集国民经济和社会发展基本情况的资料,为制订国民经济和社会发展计划和检查计划执行情况服务。优点:精心周密设计、高度统一、规范。回收率高,内容相对稳定,便于资料积累、对比。层层上报、逐级汇总,可以满足各部门需要。,(2)重点调查,特点:在总体中选择个别或部分重点单位进行调查。重点单位指在
4、总体中有举足轻重地位的单位,其标志值在总体标志总量中占有绝大比重方式:一次性调查;专门设计和备配人员现场调查。,(3)抽样调查,特点:经济性、时效性、适应性、科学性。按照随机原则从总体中抽取部分单位组成样本;以样本数据推断总体特征;抽样误差可计算并可控制。,(4)普查,特点:工作量大,时间长,需要大量的人力、物力、财力。 任务:搜集重要的国情国力和资源状况的全面资料,为政府制定规划、方针政策提供依据。方式:建立专门机构,配备专门人员调查。利用基层单位原始记录和核算资料发表调查。 原则:规定统一的标准时点。,(5)典型调查,特点:在全面分析的基础上,有意识地选择代表性的典型单位进行现场调查。 任
5、务:为研究某种特殊的社会经济问题,搜集详细的第一手资料,借以认识事物的本质特征、因果关系、变化趋势。为理论和政策性问题研究提供依据。由于人为因素太多,现已不太使用,我国现阶段常用 的方式,(1)统计报表(2)普查(3)抽样调查,调查方案设计,1、调查目的2、调查对象和调查单位2、调查项目和调查表4、调查时间和期限5、调查的组织形式,统计数据的整理,一、统计整理的意义和内容二、统计分组的概念三、分配数列四、统计汇总五、统计表,返回,(一)统计整理的意义和内容,1.统计整理的概念统计整理,就是根据统计研究的目的和要求,将调查所得到的大量原始资料进行科学的加工、分类、汇总,为统计分析提供条理化、系统
6、化的资料,用来反映现象总体情况的工作过程。2.统计整理的内容统计整理包括以下几个方面:统计资料的审核、统计分组、统计汇总、编制统计表。,统计分组的概念和形式,1.统计分组的概念根据研究目的,按照某一标志将总体各单位划分为几个部分或组,把性质不同的区分开,把性质相同的现象归并在同一组内,这种方法叫统计分组。 统计整理的关键在于统计分组,统计分组的关键在于正确选择分组标志。,统计分组的概念和形式,2、统计分组的形式: 品质标志分组(1)按分组标志性质分 数量标志分组 简单分组(2)按分组标志个数分 复合分组,分配数列,分配 数列的概念和构成要素1、分配数列的概念 在统计分组的基础上,将各单位按组归
7、类排列,形成各单位在各组间的分布。即:按某种标志对数据进行分组后,再计算出所有类别或数据在各组中出现的次数或频数就形成了一张频数分布表。2、构成要素:按标志所分的组 各组次数,分配数列,(二)、分配 数列的种类品质分配数列变量分配数列 单项变量分配数列 等距数列、不等距数列 组距数列 开口数列、闭口数列,统计表的种类:统计表按主词是否分组可分为:简单表:主词按一定顺序排列,不分组。简单分组表(单一分组表):主词按一个标志分组。复合分组表:主词按两个以上标志分组,进行层叠配置,综合指标:总量指标:总体标志总量、总体单位总量时期指标、时点指标相对指标:结构、比例、比较、强度、动态平均指标:算术平均
8、数、调和平均数指、众数中位数、几何平均数变异指标:全距、平均差、标准差、变异系数,六种相对数指标的比较,不同时期比 较,动 态相对数,强 度相对数,不同现象比较,不同总体比较,比 较相对数,同一总体中,部分与部分比 较,部分与总体比 较,实际与计划比 较,比 例相对数,结 构相对数,计划完成相对数,同一时期比较,同类现象比较,常用的几种平均数,计算 公 式,1. 算术平均数( ),标志总量与总体单位总数的比值,简单:,加权:,算术平均数,权数的作用:对平均数起着权衡轻重的作用,权数的形式:绝对数(次数)f;相对数(比重),计算 公 式,2. 调和平均数,标志值倒数平均数的倒数,缺少单位数时采用
9、,概 念 计算 公 式 特 点,3. 几何平均数( ),几个变量值连乘积的几次根,简单:,加权:,几何平均数,计算 公 式,4. 中位数(Me),标志值由小到大顺序排列中居中间位置的标志值位置平均数,下限公式:,中位数,概 念,计算 公 式,5. 众数(Mo),分配数列中出现次数最多的标志值位置平均数,下限公式:,众数,概 念,常用的几种标志变异指标,概 念 计 算,数列中最大值与最小值之差,1极差 (R),R=最大值-最小值,2平均差 (A、D),各标志值与均值离差绝对值的算术平均,简单:,加权:,概 念 计 算,各标志值与均值离差平方的平均。方差的平方根(取正根),3方差(2) 和 标准差
10、(),4标准差系 数 (V),标准差与均值之商,是无量纲的系数,简单:,加权:,适宜不同数列平均指标代表性的比较,方差(2)和标准差()是应用最广的标志变异指标,抽样与抽样估计:抽样推断的概念总体指标、样本指标抽样误差、影响因素、抽样平均误差、抽样极限误差概率度t 、置信度(概率值或概率保证程度)区间估计、点估计,标准正态分布的取值范围,n=正态分布n=10n=1,t分布图,t分布(Students 分布),图4-3,2分布图,分布,分布的取值范围,F分布的取值范围,所要估计的总体指标有两类:总体平均数总体成数,所要估计的总体指标有:总体平均数总体标准差,或方差总体标志总量,所要估计的总体指标
11、有:成数总体成数(总体比例)总体成数的标准差,或方差总体中具有某一属性的单位总数,抽样平均误差它反映了抽样指标与总体指标的平均离差程度,即无论抽到哪个样本,都认为抽样误差就是这么大。它的实质含义是抽样指标的标准差。 抽样平均数的抽样平均误差重复抽样:不重复抽样:抽样成数的抽样平均误差:重复抽样的方法下:不重复抽样:,(三)抽样极限误差 抽样极限误差是指一定概率下抽样误差的可能范围,也称为允许误差。抽样平均数的抽样极限误差抽样成数的抽样极限误差从公式中可以看出抽样平均误差与抽样极限误差的关系。,平均值的区间估计步骤, 计算样本平均数, 计算抽样平均误差,3. 计算抽样极限误差:,4. 确定总体平
12、均数的置信区间:, 计算样本成数,成数或比率区间估计算步骤,2.计算抽样平均误差:,3. 计算抽样极限误差:,4. 确定总体平均数的置信区间:,假设检验概念步骤:提出假设、构造统计量、确定 计算统计量、作出结论单尾检验、双尾检验,假设的形式:,H0原假设, H1备择假设设计零假设和替代假设时,我们必须明确依问题所要作的结论。应尽量把要作的结论放在替代假设中陈述。将要通过有关数据证明不成立的命题叫做原假设(零假设),相对应地,利用原假设的对立命题所成立的假设叫做备择假设(对立假设)。,双尾检验:H0:=0 , H1:0(),单尾检验: H0:0 , H1:0 H0:0 , H1:0,假设检验就是
13、根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。,一个总体参数的检验,1.总体均值的检验(作出判断),样本容量n,总体均值检验(大样本检验方法的总结),总结,总体均值的检验 (小样本检验方法的总结),注:s 已知的拒绝域同大样本,总体比例的检验(检验方法的总结),一、方差分析的内容方差分析是对多个总体均值是否相等这一假设进行检验。在方差分析中,常用术语有:1、因素:它是一个独立的变量,也是方差分析研究的对象。2、水平:因素中的内容称之为水平。3、观察值在每个因素水平下得到的样本值一种饮料的颜色共有四种,粉、橘黃、绿、无色,想要了解这四种色彩对其销售量有无影
14、响。因素颜色水平粉、橘黃、绿、无色观察值每种颜色饮料的销售量就是观察值结果:销售量有影响或无影响。在方差分析中,通常假定各个水平的观察数据是来自于服从正态分布总体中的随机样本。,方差分析的基本思想和原理(两类方差),组内方差因素的同一水平(同一个总体)下样本数据的方差比如,无色饮料A1在5家超市销售数量的方差组内方差只包含随机误差组间方差因素的不同水平(不同总体)下各样本之间的方差比如,A1、A2、A3、A4四种颜色饮料销售量之间的方差组间方差既包括随机误差,也包括系统误差,方差分析的基本思想和原理(方差的比较),如果不同颜色(水平)对销售量(结果)没有影响,那么在组间方差中只包含有随机误差,
15、而没有系统误差。这时,组间方差与组内方差就应该很接近,两个方差的比值就会接近1如果不同的水平对结果有影响,在组间方差中除了包含随机误差外,还会包含有系统误差,这时组间方差就会大于组内方差,组间方差与组内方差的比值就会大于1当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,相关与回归:相关种类相关系数的计算、取值范围回归分析与相关分析的区别与联系,1.按相关关系涉及的因素多少来分,可分为: 单相关和复相关。2.按相关关系的性质来分,可分为: 正相关和负相关3.按相关关系的形式来分,可分为: 直线相关和曲线相关4.按相关程度分,可分为: 完全相关、不完全相关和不相关,对r的解释如下:(
16、即r的特点),(1) r取正值或负值决定于分子协方差;(2) r的绝对值,在0与1之间;(3) r的绝对值大小,可说明现象之间相关关系的紧密程度。,相关分析与回归分析的关系(区别与联系)二者的区别是:相关分析仅能观察相关的方向和密切程度,但不能指出两个变量间相关的具体形式;回归分析可以根据回归方程用自变量的数值推算因变量的估计值。相关分析中两变量是对等的,都是随机变量,不区分自变量和因变量;回归分析中两变量不是对等的,要区分自变量和因变量,且因变量是随机变量,自变量是给定的非随机变量。二者的联系是:相关分析需要回归分析来表明现象数量关系的具体形式,而回归分析是建立在相关分析的基础上的。,r2
17、越接近于1,表明x与y之间的相关性越强; r2 越接近于0,表明两个变量之间几乎没有直线相关关系.,相关系数与判定系数,是相关系数的平方,用 r2 表示;用来衡量回归方程对y的解释程度。,判定系数取值范围:,判定系数,回归估计标准误差 ( S ),是因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实际值代表性的强弱;其值越小,回归方程的代表性越强,用回归方程估计或预测的结果越准确。,回归估计标准误差的简化计算:,时间数列分析概念种类水平指标速度指标趋势变动、季节变动分析:趋势变动分析:移动平均法、最小二乘法建模季节变动分析:简单季节指数、趋势剔除法,1. 总量数列的序时平均数,计算
18、公式:,(1) 时期数列简单算术平均法,不连续时点数列A:数值在时点一端,间隔不等:,B:数值在时点一端,间隔相等,上式简化为: “首末折半法”,不连续时点数列,C:数值在一个月内变动,2.相对数数列或平均数数列的序时平均数计算原则:先平均,后对比,计算公式,1. 分别计算其分子、分母的序时平均数 (先判断分子分母是什么指标、是时期指标还是时点指标?)2. 对比得 :,增减量,1. 增减量(增长量) 按选择基期不同,可分为:*逐期增减量*累计增减量 两者关系:累计增减量相应时期的逐期增减量的总和。,发展速度,发展速度,环比发展速度,定基发展速度,二者关系:环比发展速度的连乘积定基发展速度,环比增减速度逐期增减量上期水平 环比发展速度定期增减速度累计增减量固定基期水平 定期发展速度,增长1%的绝对值=,平均发展速度的计算方法,1. 几何平均法(水平法),同一种方法,资料不同,有以上三种计算形式。,环比发展速度的个数数列发展水平项数,统计指数概念种类总指数的两种计算形式:综合指数、平均指数利用指数体系进行两因素分析:总量指标两因素分析平均指标两因素分析,要求: 编制销售量总指数,价格总指数以及销售额 指数,例某企业三种商品销售资料如下:,二 平均数指数的编制方法 1 数量指标指数的编制 加权算术平均数指数,2 质量指标指数的编制 加权调和平均数指数,