《统计基础理论及相关知识.doc》由会员分享,可在线阅读,更多相关《统计基础理论及相关知识.doc(23页珍藏版)》请在三一办公上搜索。
1、统计学原理一、绪论1、统计学:是一门处理数据的方法和技术的学科,也是一门研究“数据”的科学,任务是如何有效地收集、整理和分析这些数据,探索数据内在的数量规律性,对所观察的现象做出推断或预测,直到为采取决策提供依据。研究对对象的特点:总体性、数量性、客观性、数据的随机性、范围的广泛性。2、基本概念:统计总体和总体单位统计总体:统计所需要研究的客观事物的全体,称为统计总体,简称总体,通常所说的总体,都是以客观存在的实体为单位组成的总体,在推断统计中,又常把所有观察值的集合定义为总体。统计总体的形成具备三个条件:客观性、同质性、差异性统计总体按总体单位是否有限分为两种:有限总体和无限总体。总体单位:
2、组成总体的每一个事物,成为总体单位,简称个体。统计总体与总体单位不是固定不变的,总体与总体单位具有相对性,随研究任务的改变而改变。标志和指标标志:说明总体单位特征的名称。标志按表现形式有品质标志和数量标志两种。标志的具体表现是在标志名称后面所表明的属性或数值。数量标志的数值表现称标志值。 指标是统计指标的简称,两种理解:一种认为统计指标是反映总体现象数量特征的概念,这种理解适用于统计理论和统计设计;另一种认为统计指标是反映总体现象数量特征的概念和具体数值,这种理解适用于实际统计工作。指标和标志的关系:区别:指标说明总体特征,标志说明总体单位特征。标志有不能用数值表示的品质标志和能用数值表示的数
3、量标志两种;指标必须是能用数值表示的。联系:有许多统计指标的数值是直接从总体单位的数量标志值汇总而来的;指标与数量标志间存在转化关系。变异与变量变异:可变标志的属性或数值表现在总体各单位间存在的差异,统计上称为变异。在一个总体中,不管是品质标志或数量标志,当某个标志在每个总体单位上具体表现都相同,称此标志为不变标志。当某标志在每个单位的具体表现不同时,称为可变标志,又称变异标志。变量:变异标志又称为变量,即泛指一切可变标志,既包括可变数量标志,也包括可变品质标志。变量对具体表现成为变量值。变量分为:分类变量(说明事物类别的一个名称)、顺序变量(说明事物有序类别的一个名称)和数值变量(说明事物数
4、量特征的一个名称,根据取值不同分为离散变量和连续变量)。统计指标体系:有一系列相互联系的统计指标所构成的整体从形成分,数据分为静态数据和动态数据。静态数据:也称截面数据,是由若干相关现象在某一时点上所处的状态组成的,描述了现象在某一时刻的变化情况,它反映一定时间、地点等客观条件下诸相关现象之间存在的内在数值联系。是在相同时点上收集的数据。动态数据:也称时间序列数据,是由某一现象或若干现象在不同时刻上的状态所形成的数据,描述了现象随时间变化的情况,反映的是现象及现象间关系的发展变化规律,是在不同时点上收集的数据。13、统计学的研究方法:实验设计、大量观察、统计描述(统计研究的基础)和统计推断(可
5、以用于总体数量特征的估计,也可以用于总体某些假设的检验)。实验设计遵循的原则:重复性原则、随机化原则、区组化原则。二、统计工作过程及基本方法1、统计设计:根据统计研究对象的特点,确定统计研究对象的概念和调查范围,明确统计指标和指标体系,以及对应的分组方法,并以分析方法指导实际的统计活动,其基本任务是制定出各种统计工作方案。意义:统计是需要高度集中统一的工作;统计工作把认识对象作为一个整体进行全面的、综合的反映和研究;从认识的顺序来讲,统计工作不是从搜集资料开始的,而是从对客观现象的定性认识开始的;从统计实践的经验看,加强和重视统计设计工作对完成整个统计工作,保证统计工作的质量是必须的。(1)统
6、计设计的种类:通常研究对象内容的设计称为横向设计,统计工作过程的设计可称为纵向设计。按研究对象范围,统计设计分为整体设计和专项设计。按工作阶段,统计设计分为全过程设计和单阶段设计。按时期不同,统计设计分为长期设计和短期设计。(2)统计设计的内容:统计指标和统计指标体系的设计;统计分类和分组的设计;统计调查方式和方法的设计;统计工作组织与协调的设计;统计力量的组织和安排。2、统计调查:根据统计任务的要求,运用科学的调查方法,有计划、有组织的向社会搜集统计资料的过程。统计调查是统计工作的基础环节,是认识事物的起点,统计资料的整理、计算汇总与分析研究都必须在调查搜集资料的基础上进行。(1)统计调查的
7、种类按调查对象包括的范围不同,分为全面调查和非全面调查。按登记时间是否连续,分为经常性调查和一次性调查。按调查组织方式不同,分为统计报表制度和专门调查。专门调查包括:普查、重点调查、抽样调查、典型调查等。(2)抽样调查是按随机原则,从总体中抽取一部分单位作为样本进行观察,并根据观察结果推断总体数量特征的一种非全面调查。重点调查是在调查对象中选择一部分对全局有决定性作用的重点单位进行调查,只适用于调查任务要求掌握调查总体的基本情况,调查标志比较单一,调查标志表现在数量上集中于少数单位,而这些少数单位的标志值之和在总体中有占绝对优势的情况。典型调查是根据调查的目的与要求,在对被调查对象进行全面分析
8、的基础上,有意识选择若干具有典型意义的或有代表性的单位进行调查。调查作用是补充全面调查的不足,在一定条件下可以验证全面调查数据的真实性。(3)统计调查的方案内容:确定调查目的、明确调查对象和调查单位、确定调查项目、选择调查方式方法、规定调查地点、时间及调查的具体实施。调查对象:根据调查目的、任务确定的有某些性质上行通的许多个别事物所组成的总体。 调查单位:调查总体中的个体,即调查对象中的各个具体事物,它是调查重要调查登记的项目的承担者。也就是总体单位,填报单位是负责向上报告调查内容的单位。确定调查项目要注意:调查项目的含义必须明确,不能含糊不清。设计调查项目时,既要考虑调查任务的需要,又要考虑
9、是否能够取得答案。调查项目应尽可能做到项目间相互关联。调查方式有:普查、重点调查、典型调查、抽样调查、统计报表制度等。具体收集统计资料的调查方式有:访问法、观察法、报告法等。调查地点:确定登记资料的地点。2调查标准时间:调查资料所属时间。调查期限:从调查工作开始到结束的时间。3、统计整理内容:对调产来的资料进行审核;按照统计目的要求进行分组或分类,对各单位的指标进行汇总和必要的加工计算;将汇总整理的结果编织成统计表;做好统计工作的系统累积工作。(1)统计分组基本原则:必须保证在某一标志上组内各单位的同质性和组与组之间的差异性。 作用:划分总体现象的类型;揭示事物内部结构;分析现象之间的依存关系
10、。分组标志选择的原则:根据研究目的选择分组标志;选择反映事物本质区别的标志;根据经济发展变化及历史条件选择分组标志。统计分组的方法:按标志的特征分组,可分为:按品质标志分组和按数量标志分组。按标志的多少分组,可分为:简单分组和复合分组。统计分组体系有两种表现形式:平行分组体系和复合分组体系。(2)次数分布:在统计分组的基础上,将总体所有单位按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布,称为次数分布。分布在各组的总体单位数又叫次数,又称频数。次数与总次数之比叫比率,又叫频率。次数分布有两部分组成:各组名称和各组次数或频率。 次数分布的种类:根据分组标志的不同,分布数列分为两种
11、:品质分布数列(简称品质数列,按品质标志分组)、变量分布数列(简称变量数列,按数量标志分组)。变量数列分为单项数列和组距数列两种。 影响组距数列的要素:组距:在组距数列中是用变量值变动的一定范围代表一个组,每个组的最大值为组的上限,最小值为组的下限,每个组的上限和下限之间的距离成为组距。组数:在一个组距数列中共有多少个组成为组数。(分组数目一般不低于5组,不高于15组)组数与组距成反比。次数密度指单位组距的分布次数,=各组次数/组距组距=(最大值最小值)/组数 或组距=全距/(1+3.322lgN),N表示总次数。 组限:即组距的两个端点成为组限。注意遵循“上组组限不在其内”的原则 组中值:指
12、组距数列每组下限与上限之间中点位置的数值。组中值=(上限+下限)/2组距数列根据组距是否相等分为等距数列和异距数列。 次数分布数列的编织步骤:将原始资料按大小顺序排列,确定总体中的最大值和最小值及全距;确定编织数列的类型,若离散变量,且变量值变动幅度不大,可编制单项式数列;若连续变量,应编制连续的组距数列;确定组数和组距;计算各组次数,编制分布数列表。(3)次数分布的表示方法:列表法将各组频数或频率进行累计,表示各组的累计次数或累计频率。累计的方法分为向上累计和向下累计,向上累计是将各组次数或频率从变量值小的组向变量值达的组进行累计;向下累计是将各组次数或频率从变量值大的组向变量值小的组进行累
13、计。向上累计可以说明各组上限以下分布的总次数,或占总体的比重;向下累计说明各组下限以上分布的总次数,或占总体的比重。图示法直方图:横轴表示各组组限,纵轴表示次数和比率,对于不等组距式变量数量,通常按次数密度(频数密度)绘制直方图以表示分布。折线图:在直方图基础上,将每个长方形的顶端中点用折线连接而成,或用组中值与频 3数求坐标点连接而成。两端应与横轴连线。曲线图:向上累计曲线是从最小值的下限开始,连接各组上限与该组累计频数所形成的坐标点,构成折线图,再将其用光滑曲线连接而成。向下累计曲线从最大组的上限开始,连接各组下限与该组累计频数所形成的坐标点,构成折线图。(4)统计表的种类:按用途不同分类
14、:调查表、整理表、分析表按总体分组不同分类:简单表、复合分组表按统计资料的时间和空间分类:空间数列表、时间数列表、时空结合表统计表设计总的要求是:简练、明确、实用、美观、便于比较。4、总量指标和相对指标综合指标按其反应现象总体数量特征的不同分为总量指标、相对指标、平均指标和标志变异指标四种不同形式。(1)总量指标:反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合指标。也表现为某现象总体在一定时空条件下数量增减变化的绝对数。总量指标按说明总体特征的内容不同分为总体单位总量(反映总体单位数多少的总量指标)和总体标志总量(反映总体单位某一数量标志值综合的总量指标)。按反映的时间状态不同分
15、为时期指标(具有可加性,时期越长,指标数值越大)和时点指标(不具有可加性,大小与时点间隔大小无关)。(2)相对指标:是质量指标的一种表现形式,通过两个有联系的统计指标对比而得到的,其具体数值表现为相对数,一般表现为无名数、通常用系数、倍数、百分数、千分数表示,也可用有名数表示,通常用分子、分母的双重单位计量。相对指标按其作用不同分为六种:结构相对指标:表明总体总某部分占总体的比重,常称为比重指标。结构相对指标=总体某部分/总体全部数值比例相对指标:总体中不同部分数值对比的结果,表明总体内不同部分之间的比例关系。比例相对指标=总体中某部分数值/总体中基准部分数值强度相对指标:两个性质不同又有一定
16、联系的指标对比的结果,表明事物现象的强度、密度、普遍程度等。强度相对指标=某一总体的指标数值/另一有联系的总体指标数值表现形式的特点:大多数情况下,表现为复名数的形式。,有时也用百分数表示。有些强度相对指标可以分子分母互换,形成正指标和逆指标,一般正指标越大越好,逆指标越小越好。动态相对指标:某一指标在不同时间上的数值对比的结果,反映事物现象的发展变化程度。动态相对指标=报告期指标数值/基期指标数值100%比较相对指标:事物现象某项指标在不同空间或不同场合、不同条件的指标数值对比的结果,表明事物发展的不均衡程度或不同条件下的差异程度。比较相对指标:某条件下的某类指标数值/另一条件下同类指标数值
17、计划相对指标:一定时期内实际完成的指标数值与计划任务数值对比的结果,一般用百分数形式表示。计划完成程度相对指标=实际完成指标数值/计划任务数值对于提高率形式:计划完成程度相对指标=(1+实际提高率)/(1+计划提高率) 对于降低率形式:计划完成程度相对指标=(1实际提高率)/(1计划提高率)5、平均指标与标志变异指标(1)平均指标:用来描述静态数列分布集中趋势的综合指标。主要有位置平均数(中 4位数和众数)和数值平均数(算术平均数、调和平均数、几何平均数)。是同质总体中各单位某一数量标志值在一定时间和空间条件下所达到的一般水平的综合指标。特点:通过平均将总体各单位变量值之间的差异抽象化,能反映
18、出总体的综合特征;平均指标能测定次数分布数列汇总各变量值分布的集中趋势;也是质量指标的一种表现形式,其数值大小不随总体范围的大小而增减。平均指标只能就同质总体计算。算术平均数:总体各单位变量值之和除以总体单位的个数所得的结果。简单算术平均数:加权算术平均数:若为组距数列,可用足中指代表各组标志值计算。变量值出现的次数在计算平均数的过程中起权衡轻重的作用,称为权数。也可以用各组次数与总次数之比,即频率(或称比重)来表示。权数对算术平均数的影响在于作为权数的各组次数占总次数比重(即频率)大小。 算术平均数的数学性质:各单位变量值与其算术平均数离差之和等于零。 各单位变量值与其算术平均数离差平方之和
19、为最小调和平均数:变量值倒数的算术平均数的倒数,也称倒数平均数。简单调和平均数:加权调和平均数:调和平均数和算术平均数的变形关系:在社会经济领域中,调和平均数经常作为算术平均数的变形使用,在已知分配数列各组变量值及变量值之和(各组标志总量)的条件下,计算变量值的平均数可采用调和平均数方法。几何平均数:是n个比例乘积的n次方根。常用来计算平均比率或平均速度。 简单几何平均数: 加权几何平均数: 中位数:将总体各单位标志值按大小顺序排列,处于中间位置的那个标志值。,在总体标志值差异很大的情况下,中位数具有较强代表性。一般用Me表示。未分组资料的中位数:用(n+1)/2确定。单项式分组资料的中位数:
20、先根据位置公式 确定位次,根据位次确定所在组,该组的标志值就是中位数。组距式分组资料中位数: L表示中位数所在组下限,U表示中位数所在组上限; 表示所在组的次数; 表示所在组以前各组的累计次数; 表示中位数所在组以后各组的累计次数; 表示各组次数之和;d表示中位数所在组的组距。中位数特点:影响中位数大小的主要因素是数列总次数的大小,而不是变量大小。 众数:总体中出现次数最多的变量值,一般用Mo表示。单项式变量数列的众数为次数最多的变量值。组距数列的众数,先根据数列中各组次数确定众数所在组,计算:下限公式:上限公式:式中, 表示众数, 表示众数所在组的下限, 表示所在组的上限, 表示众数所在组的
21、次数与前一组次数之差; 表示所在组的次数与后一组次数之差; 表示所在组的组距。5根据比重最大的变量值为众数特点:众数不受极端值影响;在组距数列中,各组分布的次数受组距大小影响,所以根据组距数列确定众数时,要保证各组组距必须相等;在一个次数中分布有多个众数称为多重众数,两个众数称为双重众数。算术平均数、中位数和众数间的关系:如果数列对称分布,众数、中位数、算术平均数相等;如果数列左偏分布,如果数列右偏分布,(2)标志变异指标:测定分布数列中总体单位标志值之间变动范围和离散程度的指标,常用的指标由全距、平均差、标准差和标志变异系数(离散系数)等。全距,又称极差。在组距数列条件下,可用数列中最高一组
22、的上限减去最低一组的下限求得。平均差:总体各单位标志值与其算术平均数的离差绝对值的算术平均数,一般用 表示。平均差越大,说明总体各单位标志值分布越分散,平均指标的代表性越差;反之相反。简单平均法:加权平均法:标准差与方差:标准差又称均方差,表示变量值对算术平均数的平均距离。简单平均法:标准差:方差:加权平均法:标准差:方差:标志变异系数:也称标志变动系数或离散系数,指用标志变异指标与其相应的平均指标对比,用来反映总体各单位标志值之间离散程度的相对指标,一般用V表示。它消除了平均水平和计量单位的影响,使不同事物可以直接比较。全距系数:平均差系数:标准差系数:离散系数与平均数的代表性优劣成反方向关
23、系。离散系数大,说明变量值的差异程度大,平均数的代表性差;离散系数小,说明变量值的差异程度小,平均数的代表性强。三、时间数列1、时间数列:一种统计数列,反映将某一现象的统计指标在不同时间上的数值按时间先后顺序排列所形成的数列。又称动态数列。时间数列的作用:了解与预测(1)时间数列的种类按其构成要素中统计指标值得表现形式,分为绝对数时间数列(原始数列)、相对数时间数列(派生数列,各项数值不能直接相加)和平均数时间数列(派生数列)三种。 绝对数时间数列依据指标值得时间特点,分为时期数列和时点数列。时期数列的主要特点:可加性;时期中指标数值的大小与其所属的时期长短有关;采用连续登记方式取得。时点数列
24、的特点:不可加性;指标数值大小与间隔时期长短没有直接联系;通过一次性调查登记取得。(2)时间数列的编制原则:时间的可比性原则统计口径或总体范围的一致性经济内容的一致性计算方法和计算单位的一致性。2、时间数列的分析指标(1)水平指标6发展水平:指客观现象在一定时期相对数或平均数时间数列的平均发展水平分子指标时间数列的平均发展水平分母指标时间数列的平均发展水平 增长量和平均增长量增长量=报告期水平基期水平根据基期的不同确定方法,增长量分为逐期增长量和累计增长量。累计增长量等于相应时期逐期增长量之和。a. 逐期增长量:b. 累计增长量:c. 年距增长量=报告期某月(季)发展水平上年同月(季)的发展水
25、平平均增长量根据逐期增长量和累计增长量的数量关系,平均增长量可表示为: (2)速度指标发展速度:报告期水平与基期水平的比值。分为定基发展速度与环比发展速度。 a. 定基发展速度:说明社会经济现象对于某一基础水平,在一定时期内总的发展速度。b. 环比发展速度:说明所研究现象相邻两个时期(逐期)发展变化的程度。两者之间的数量依存关系:定基发展速度等于相应时期内各环比发展速度的连乘积:两个相邻时期定基发展速度的比率等于相应时期的环比发展速度:c. 年距发展速度=本期发展水平/上年同期发展水平增长速度增长速度=报告期增长量/基期水平=(报告期水平基期水平)/基期水平a. 定基增长速度:b. 环比增长速
26、度:7c. 年距增长速度=年距增长量/上年同期发展水平=年距发展速度1计算发展速度与增长速度时,注意:定基增长速度与环比增长速度不能像定基发展速度那样互相推算,定基增长速度不等于相应时期 k为奇数,直接用公式;k为偶数时,在第一次对原数列做移动平均后,对所得数列再做一次相邻两项的移动平均。 b. 加权移动平均法:对各期指标值进行加权后计算移动平均数。一般计算奇数项加权移动数,各期权数以二项展开式为计算基础,使得中项时期指标值的权数最大。 采用移动平均法形成的派生数列的项数比原时间数列的项数少,奇数时期项数移动,首尾各少(k-1)/2项数值,按偶数时期项数移动,首尾各少k/2项数值。(2)数学模
27、型法:通过对时间数列的观察判断,在确定其性质和特点的基础上,构建一个比较符合原时间数列的数学方程,用来描述该时间数列的长期趋势,并利用其进行分析和预测。常用的有直线趋势模型和曲线模型两类,曲线模型包括指数曲线、二次曲线、Gomperts曲线、Logistic曲线等等。线性趋势模型:现象随时间推移,时间数列的逐期增减量大致相等。 8 通常为了计算方便,把时间数列的中点定为原点,使得t=0,则a、b的求解公式: 指数曲线趋势:若时间数列的环比增长速度大致相当,数学方程为:表明现象每年以b的环比发展速度发展,可先将等式两边取对数,得: 方程简化为:二次曲线趋势(抛物线趋势):若时间数列的指标数值在经
28、过一段时间的逐渐下降后,又逐渐上升,或者反过来,如新产品的试销。数学方程:通常为了计算方便,把时间数列的中间一年定为原点,使得t=0, =0则a、b的求解公式:用最小二乘法求参数a、b、c Gomperts曲线,方程为特点:初期增长缓慢,以后逐渐加快,当达到一定程度后,增长率逐渐下降,最后接近一条水平线,该曲线两端都有渐近线,其上渐近线为Y=K,下渐近线为Y=0,常用于描述事物发展由萌芽、成长、饱和的周期过程。 Logistic曲线,方程: 。描述现象特征与Gomperts曲线类似。 季节因素的测定:通过季节指数来表示各年的季节成分,以此描述各年的季节变动模式,分析步骤是先计算出季节指数,再消
29、除季节指数。季节变动的程度是根据各季节指数与其平均数(100%)的偏差程度测定的。 季节指数=若干年同月(季)平均数/同上若干年总月(季)平均数100%采用移动平均剔除法。具体步骤:计算中心化的移动平均数计算季节比率及其平均数。季节比率:各时期实际值与相应的中心化移动平均数 的比率显示季节变动和随机变动的综合作用: 计算季节指数循环波动及不规则波动的测定 循环波动的测定常用剩余法(古典法):从时间数列中一次或陆续消去趋势变动、季节变动、剩下循环变动因素和不规则波动,然后再将结果进行平滑,尽可能消去不规则成分,其剩余结果即为循环波动值。 不规则变动的测定,通常也用剩余法。四、统计指数1、统计指数
30、的概念及其应用(1)指数:广义的讲,任何两个数值对比形成的相对数都可以称为指数,狭义的讲,指数是用以测定总体各变量在不同场合下,综合变动的一种特殊相对数,狭义说的总体,其单位标志值不能直接加总。本章主要是狭义指数。统计指数的主要性质:相对性、综合性、平均性(2)统计指数的分类:按所反映的9(3)统计指数的作用:指数可综合反映社会经济现象总体的变动方向和变动程度。指数可分析经济发展变化中各种因素的影响方向和程度。2、综合指数及其编制方法(1)综合指数:是总指数的综合形式,他编制、计算的特点是:先综合,后对比。编制要点:将不能直接加总的研究对象,通过一定的方式形成可以加总、对比度而总量指标后进行对
31、比,计算总指数。计算综合指数,用一对比的总量指标一般由两类因素指标构成:一是所要研究其变动的指标,称为指数化的指标;另一类是将不可直接相加的指数化为可以直接相加对比的总量指标的同度量因素。编制综合指数时,必须解决好如下两个问题:确定同度量因素,对复杂总体进行综合。将同度量因素固定在某一时期,消除同度量因素的影响。(2)数量指标综合指数的编制:在计算数量指标综合指数时,以能够使数量指标过渡到可以像假的质量指标为同度量因素,并通常将其固定在基期水平上。计算公式如下: 其中, 我们用数量指标综合指数公式的分子减分母,得两销售额之差,实际上是由于销售量的变动导致的销售额的增加或减少,即: (3)质量指
32、标综合指数的编制:在计算质量指标综合指数时,以能够使质量指标过渡到可以相加的数量指标为同度量因素,并通常将其固定在报告期的水平上。计算公式: 我们用质量指标综合指数公式的分子减分母,得两销售额之差,实际上是由于价格的变动导致的销售额的增加或减少,即: 编制综合指数的一般原则:一般来说,编制质量指标指数,宜采用报告期数量指标为同度量因素;编制数量指标指数,宜采用基期质量指标为同度量因素。(4)拉氏指数将同度量因素固定在基期;派氏指数将同度量因素固定在报告期。 费暄提出用拉氏指数和派氏指数的几何平均数,称为费暄的“理想公式”。3、平均指数的编制方法平均指数是计算总指数的另一种形式,是在个体指数的基
33、础上编制总指数的一种方法,先计算除个体指数,然后对其进行加权平均计算总指数,以测定总体现象的平均变动程度。有两种基本形式:加权算数平均指数和加权调和平均指数。 加权算数平均指数已知数量指标的个体指数 和 时,可将数量指数综合公式变形: 已知质量指标的个体指数 和 时,可将质量指数综合公式变形: 加权调和平均指数10将综合指数变形为加权调和平均指数已知数量指标的个体指数 和 时,可将数量指数综合公式变形: 已知质量指标的个体指数 和 时,可将质量指数综合公式变形: 实际中应用较多的是数量指标指数的加权算数平均变形公式和质量指标的加权调和平均形式公式。因为资料容易得到。用固定权数计算的加权调和平均
34、数固定权数就是用某一时期经过调整后的资料,以比重的形式固定下来,作为权数(W)。 加权算数平均指数=加权调和平均指数= 平均指数与综合指数的关系:区别:综合指数是通过引进同度量因素,先计算总体的总量,然后进行对比,即先综合,后对比;平均指数是在个体指数的基础上计算总指数,即先对比,后综合。综合指数需要研究总体的全面资料,对于综合作用的同度量因素的资料要求也比较严格,一般应采用与指数化指标有明确经济连续的指标,且应一一对应的全面实际资料。而平均指数则适用于全面的资料,也适用于非全面的资料,对资料的要求比较灵活。 联系:在一定的权数条件下,两类指数间有转换关系。由于这种关系的存在,当掌握的资料不能
35、直接用综合指数形式计算时,可用它转换的平均指数形式计算。4、指数体系及其因素分析综合指数体系因素分析指数体系:广义上,指有若干个经济上具有一定联系的指数所构成的一个整体。狭义上,指经济上具有一定联系,且具有一定数量对等关心的三个或三个以上的指数所构成的一个整体,强调了指数间的数量对等关系。(1) 指数因素分析方法种类:按分析对象的范围大小不同分,简单现象因素分析和复杂现象因素分析。 按影响因素多少分,两因素指数分析和多因素指数分析。(2)步骤:确定分析的对象和影响因素确定分析对象指标和影响因素指标,并列处关系式。建立分析指数体系及绝对增减量关系式。分析各因素变动对对象变动的影响。(3)综合指数
36、体系因素分析若分析的对象是复杂总体,应采用反映多项事物综合变动的指数体系,及综合指数体系,表示为: 就绝对增减水平,其关系式为:平均指数体系因素分析实际中比较常用的是基期总量加权的算术平均数量指标和报告期总量加权调和平均质量指数形成的指数体系,表示为: 就绝对增减水平,其关系式为: 5、平均指标指数:是两个不同时期或不同空间的平均指标之比。这里的平均指标不仅包括前面定义的平均指标也包括形式上与平均指标相似的相对指标。平均指标的一般公式:11其中, 表示报告期平均指标数值, 表示基期平均指标数值。在分组条件下,平均指标的数值手各组标志值的大小和各组次数在总体中所占比重大小两个因素的影响,即: (
37、1)平均指标指数体系加权比率:相对数中的结构指标,称构成指标,实质是数量指标,同度量固定在报告期。 各组标志值是质量指标,同度量因素固定在基期。平均指标指数体系按绝对权数形式表现为: 利用指数体系,也可进行平均指标变动绝对数额的分析,即 平均指标指数体系的按相对权数的形式为: (2)综合指数体系和平均指标指数体系的关系综合指数体系是对总指标进行因素分析的表达形式,而平均指标指数体系是对平均指标进行因素分析的表达形式,从分析的目的看,他们是两种不同性质的形式。从运用资料和分析的结构看,二者又有一定的联系。由于两种指数体系分析的目的和资料要求不同,因此运用同一资料,一定分清用哪一种指数体系,否则容
38、易出现计算错误。从通常计算规律看:首先看资料中的数量指标是否能够求和。因为计算平均指标指数必须用数量指标之和为分母,才能求出平均数,然后才能加以对比。在数量指标不能求和的情况下,只能选用综合指标体系。在数量指标能够求和的情况下,需要看分析目的和要求,若果要求对总指标,如总产值、总成本进行因素分析,宜采用综合指数体系;如果对平均指标,如单位成本、平均价格进行因素分析,宜采用平均指标指数体系。6、常用的和重要指数:零售价格指数、消费价格指数、股票价格指数五、抽样与抽样分布1、抽样调查的概念和作用抽样调查又称为概率抽样或随机抽样,与全面调查比,具有节省人力、物力、财力和时间等优点。作用:用于不可能进
39、行全面调查的总体数量特征的推断。用于某些不必进行全面调查的总体数量特征的推断。用于全面调查资料的评价和验证。用于生产过程的质量控制。抽样推断中几个基本概念:总体和样本总体指包括调查对象所有单位的全体,是由具有某种共同性质的许多单位组成的。组成总体的单位叫总体单位。样本:从总体中按随机原则抽取出来的部分单位所组成的集合体。样本中所含样品个数n称为样本容量。参数和统计量12参数:是研究者想要了解的总体的某种特征值。通常我们多关心的参数有:总体平均数、标准差、总体比例等。总体参数是唯一确定的。统计量:就是对样本“加工”,针对不同的统计问题构造一个不含未知参数的样本函数,这样的函数称为统计量。几个常用
40、的统计量样本均值:是样本的算术平均数,反映了总体数学期望的信息。 =样本方差:是样本的平均偏差平方和,反映了总体方差的信息。 =样本的k阶原点距:反映了总体k阶原点距的信息。 =样本的k阶中心距:反映了总体k阶中心距的信息, =样本成数:样本中具有某种属性的单位个数占样本总单位数的比重,反映了总体成数的信息。 =样本均值、样本成数、样本方差称为样本指标,是不确定的随机变量。 重复抽样和不重复抽样按取样方式的不同,分重复抽样和不重复抽样。2、抽样误差(1)抽样误差:指在遵循了随机原则的条件下,不包括登记误差和系统性误差在 表示。抽样平均误差的计算:抽样平均数的平均误差a. 重复抽样条件下,计算公
41、式为:表示抽样平均数的抽样平均误差; 为总体标准差; 表示样本容量。 b. 不重复抽样条件下,计算公式为当总体单位数N很大时,可近似表示为:抽样成数的抽样平均误差a. 重复抽样条件下,计算公式为:表示抽样成数的抽样平均误差; 为总体成数; 表示总体成数的方差; 表示总体成数的标准差。b. 不重复抽样条件下,计算公式为当总体单位数N很大时,可近似表示为:同样条件下,重复抽样和不重复抽样的平均误差相差一个 ,称为校对因子。由于 1,因此同样条件下,不重复抽样的平均误差总是小于重复抽样的平均误差。 总体方差和总体成数未知时,可以用以下方法解决:第一,用样本方差来代替总体方差,即用 代替 ,用样本成数
42、 代替总体成数 。第二,可用过去全 13面调查的资料,也可用过去抽样调查的资料代替。如果有多个不同的材料,则应选择方差数值较大的。第三,用估计数值代替。(3)抽样极限误差涵义:抽样极限误差就是抽样指标与总体指标之间抽样误差的可能范围。我们将这种绝对值表示的抽样误差可能范围称为抽样极限误差,用 表示。 其中, 为抽样平均数的极限误差, 为抽样成数的极限误差, 为样本平均数; 为总体平均数; 为样本成数; 为总体成数。抽样极限误差除以抽样平均误差 得到概率度 。抽样极限误差=概率度抽样平均误差计算:抽样平均数的极限误差a. 重复抽样条件下,计算公式为:b. 不重复抽样条件下,计算公式为当总体单位数
43、N很大时,可近似表示为:抽样成数的抽样极限误差a. 重复抽样条件下,计算公式为:b. 不重复抽样条件下,计算公式为从公式中可知,当t和 (或 )增大时, 也增大;当n增大时, 减少;当t=1时,则 = 即抽样极限误差等于抽样平均误差。概率度t可以理解为抽样误差扩大或缩小的倍数,当t的数值一确定,一方面确定了允许误差的范围,及准确程度的范围;另一方面也确定了可靠程度。概率度t是测量抽样估计可靠程度的一个参数,在 一定时,增大t值, 随之扩大,于是估计的精确度降低,而可靠程度提高了,反之,减少t值, 随之缩小,估计的精确度提高,可靠程度降低。确定概率度t与概率 之间的数值关系,用公式: 计算,其(
44、1)影响样本单位数的几个因素:抽样推断的可靠程度,与概率度t有关,要求可靠程度高,t值也大,抽样的数目要多些。总体方差的大小,即被研究的总体标志的变异程度 和 。若变异程度大,许多抽取一些样本。抽样极限误差 或 的大小。若极限误差小,即允许误差小,需多抽些样本单位。 抽样方式与组织形式。同样条件下,重复抽样许多抽些样本。一般分层抽样和等距抽样可以比纯随机抽样需要的样本单位少,整群抽样比纯随机抽样需要的样本多。 此外,还应该结合调查的人力、物力和财力的具体情况做适当调整。(2)抽样单位数的计算在重复抽样条件下: 14 在不重复抽样条件下: 注意:第一,依上面公式计算的的n是最小的,也是最必要的样
45、本容量。第二,一般总体方差 和 是未知的,在实际计算中往往用有关资料代替。第三,如果进行一次抽样调查,同时对总体平均数和总体成数进行区间估计,运用上面公式计算的 和 一般不等。为了同时满足两个推断的要求,应选择样本容量大的。第四,上面公式的n如果带小数,一般用比这个数大的邻近的整数代替。4、抽样分布(1)三种不同性质的分布总体分布:总体中各元素的观察值所形成的分布。样本分布样本是从总体中所抽取的部分元素的集合。样本中所含的元素个数称为样本容量。如果从总体中抽取一个容量为n的样本,那么这n个观察值的分布就是样本分布。 抽样分布从一般意义上说,抽样分布是指样本统计量的概率分布。如,样本均值的分布、样本比例的分布、样本方差的分布等都称为抽样分布。是一种理论分布。(2)正态分布设随机变量X有分布密度 其中, 为常数,则称X服从以 为参数的正态分布。简记为 。式中 为正态分布的均值, 是他的标准差,图形为一钟型曲线。当 =0, =1时,称X服从标准正态分布,简记为 。(3)几种常见的抽样分布Z统计量:设总体 为样本, 为样本均值,则称为Z统计量。其服从正态分布。 统计量:设总体 为样本,则称是自由度为k的 统计量,记为 。T统计量:设总体