2023统计中级职称考试统计方法复习要点详解.docx

资源描述

《2023统计中级职称考试统计方法复习要点详解.docx》由会员分享，可在线阅读，更多相关《2023统计中级职称考试统计方法复习要点详解.docx（15页珍藏版）》请在三一办公上搜索。

1、作为统计探讨的主要资料，数值型数据的特征在于它们都是以数值的形式出现的，有些数值型数据只可以计算数据之间的肯定差（肯定距离），而有些数值型数据不仅可以计算数据之间的肯定差，还可以计算数据之间的相对差（相对距离）。明显，数值型数据的计量功能要远大于前面介绍的两种定性数据，其计量精度也远远高于定性数据。因此，在统计探讨中，数值型数据有着最广泛的用途。2.观测数据和试验数据观测数据是对客观现象进行实地观测所取得的数据，在数据取得的过程中一般没有人为的限制和条件约束。在社会经济问题探讨中，观测是取得数据最主要的方法。试验数据一般是在科学试验环境下取得的数据。在试验中，试验环境是受到严格限制的，数据的产

2、生肯定是某一约束条件下的结果。自然科学探讨中所用的数据多为试验数据。三、数据的来源从运用者的角座看。统计数据资料的来源主要有两种渠道：一种是通过干脆的调查或试验获得的原始数据，这是统计数据的干脆来源，一般称之为原始或第一手统计数据；另一种是别人调查的数据，并将这些数据进行加工和汇总后公布的数据，通常称之为次级数据或其次手间接的统计数据.一切间接的统计数据都是从原始的、第一手数据过渡而来的。1.原始数据。搜集数据最基本的形式就是进行统计调查或进行试验活动，统计调查或进行试验就是统计数据的干脆来源。统计调查是指依据统计探讨预定的目的、要求和任务，运用科学的方法，有安排、有组织地向容观实际搜集资料的

3、过程。通过统计调查得到的数据，一般称为观测数据。试验法是通过试验法得到的数据就是试验数据。运用试验法要留意的是，首先，试验组和比照组的产生应当是随机的，探讨对象的不同单位应当被随机地安排到试验组或比照组，而不应是经过有意识的选择的。其次，试验组和比照组还应当是匹配的，也就是探讨对象的背景资料应当是大体相同的，至少不要差异太大。不论是统计调查还是试验，所搜集的数据都是原始数据，这是统第一章统计和数据复习要点一、基本含义1 .统计就是用来处理数据的，它是关于数据的一门学问。2 .统计学是用以收集数据，分析数据和由数据得出结论的一组概念、原则和方法。统计分析数据的方法大体上可分为描述统计和推断统计两

4、大类。描述统计星探讨数据搜集、处理和描述的统计学方法。其内容包括如何取得探讨所须要的数据。如何用图表形式对数据进行处理和展示，如何通过对数据的综合、概括与分析，得出所关切的数据特征。推断统计则是探讨如何利用样本数据来推断总体特征的统计学方法，内容包括参数估计和假设检验两大类。3 .统计的应用。几乎全部的领域都应用统计，但是在应用中应留意辨别被误用与滥用的现象。二、数据类型统计数据是对客观现象特征的反映，而由于客观现象的困难性，在反映这些现象特征时可从不同的角度进行采集，从而得到不同类型的数据。1.定性变量(数据)与定量变量(数据)(1)定性变量的视察结果称为定性数据。这类数据的最大特点是它只能

5、反映现象的属性特点，而不能说明详细量的大小和差异，只有分类特征，没有量的特征；这种只能反映现象分类特征的变量又称为分类变量，分类变量的视察结果就是分类数据。假如类别具有肯定的依次，这样的变量称为依次变量，相应的视察结果就是依次数据。分类变量没有数值特征，所以不能对其数据进行数学运算。由此可见，定性数据只能用来区分事物，而不能用来表明事物之间的大小、优劣关系。依次变量比分类变量向前进了一步，它不仅能用来区分客观现象的不同类别，而且还可以表明现象之间的大小、凹凸、优劣关系。明显，依次数据的功能比分类数据要强一些，对事物的划分也更精细了一些。(2)具有明确的数值含义，不仅能分类而且能测量出来详细大小

6、和差异的变量就是定量变量，也称为数值变量，定量变量的视察结果成为定量数据。料对调查对象的总体的数量特征进行推断，从而达到对调查总体的相识。第三，在抽样调查中会存在抽样误差，但是这个误差可以事先计算并加以限制。抽样调查既能节约人力、物力、财力，又可以提高资料的时效性，而且能取得比较正确的全面统计资料，具有很多优点。抽样调查是一种非全面的、一次性的或常常性的特地调查，这种调查方法在市场经济条件下，运用特别广泛。抽样两种主要方法：概率抽样和非概率抽样。概率抽样是依据一个已知的概率随机选取被调查者。常用的概率抽样形式有：简洁随机抽样、分层抽样、整群抽样和系统抽样。非概率抽样是没有完全依据随机原则选取样

7、本单位。3 .统计报表统计报表是依据国家统一规定的调查要求与文件（指标、表格膨式、计算方法等）自下而上地供应统计资料的一种调查方式。依据报送范围，统计报表分为全面报表和非全面报表。全面报表要求调查对象种的每一个单位均要填报，非全面报表则只要求一部分调查单位填报；依据报送周期，统计报表主要有月报、季报、年报组成，月报内容简洁，时效性强，年报则内容比较全面。统计报表的内容包括表式和填表说明。4 .重点调查：是在调查对象中选择一部分重点单位进行的一种非全面调查。这些重点单位虽然数目不多，但它们具有所探讨现象的总量在总体总量中占据绝大部分的特点。5 .典型调查：是一种非全面的特地调查，它是依据调查的目

8、的与要求，在对被调查对象进行全面分析的基础上，有意识地选择若干具有典型意义的或有代表性的单位进行的调查。其次章数据描述复习要点本章重点介绍如何简洁地利用统计图表和少数数据来概1括某些事物的基本特征。一、定性数据的图表展示定性效据包括分类数据和依次数据，通常可以用频数分布表和图形来描述。1.生成频数分布表定性数据本身就是对事物的一种分类，因此，只要先把全部的类计数据最基本的来源。2.次级数据。次级数据(其次手数据)是指由其他人搜集和整理得到的统计数据，这种自他人调查整理基础上的数据我们把它称为数据的间接来源。数据的间接来源常用的有以下一些：公开出版的统计数据，主要来自正式的统计部门和政府、组织、

9、学校、科研机构。尚未公开发表的统计数据，如各企业的经营报表数据、专业调查询问机构未公开发布的调查结果数据。须要留意的是，假如公开引用未公开发表的数据须要征得数据全部者的同意，同时要为自己发布的数据负责。在应用时要留意：是否了解并正确理解了间接数据中变量的含义、计算口径、计算方法，以防止误用、错用他人的数据。引用间接数据时要注明数据来源，敬重他人的劳动成果和学问产权。四、统计调查统计调查是依据调查的目的与要求，运用科学的调查方法，有安排、有组织地搜集统计数据资料的过程。1 .普查是特地组织的一次性的全面调查，用来调查属于肯定时点上或肯定时期内的社会现象总量。它适于搜集某些不能或不相宜于定期的全面

10、统计报表搜集的统计资料，以摸清重大的国情、国力。普查的特点为：它是一种全面调查，具有资料包括范围全面、详尽、系统的优点；它是一次性的特地调查，因为普查的工作量大，耗资也多，时间周期较长，一般不宜常常实行。目前，我国通过普查进行的统计调查内容和时间周期已经规范化、制度化，详细包括：(1)人口普查。每10年进行一次，逢”0”的年份进行；(2)农业普查，每IO年进行一次，逢“7”的年份进行；(3)经济普查，2023年进行了中国第一次经济普查。2 .抽样调查抽样调查是一种非全面调查，它是依据随机原则从总体中抽取一部分单位作为样本进行视察探讨，以抽样样本的指标去推算总体指标的一种调查。随机原则要求全部调

11、查单位都有肯定的概,率被抽取。抽样调查具有的特点：第一，样本单位按随机原则抽取，解除了主观因素对选取样本单位的影响。其次，能够依据部分调查的实际资(3)散点图：散点图也可以反映两个变量的关系。应特殊留意各种图表的生成方式和运用。三、用统计表来表示数据统计表是一种用密集的形式归纳数据的方法。它主要是利用行和列中的数据来表述现象特征。人们利用统计表主要出于两种目的：一是在文章中运用它以支持自己的观点：二是利用它组织数据。统计表一般由五个部分组成，即表头、行标题；列标题、数字资料和表外附加构成。表头应当放在表的上方，它说明的是表的主要内容；行标题和列标题一般放在表的第一行和第一列，它表示的是所探讨的

12、问题类别的名称和指标名称：表的其余部分是详细的数字资料：表外附加通常放在统计表的下方，用来说明资料来源、指标注释和必要的说明等内容。通常状况下，统计表的左右两边不能封口。四、用数字来概括数据针对一组数据的分布特征，可以从两个方面来考查它：一是该组数据的集中趁机，即该组数据的数值向其中心值的靠拢程度。二是该组数据的离散程度，它反映的是该组数据的各个数值远离其中心值的趋势和程度。这两个方面反映了数据分布特征的不同侧面，从不同视角来分析统计数据，以达到分析和运用统计数据的目的。1 .定性数据的数字特征对定性数据的集中趋势常用的方法就是计算比例、百分比、中位数和众数。中位数，是数据依据大小排列之后位于

13、中间的那个数(假如样本重为奇数)，或者中间两个数目的平均(假如样本重为偶数)。众数，就是数据中出现次教或出现频率最多的数值，在定性数据中，由于记录的是频数，因此众数用得多些。2 .定量数据的数字特征常用的反映定量数据特征的统计量有：反映数据集中趁机的水平度量：平均数、中位数、众数和分位数等；反映数据离散程度的差异度量：极差、四分位差、标准差和方差。(1)水平的度量别都列出来，然后统计出每一类别的频数，就得到一张频数分布表。频数分布表中落在某一特定类别的数据个数称为频数。通过频数分布可以视察不同类型数据的分布状况O留意运用Excel生成频数分布表的过程。3 .定性数据的图形表示(1)饼图：又称圆

14、饼图、圆形图等，它是利用圆形及圆内扇形面积来表示数值大小的图形。饼图主要用于总体中各组成部分所占比重的探讨。(2)条形图：条形图是用宽度相同的条形的高度或长度来表述数据多少的图形，用于视察不同类别数据的多少或分布状况.绘制时，各类别可以放在纵抽，也可以故在横轴。(3)环形图：环形图可以用来比较不同变量之间的结构差异。二、定量数据用图表展示.1.生成频数分布表生成定量数据的频数分布表时，首先，要对数据进行分组。以能够适当视察数据的分布特征为准。一般的分组个数在575之间。其次，要确定组距。所谓组距是指每个组变量值中的最大值与最小值之差。若将最大值称为上限，最小值称为下限，则组距等于上限与下限之差

15、，即”组距=上限一下限”。确定组距，一是要考虑各组的划分是否能区分总体肉部各个组成部分的性质差别，二是要能精确地清楚地反映总体单位的分布特征。在确定组距时，在探讨的现象变动比较匀称的状况下，可以采纳等距分组；而当探讨的现象变动很不匀称时，一般采纳不等距分组。最终，统计出各组的频数及频数分布表。在统计各组频数时，恰好等于某一组的组限时，则实行上限不在内的原则，即将该频数计算在与下限相同的组内。2o定量数据的图形表示(1)直方图：用横坐标代袁变量分组，纵坐标代表各变量值出现的频数，这样，各组与相应的频数就形成了一个矩形，即直方同。(2)折线图：折线图是利用线段的升降来说明显向变动的一种统计图，它主

16、要朋于表示现象在现象的安排状况、现象在时间上的改变和两个现象之间的依存关系等。要样本容量n足够大（通常要求n230）,样本均值仍会接近正态分布。假如总体不是正态分布，当n为小样本时（通常n30）,样本均值的分布则不听从正态分布。（2）样本比例的抽样分布比例是指具有某种属性的单位占全部单位数的比重。总体比例（通常用n表示）是总体中具有某种属性的单位数占全部总体单位数的比例，是一个参数，通常是未知的。样本比例（通常用P表示）是随机抽取的样本中具有某种属性的单位数占样本全部单位数的比例，是一个样本统计量，是随机变量，是可以视察到的。样本比例的抽样分布，是描述全部可能样本比例的概率分布。当样本容量比较

17、大时，样本比例P近似听从正态分布，在重置抽样时，P的分布为77(1-Tr)在不重置抽样时，P的分布为pITr（I-Tr）加一NmnN-I）一般讲，当np5,n（1-P）25时，就可以认为样本容量足够大。随着样本容量的增大，样本比例的方差愈来愈小。3.统计量的标准误差统计量的标准误差也称为标准误，是指样本统计量分布的标准差。可用于衡量样本统计量的离散程度。在参数估计中，它是用于衡量样本统计量与总体参数之间差距的一个重要尺度。样本均值的标准误计算公式为F样本比例的标准误计算公式为%=尸守二、参数估计参数估计就是用样本统计量去倍计总体的参数。用样本统计量来估计总体参数有两种方法：点估计和区间估计1

18、.点估计与区间估计点估计，是用样本统计量的实现值来近似相应的总体参数。区间估计，是依据估计牢靠程度的要求，利用随机抽取的样本的统计量值确定能够覆盖总体参数的可能区间的一种估计方法。以68.73%的置信水平推断总体参数肛的置信区间为平均数也称为均值，是把某一组数据进行算术平均，用以表述某一事物的平均水平，它在统计中叫做均值。留意简洁平均数和加权平均数的应用。中位数和众数的应用比较简洁，结合前边概念学习即可。(2)差异的度量极差又称全距，是一组数据中最夫的标记值和最小的标记值之差。它的特点是简洁直观，但是简洁受数据中极端值的影响，因此，不能精确地描述数据的分散程度。方差是将各个变量值和其均值离差平

19、方的品军数，它反映了样本中各个观测值到其均值的平均离散程度。标准差是方差的平方根，它更具量纲性，而且与变量值的计量单位相同，运用的范同更广泛。离散系数也称为便变异系数、标准差系数，足将一组数据的标准差除以其均值，用来测度离散程度的相对数。标准分数也称作标准化值或Z分数，是变量值与其平均数的离差除以标准差后的值，用以测定某一数据在该组数据中的相对位置。第三章参数估计复习要点一、抽样分布1 .总体分布与总体参数总体分布是总体中全部视察值所形成的分布。总体参数是对总体特征的某个括性的度量。通常有总体平均数()、总体方差(。2)、总体比例()等。2 .统计量与抽样分布统计量是依据样本数据计算的用于推断

20、总体的某些量，是对样本特征的某个概括性度量。统计量是样本的函数.如样本均值、样本方差(s2)、样本比例(P)等。构成统计量的函数中不能包括未知因素。抽样分布是样本统计量所形成的概I率分布，如样本均值的分布、样本比例的分布等。抽样分布是一种理论分布。抽样分布构成了推断总体参数的理论基础。依据统计量来推断总体参数具有某种不确定性。不同的样本可以计算出不同的统计量值。(1)样本均值的抽样分布当总体听从正态分布时，样本均值肯定听从正态分布，即有XN(,-呻2)X若总体为未知的非正态分布时，只一的置信水平下，总体比例的置信区间为(1-Tr)在大样本条件下.当总体比例未知时，在1一a的置信水平下，总体比例

21、的置信区间为IP(1-P)总体比例的置信区间是由样本比例和估计误差两部分组成的。三、样本量的确定在进行参数估计时，样本量要适当。样本量过大会增加调查费用，花费更多的人力；样本量过小，样本没有足够的代表性，统计量的标准误差会增大，对总体参数的估计会不精确。1 .估计总体均值时样本量的确定在重置抽样条件下，设E代表允许的估计误差，则样本量计算公式为：匕假如总体标准差盯未知，可以用样本标准差S来代替；也可以用试验调查的方法，选择一个初始样本，以该样本的标准差S作为总体标准差盯的估计值。样本量与置信水平成正比，与总体方差成正比，与允许的估计误差的平方成反比。2 .估计总体比例时样本量的确定在重置抽样条

22、件下。设E代表允许的估计误差，则样本量计算公式为：(ZS)2(1-7T).WV.1b_一一-，一E2样本量越大，估计误差就越小，估计的精度就越高。估计洪差由运用者预先确定。大多数状况下，估计误差的取值一般应小于0.1o假如总体比例n的值不知道，可以用样本比例S来代替，或者取TT=0.5,使得(1一)达到最大。第六章时间序列分析复习要点一、时间序列分析的基本概念时间序列是指反映社会、经济、自然现象的数据按时间先后依次记录行成的数列。时间序列分析是对肯定时间间隔(如1年分为I2个月，或I年分为4个季度、或1年)所发生的行为(如每月产品销售额、某地区居以95. 45%的置信水平推断总体参数肛的置信

23、区间为以99.73%的置信水平推断总体参数肛的置信区间为卜-。+Z)2.评价估计量的标准无偏性，是指估计量抽样分布的期望值等于被估计的总体参数。无偏估计量的定义。设总体参数为0,所选择的估AA%A%计量为9假如e)=则称为的无偏估计量。X,P,s2分别是总体均值、总体比例、总体方差的无偏估计量。有效性，是指估计量的方差尽可能小。有效估计量的定义。对同一个总体参数的两个无偏估计量，有更小方差的估计量更有效。有效估计量。一样性，是指随着样本量的增大，点估计量的值越来越接近被估计总体的参数。一样估计量。样本均值是总体均值的一个一样估计量。3.一个总体均值的区间估计，在对总体均值进行区间估计时，须要考

24、虑总体是否为正态分布、总体方差是否已知，用于估计的样本是大样本还是小样本等状况。(1)大样本的估计大样本(n30)状况下，当总体方差。2已知时，总体均值在1a置信水平下的置信区间为(-.%a2L,%+zaz2大样本状况下，当总体方差。2未知时，总体均值U在1-a置信水平下的置信区间为1%-Z2,%+Z2(2)小样本的估计小样本(n30)状况下，当正态总体的方差。2已知时，总体均值在1一置信水平下的置信区间I-%-Zaz2-4+Zs7【几11为小样本(n三拉氏物量指数IL一*nn派氏指数：主见不论是物价指数还是物量指数都采纳报告期作为权数的指数，编制方法：派氏物价指数f、*,派氏物量指数（A/,

25、）=E拉氏指数主要受基期商品（产品）结构的影响，派氏指数主要受报告期商品（产品）结构的影响。在实际应用中，由于派氏指数要求每期更换权数资料，计算比较麻烦，而拉氏指数的权数固定在基期，在编制长期连续性指数数列时比较便利，因此，拉氏指数更得到普遍应用。但是从实际意义上看，派氏物量指数的说明更符合现实意义。三、几种常用的价格指数1 .居民消费价格指数居民消费价格指数是就居民购买消费品和服务的价格改变编制物价指数，反映其对应的价格水平变动T=abt式中：T表示时间数列的长期趋势；t表示时间数列中指标所属的时间；a、b为待定参数O参数a、b的确定可以用最小二乘法进_行估K-Ai计。*f2 .简洁移动平均

26、法移动平均法是将时间数列的数据逐项移动，依次计算包含肯定期数的序时平均数，形成一个新的时间数列的方法。通过这种移动，它消弱或消退了短期偶然性因素的影响，从而显示出现象发展的基本趋势。采纳移动平均法分析时间数列的长期趋势，关键在于平均期数或称步长的选择。一般地讲，被平均的项数越多，修匀的作用就越大，但得到的平均数就越少；反之，被平均的项数越少，修匀的作用就越小，而所得的移动平均数就越多。3 .指数平滑法指数平滑法是对时间数列由近及远实行具有逐步衰减性质的加权处理，对移动平均法做了改进。一次指数平滑也称简洁指数平滑，其公式为：St+1=xt+（1a）St其中，St表示第t期的一次指数平滑值；Xt表

27、示第t期的观测值；a表示平滑系数，0a1运用指数平滑法的关键是确定一个合适的平滑系数a.因为不同的平滑系数a对预料结果有干脆影响。a取值越接近1时，近期数据作用最大，各期历史数据的作用快速减弱。实际应用中a的大小须要反复比较确定，确定的依据是a的取值要使计算得到的各期预料值与实际视察值之间的误差达到最小。五、季节变动分析方法季节变动分析的方法很多，主要有：一是不考虑长期趋势的季节指数法；二是考虑长期趋势的回来方程法消退法。1.不考虑长期趋势一季节指数法季节指数法是一种通过计算各月（或季）的季节指数（又称季节比率），来反映季节变动的一种分析方法。季节比率的计算方法是：首先计算出各年同期发展水平的

28、序时平均数，然后将各年同期平均数与全时期总平均数对比即得到季节比率。这种计算方法有两个缺陷，第一，没有考虑长期趋势的影响；其次，季节比率的凹凸受各年数值大小的影响。程度。这种价格指数的编制方法是实际工资=名义工资(现价工资)在众多计量对象中选择代表品，就/消费价格指数这些代表品采集价格数据、计算平均价格和个体物价指数，而后运用加权平均方法逐级计算类价格指数，直至总价格指数。居民消费价格指数的作用：(1)反映城乡居民所购买的生活消费品价格和服务项目价格的变动趋势和程度；(2)反映通货膨胀状况。通货膨胀的严峻程度是用通货膨胀率来反映的，它说明白肯定时期内商品价格持续上升的幅度。通货膨胀率一般以居民消费价格指数来表示。计算公式为：通货膨胀率=报告明虫退Ift蜕削?拉嬖二基期期居民消费价*指数刃星L0外费险机指数(3)反映货币购买力变动。货币购买力是指单位货币能够购买到的消费品和服务，的数量。居民消费价格指数上涨，货币购买力则下降，反之则上升，因此，居民消费价格指数的倒数就是货币购买力指数。(4)反映对职工实际工资的影响。利用消费价格指数可以将名义工资转化为实际工资。计算公式为：

展开阅读全文