商务统计考试内容总结.docx

资源描述

《商务统计考试内容总结.docx》由会员分享，可在线阅读，更多相关《商务统计考试内容总结.docx（21页珍藏版）》请在三一办公上搜索。

1、商务统计考试内容总结统计学的性质统计活动的内容与阶段对各种数据资料的搜集、整理、分析和推断的活动过程称为统计活动，一项完整的统计活动过程可分为统计资料的搜集整理和统计资料的分析推断两大阶段。统计学的定义与分科统计学就是关于数据资料的搜集、整理、分析和推断的科学。关于统计资料的搜集整理和分析推断的理论与方法构成了统计学的全部内容。理论统计学与应用统计学描述统计学与推断统计学统计学的基本概念总体和个体组成统计活动研究对象的全部事物的全体集合，就称为统计总体，简称总体或母体；而总体中的各个事物则称为个体，总体中个体的数量称为总体容量。 1、自然物体总体与人为划定个体的总体； 2、有

2、限总体与无限总体； 3、具体总体与设想总体。统计指标体系及其设计统计指标体系的定义反映总体及其所含个体的各个方面特征数量的一系列相互联系、相互补充的统计指标所形成的体系，称为统计指标体系。构建统计指标体系的意义指标体系中指标的分类 1、水平指标存量指标与流量指标，实物指标与价值指标。 2、比率指标比例相对指标，比值相对指标，动态相对指标，弹性相对指标，强度相对指标。指标体系设计的内容 1、确定统计指标体系的框架； 2、确定每一个指标的内涵和外延； 3、确定每个统计指标的计量单位； 4、确定每个统计指标的计算方法。指标体系设计的原则 1、目的性原则 2、科学性原则 3、可行性原则

3、4、联系性原则数据采集的方式与程序数据采集根据统计指标体系的要求，对所研究总体中个体的相应指标进行观测记录取得数据的活动过程。数据采集活动的基本要求采集到的数据资料要具有代表性和真实性。所谓代表性，是要求所观测到的样本必须对所研究总体具有代表性；而所谓真实性，则是要求所采集到的数据必须是真实的实际数据。数据采集方式的分类现场调查和试验观测试验观测试验观测设计的原则 1、均衡分散性原则 2、整齐可比性原则试验观测的方法 1、完全随机试验观测 2、随机区组试验观测 3、拉丁方试验观测 4、正交试验观测次数分布的概念次数分布：观测变量的各个不同取值及其出现次数的顺序排列，称为变量的

4、次数分布。总体次数分布和样本次数分布次数分布的作用观测变量的次数分布包含了观测变量取值的全部信息。根据观测变量的次数分布，可以对观测变量的各种分布特征进行描述和分析。次数分布表及其编制次数分布表的种类 1、单值分组次数分布表 2、组距分组次数分布表组距分组次数分布表的编制方法 1、确定组数等距分组的斯特吉斯公式：m=1+3.322lgN 2、确定组距 Max(xi)-Min(xi) 等距分组的参考组距： w=m 3、确定组限 4、计数各组的次数 5、列出次数分布表一、分布中心测度的意义分布中心的概念所谓分布中心，就是指随机变量的一切取值的散布中心。二、分布中心测度指标用来测

5、度随机变量次数分布中心的指标可以有多种，其中在统计分析推断中常用的主要有算术平均数、中位数和众数等几种。算术平均数 1、定义算术平均数又称算术均值，是随机变量的所有观测值总和与观测值个数的比值。 2、计算方法简单算术平均数适用于未分组整理的各个单个观测数值， n其计算公式为： xi x=i=1 n加权算术平均数适用于已分组整理的次数分布数据，其计算公式为：x=xfi=1nniix=xii=1nfi=1ffii算术平均数的变形调和平均数。对于由观测变量的各个分组和各组变量总值顺序排列所形成的分组数据。算术平均数的公式需变换成调和平均数的形式： n mi nx=n x=ni=111当各组的变量

6、总值mi相等时，就可简化为： mixxi=1ii=1i 中位数 1、定义中位数是在按观测变量值的大小顺序排列所形成的变量值数列中点位置上的变量值。对于观测变量x，假设共取得n个观测值，各个观测值按大小顺序排列为x(1)、x(2)、x(n)，则其中位数可定义为： ,n为奇数；xn+12x=1xn+xn,n为偶数。+12222、组距分组次数分布数据的中位数计算 fx=L+2-fLfmwfx=U-2-fU众数 1、定义：众数是随机变量的观测值中出现次数或密度最大的变量观测值。 2、组距分组次数分布数据计算众数 (f0-f-1)x=L+w (f0-f-1)+(f0-f+1) fmw)x=U-(f0

7、-f+1)(f0-f-1)+(f0-f+1)w三、均值、中位数和众数三者之间的关系一、总体参数及其估计量总体指标又称为总体参数，根据样本数据来推断总体指标数值就称为参数估计。集中了样本中有关总体参数信息的样本指标称为统计量，该统计量就可用来估计所求的总体指标的数值。用来估计总体指标数值的统计量又称为该总体指标的估计量，该估计量的数值就称为该总体指标的估计值。总体参数值是确定的，但是未知的；样本估计量是随机变量，其估计值是某个给定样本的计算值。二、构造估计量的方法矩法估计矩法估计的概念所谓矩法估计，概括来说就是用样本矩作为总体同一矩的估计量，用样本矩的函数作为总体相应矩同一函数的估计

8、量。常用的总体参数及其矩法估计量 1n22n=s=(xi-x)21s=x=ximni=1ni=1n1=s=(xi-x)2s=p=n1Pni=1nsxyNn=Nx=xir=r=Nmni=1sxsy三、判断估计量优劣的标准为了保证用于估计总体指标的估计量准确可靠，就必须要求所使用的估计量具备一些优良的性质，这些性质就构成了判断一个估计量优劣的标准。常用的标准主要有一致性、无偏性、有效性、充分性和稳健性等。一致性对于总体指标的一个估计量，若其取值随着样本容量的增大越来越接近于总体指标的真值，即估计误差越来越小的可能性越来越大直至100%，则该估计量就称为总体指标的一致估计量，或称为相合估计

9、量。可以证明，由矩估计法所构造出的估计量都是所估计总体指标的一致估计量。如样本均值是总体均值的一致估计量，样本比例p是总体比例P的一致估计量，样本方差s2也是总体方差2的一致估计量。无偏性对于总体指标的一个估计量，若其估计值的数学期望等于该总体指标的真值，即其估计误差的数学期望为0，则该估计量就称为是总体指标的无偏估计量。可以证明，样本均值是总体均值的无偏估计量，而常规样本方差却并不是总体方差2的无偏估计量，修正样本方差s2是总体方差2的无偏估计量。修正样本方差即无偏样本方差为： 1n2(xi-x)2s= n-1i=1有效性对于任一总体指标，若存在两个无偏估计量，其中一个估计量的估计

10、误差平均来说小于另一个估计量的估计误差，则称前一个估计量比后一个估计量有效。无偏估计量的估计误差大小可用其方差衡量，所以两个无偏估计量比较，方差较小者较为有效。对于一个总体指标来说，若在其所有无偏估计量中能够找到一个估计量，其方差最小，则该估计量就称为是该总体指标的最佳无偏估计量。可以证明，样本均值是总体均值的最佳无偏估计量。对于有偏估计量，衡量其有效性可用均方误差代替方差。估计量的均方误差为： =Eq-q2MSEq 充分性对于一个总体指标，若其估计量提取了样本中包含的有关该总体指标的全部信息，则此估计量就称为该总体指标的充分估计量。在多数情形下，矩法估计给出的总体指标的估计量均是充

11、分的。如在正态分布总体之下，样本均值是总体均值的充分估计量，样本方差s2也是总体方差2的充分估计量。稳健性如果用来估计总体指标的样本估计量对样本数据的污染不敏感，也就是说估计量的数值不受被污染数据的干扰或受其干扰不大，那么该估计量就是总体指标的一个稳健估计量。实践中常用的一种估计总体均值的稳健估计量是切尾均值，切尾均值的计算公式为：四、估计量的标准误标准误的概念样本估计量的标准差通常称为该估计量的标准误差，简称标准误。即： s=Varq=Eq-Eq2 q标准误是衡量一个估计量抽样估计误差大小的一个尺度。标准误的计算 1、样本均值的标准误 ()()()()2、样本比例的标准误影响

12、标准误的因素 1、总体中各个体之间的差异程度。总体中各个体取值之间的差异程度大即2也大，各总体指标估计量的标准误的数值也就大，抽样估计误差也就大。 2、样本容量的大小。样本容量大，总体指标估计量的标准误则小，抽样估计误差也就越小；反之，样本容量越小，抽样估计误差及其标准误也就越大。 3、抽取样本的方式方法。抽样方式方法不同，总体指标估计量的标准误就会不同，抽样估计误差的大小也就不同。七、区间估计的概念八、区间估计的方法均值的区间估计 1、大样本下均值的区间估计由中心极限定理可知，对于大样本而言，样本均值的概率分布总可近似地看作是正态分布。若事先给定置信概率为1-，则查标准正态分布概率数

13、值表，可得标准正态分布的上侧分位数z/2，就可得出总体均值的置信区间为： s ,x-za2n 均值的区间估计 x+za2sn比例的区间估计总体比例是两点分布总体的均值，其估计量样本比例则是来自该总体的随机样本的均值。因此，在大样本条件下，可根据中心极限定理用类似于大样本情形下总体均值区间估计的方法来对总体比例进行区间估计。有： p-za2p(1-p),np+za2p(1-p)n方差的区间估计由抽样分布理论可知，对于来自正态总体的一个简单随机样本，其修正样本方差s2与总体方差2比值的倍服从自由度为的2分布。若给定置信概率1-，查自由度为的2分布表可得两个分位数1-/2和/2，则可得正态总体方

14、差2的置信区间为： (n-1)s2,c2a2(n-1)s2c12-a2单侧置信区间九、样本容量的确定若在给定1-的置信概率之下，要求用样本均值估计总体均值的抽样估计误差不超过，则由总体均值的抽样估计误差限的计算公式，可计算出必需最小样本容量。放回抽样 2zas22 n0=d2 不放回抽样 22zad2n02sn1=2222zad21+n0Nd2+za2s2s1+NN22Nza2s一、假设检验的原理统计假设和检验统计量所谓统计假设，就是关于总体分布特征的某种论断。关于总体参数假设的检验，是假设检验的核心内容。记总体参数为，若要判断是否等于某已知数值0，则该参数假设可表示为： H0:=0

15、， H1:0 其中，假设H0:=0就是所要检验的假设，称为原假设或零假设；而假设H1:0则称为对立假设或备择假设。要检验某个假设是否正确，需根据样本所提供的信息来进行。包含总体分布特征的全部样本信息的样本指标，是进行假设检验的依据，称为检验统计量。显著性水平和拒绝域进行假设检验，概率论中关于小概率事件在一次试验中是不可能事件的原则是其所遵循的基本原则。通常取小概率事件的概率临界值为0.05或0.01，用表示，称为假设检验的显著性水平。 fq /2 /2 0 LUqqq 拒绝域 a2 接受域 a2 拒绝域 ()在原假设成立的条件下，由检验统计量的概率分布，对于给定的显著性水平，就可确定出由

16、抽样误差引起的样本估计值对总体参数原假设值的可能的最大偏离值，作为判断原假设正确与否的临界值。样本估计量偏离总体参数原假设值过大的区域，就是否定原假设的区域，称为否定域或拒绝域，而否定域以外的区域则称为接受域。 1、双侧检验若要检验的假设为： H0:=0， H1:0 则否定域应建立在与原假设值的正负偏离超出给定临界值的两边，这种检验方法称为双侧检验。 2、左侧检验 fq 0 Lqq 拒绝域 a 接受域 ()若要检验的假设为： H0:0， H1:0 则否定域应建立在与原假设值的负偏离超出给定临界值的一边，这种检验方法称为左侧检验。 3、右侧检验 fq 0 Uqq 接受域 a 拒绝域 ()若要检

17、验的假设为： H0:0， H1:0 则否定域应建立在与原假设值的正偏离超出给定临界值的一边，这种检验方法称为右侧检验。二、总体指标假设检验均值的检验 1、单一总体均值的检验 H0:=0，H1:0或0或0 大样本情形正态分布z检验 x-m0z=N(0,1) sn小样本情形t检验 t=x-m0t(n-1)sn均值的检验 2、两总体均值的比较 H0:1=2，H1:12或12或12 大样本情形正态分布z检验 (x-x)-(m1-m2)N(0,1)z=12 2s12s2 + n1n2 小样本情形t检验 (x-x)-(m1-m2)t(n+n-2) t=1212 11s+ n1n2 其中s2为用自由度加

18、权的两样本方差的平均数。单因子数据结构模型假设所考察的因子为A，有m个不同的水平A1，A2，Am。在各个水平下分别进行了n1,n2,nm次独立实验观测，得到变量观测值为yij，i1,2,m，j1,2,ni，则有数据结构模型为： yij=+i+ij；i1,2,m；j1,2,ni. 或者写为： yij=i+ij ；i1,2,m；j1,2,ni. 其中为平均效应，i为因子A的第i个水平Ai对观测变量的作用，称为水平Ai的效应，i=+i为在水平Ai下观测变量的总体平均值，ij仍表示实验观测的随机误差。三、一元线性回归分析散点图设样本观测值分别为(x1 y1)、(x2，y2)、(xn，yn)，

19、在平面直角坐标系内将这n对观测值用n个点表示出来，所形成的图形称为散点图。通过观察散点图的形状,可辅助判断回归函数的具体形式。一元线性回归模型的形式为： y01xu 模型参数的最小二乘估计 1、最小二乘估计的原理所谓最小二乘估计，就是寻找使样本观测模型的随机误差平方和最小的参数值作为回归模型参数的估计值。 2、求一元线性回归模型系数的正规方程组 +bnb01x=y2b0x+b1x=xy3、回归系数的最小二乘估计公式 nxy-xyb= 122()nx-x =y-bxb01 4、样本回归方程 5、残差与残差平方和的计算 -bx j=yj-bej=yj-y01j n Q=e2=y2-by-b+bx

20、=by01j=1j01xy 6、回归模型随机误差的方差的估计 22=ses=长期趋势的测定 1、常用的长期趋势模型 (1)直线趋势模型：T(t)=a+bt (2)指数曲线趋势：T(t)=abt (3)二次曲线趋势：T(t)=a+bt+ct2 (4)修正指数曲线：T(t)=k+abt (5)逻辑曲线模型：T(t)=k/(1+abt) t (6)龚珀茨曲线模型: T(t)=kab (7)双指数曲线模型：T(t)=k+ae-t+be-t 2、趋势模型参数的估计方法 Qn-2 最小二乘法例如，对于直线趋势模型： T(t)=a+bt nty-tyb=2使用最小二乘法可得参数a和b估计值为： nt2-(

21、t) 2、趋势模型参数的估计方法分段总和法例如，对于修正指数曲线趋势模型： T(t)=k+abt 将时间序列等分为三段，各段分别求和，则得方程组为： mm yt=mk+abt1t=1 t2=m2mt yt=mk+ab t=m+1t=m+13m3m yt=mk+abt t=2m+1t=2m+1四、时间序列自回归分析时间序列自回归模型的构建 a=y-bt时间序列自回归模型的构建 3、季度或月份时间序列自回归模型一、统计决策的要素和程序决策的概念针对面临的问题和客观环境，做出某种行动决定的过程，就是决策。如果决策过程中所使用的分析推断方法主要是统计分析推断方法，那么这种决策就被称为统计决策

22、。决策的类型划分 1、确定性决策 2、非确定性决策概率型决策非概率型决策一、统计决策的要素和程序统计决策三要素决策者面对的客观环境具有不确定性，需要使用统计分析推断方法对决策的行动结果进行分析，这是统计决策的主要特征。进行统计决策，必须具有以下三个基本要素。客观环境的可能状态集=i 决策者的可行行动集A=aj 决策行动的收益函数或损失函数收益函数Q(i,aj)或损失函数L(i,aj) 一、统计决策的要素和程序常用的损失函数 1、线性损失函数 k1(q-a),qa;L(q,a)=q-a()Lq,a= k2(a-q),qa. 2、平方误差损失函数 L(q,a)=(q-a)2L(q,a

23、)=w(q)(q-a)2一、统计决策的要素和程序收益矩阵表和损失矩阵表当客观环境的状态集和决策者的行动集都只包含有限个元素时，决策行动的收益函数或损失函数也可用收益矩阵表和损失矩阵表来表示。表10.1 决策行动的损失矩阵表客观状态 1 2 n 行动方案 a1 a2 am L11 L12 L1m L21 L22 L2m Ln1 Ln2 Lnm 统计决策的程序一个完整的统计决策过程包括有下列四个步骤：确定决策目标拟定各种可行的行动方案通过比较分析选出最佳的行动方案决策的执行统计决策的这四个步骤，又分别称为统计决策的参谋活动阶段，设计活动阶段，抉择活动阶段和任务执行阶段。四、后

24、验概率型决策后验概率型决策的概念决策者事先对客观环境各种可能状态的概率分布的估计或判断，就是先验概率分布，而通过样本调查观测所取得的有关客观环境的信息，就是样本信息，根据样本信息对原有的先验概率分布加以修正，所得到的修正后的有关客观环境各种可能状态出现的概率分布，称为后验概率分布。后验概率分布既包含了先验概率分布中有关客观环境可能状态的信息，也综合了样本中这方面的信息。因此，利用客观环境可能状态的后验概率分布进行决策，必然会使决策的可靠性更高，效果更佳。利用后验概率分布进行的决策，也称为贝叶斯决策。后验概率分布的计算假设客观环境共有种可能的状态，第i种可能状态记为i，该状态出现的先验概率记为(Ai)，在该状态出现的条件之下事件B发生的概率记为P(B/Ai)，则由概率论中的贝叶斯法则可知，在观察到事件B发生的条件下，客观状态Ai出现的概率即后验概率为： P(Ai)P(BAi) P(AB)=iP(A)P(BA)jjj=1n

展开阅读全文