经济应用统计学-第五章综合指标分析.ppt

上传人:牧羊曲112 文档编号:6331862 上传时间:2023-10-17 格式:PPT 页数:194 大小:2.62MB
返回 下载 相关 举报
经济应用统计学-第五章综合指标分析.ppt_第1页
第1页 / 共194页
经济应用统计学-第五章综合指标分析.ppt_第2页
第2页 / 共194页
经济应用统计学-第五章综合指标分析.ppt_第3页
第3页 / 共194页
经济应用统计学-第五章综合指标分析.ppt_第4页
第4页 / 共194页
经济应用统计学-第五章综合指标分析.ppt_第5页
第5页 / 共194页
点击查看更多>>
资源描述

《经济应用统计学-第五章综合指标分析.ppt》由会员分享,可在线阅读,更多相关《经济应用统计学-第五章综合指标分析.ppt(194页珍藏版)》请在三一办公上搜索。

1、第五章 综合指标分析,学习目标,总量指标的特点、种类和局限性各种相对指标的特点、作用及计算方法各种平均指标的计算与应用各种标志变异度指标的计算与应用,主要内容,第一节 总量指标分析第二节 相对指标分析第三节 平均指标分析第四节 变异度指标分析第五节 偏度和峰度指标分析,第一节 总量指标分析,第一节 总量指标分析,一、总量指标的概念和特点二、总量指标的种类三、总量指标的计量单位四、国民经济分析中的几个主要总量指标五、总量指标的作用和局限性,总量指标是反映社会经济现象总规模、总水平和工作总量的统计指标。也称绝对数指标,简称绝对数。,一、总量指标的概念和特点,总量指标的概念,总量指标的特点,数字形式

2、为绝对数,数值大小与总体范围大小直接相关。,表现形式:总量的绝对数;总量间的差数或和数(减少额或增加额),二、总量指标的种类,总体单位总量,按其反映内容不同划分,总体标志总量,总体内所有单位个数的总和,总体内各单位某一数量标志的标志值之和,一个总体中只有一个总体单位总量,但可以有多个标志总量,它们由总体单位的数量标志值汇总而来。,举 例,学生的数量标志:年龄、身高、体重、考试分数、生活费支出等等则学生总体的标志总量:?,总体单位总量为?,以某一班级为总体,以某一班级为总体,总年龄、总身高、总体重、考试总分数、生活费总支出等等,时期指标,时点指标,反映某种社会经济现象在一段时期内的活动过程中所取

3、得或实现的累计总量。,反映社会经济现象在某一时点上所实现或达到的总量指标。,按其反映时间状况不同划分,举 例,出生人数,人口总数,死亡人数,关于一个人口总体的总量指标,时期指标,时点指标,时期指标与时点指标的特点,不同时期的指标数值具有可加性,相加后可得更长时期内的总规模。,第一年 第二年 两年内,时期指标与时点指标的特点,不同时点指标数值不具有可加性,相加后有大量重复,无实际意义。,第一年年末 第二年年末,时期指标与时点指标的特点,时期指标数值与时间长短有直接关系,一般时期越长,数值越大。,一年 两年内,时期指标与时点指标的特点,时点指标数值大小与其时间间隔长短无直接关系。,第一年年末 第二

4、年年末 第三年年末,三、总量指标的计量单位,实物单位,实物量指标单位,标准实物单位,复合单位,度量衡单位,自然单位,按对象的自然状况来度量数量的单位,按统一度量衡制度的规定来度量数量的单位,两种计量单位结合使用,按统一折算的标准来度量数量的单位,人,辆,公斤,千瓦小时,马力,三、总量指标的计量单位,自然单位度量衡单位复合单位标准实物单位,按对象的自然状况来度量数量的单位,按统一度量衡制度的规定来度量数量的单位,两种计量单位结合使用,按统一折算的标准来度量数量的单位,实物单位,价值单位,劳动单位,以货币单位计量的统计指标,以劳动单位即工日、工时等劳动时间计量的统计指标,四、国民经济分析中的几个主

5、要总量指标,社会总产品:以货币单位表现的一个国家或地区在一定时期内全部生产活动的总成果。增加值:企事业或部门在一定时期内从事各种生产经营活动所取得的最终成果。=总产出-中间消耗国内生产总值(GDP):一个国家(或地区)所有常住单位在一定时期内生产的最终成果之和。国内生产净值:一国(或地区)在一定时期新创造的全部价值=GDP-固定资产折旧,不同规模总体进行对比时,总量指标往往缺乏可比性。,五、总量指标的作用和局限性,作用:它是认识事物的起点;它是决策和管理的依据;它是其他指标的计算基础;,局限性,总量是最明显的数量特征,在任何情况下都是首先为人们所感受和认识的数量。,中国:960万平方公里国土1

6、3亿人口山地占国土面积的33%男性占人口比重的51%,总量是最基本的国情国力指标,作用,第二节 相对指标分析,第二节 相对指标分析,一、相对指标的概念及作用二、相对指标的表现形式三、相对指标的种类及计算方法,又称相对数,是两个性质相同或互有联系的指标数值之比,即用对比方法来反映相关事物之间数量联系程度的指标。,相对指标,用来反映总体现象的各种数量对比关系,以深入认识社会经济现象的不同数量特征。使不能直接对比的现象找到共同的比较基础;,相对指标的作用:,一、相对指标的概念和作用,对比的基础:对比双方为同类事物,性质、形态、计量单位相同或互有联系 人口数和区域面积,对比的计算方法:相除计算,举 例

7、,总人数30人男生人数20人女生人数10人男生比重为2/3女生比重为1/3男女比例为2:1,总量指标,相对指标,甲企业,乙企业,利润总额,资金占用,资金利润率,500万元,5000万元,3000万元,40000万元,16.7%,12.5%,当比较两厂经济效益时,不可比,不可比,可比,用倍数、系数、成数、等表示,用双重计量单位表示的复名数,如人/平方公里,成数应当用整数的形式来表述3成、近7成8.6成,二、相对指标的表现形式,2、结构相对指标,3、比例相对指标,4、比较相对指标,1、计划完成程度相对指标,6、强度相对指标,5、动态相对指标,三、相对指标的种类,概念:又称计划完成相对数,是现象在某

8、一段时间内的实际完成数与计划数之比,表明计划的完成程度,一般用百分数表示,故又称计划完成百分比。作用:检查、监督计划执行情况。,1、计划完成程度相对指标,分子分母在指标涵义、计算口径、计算方法、计量单位及时间长短和空间范围要一致,=,例如:,某企业2004年产品产量计划为1500吨,实际生产2000吨,则:,该企业超额33%完成了预期目标,实际比计划多生产了500吨。,由于计划完成数的表现形式不同,计划完成情况相对指标在形式上也各有所异。计划完成数为绝对数计划完成数为相对数计划完成数为平均数,指标根据下达计划任务时期的长短和计划任务数值的表现形式不同,而有多种计算方法,实际应用时需注意区别。,

9、例:某企业2004年工业增加值计划为4000万元,实际完成4200万元。,绝对数,短期计划,A.计划完成数表现为绝对数时,一般用于考核社会经济现象总规模、总水平或工作总量的计划完成情况,如工业增加值。,例:某企业2005年5月某产品的单位成本计划为50元,实际实现的单位成本为45元。,平均数,B.计划完成数表现为平均数时,一般用于考核用平均水平表示的技术经济指标的计划完成情况,如单位成本。,例:己知某厂2005年的计划要求年劳动生产率达到50000元/人,产品单位成本为100元/件;而实际年劳动生产率达到55000元/人,产品单位成本为90元/件。则,例:某企业2005年第一季度计划商品流通费

10、用率为3%,实际商品流通费用率为3.4%。,相对数,C.计划完成数表现为相对数时,(C1)计划完成数是要完成的百分比,(C2)计划完成数规定的是降低率或提高率,例:己知某厂2005年的计划规定产品产值提高5,单位成本计划降低5%;而实际产品产值提高了7,单位成本降低了3%。则,长期计划(如五年计划)由于计划中所规定的指标性质不同,其表示方法也不同。一种是水平表示法,一种是累计表示法。因此,产生了长期计划执行情况检查的水平法和累计法。期末水平应达到某水平 水平法 计划期内累计量应达到某水平累计法,长期计划,如果计划任务规定的是计划期最末一年应达到的水平,检查该计划完成情况用水平法。,水平法,例:

11、某自行车厂计划“九五”末期达到年产自行车120万辆的产量,实际完成情况为:,其中,最后两年各月份实际产量为(单位:万辆):,要求计算:该厂“九五”期间产量计划的完成程度;提前完成计划的时间。,=120,提前完成计划时间:因为自1999年3月起至2000年2月底连续12个月的时间内该厂自行车的实际产量已达到120万辆119+10.19.6+(10.19.6)=120,即已完成计划任务,提前完成计划10个月。,如果计划任务规定的是整个计划期内累计达到的水平,检查该计划完成情况用累计法。,累计法,例:某市计划“九五”期间要完成社会固定资产投资总额60亿元,计划任务的实际完成情况为:,其中,2000年

12、各月份实际完成情况为(单位:亿元):,要求计算:该市“九五”期间固定资产投资计划的完成程度;提前完成计划的时间。,提前完成计划时间:因为到2000年10月底已完成固定资产累计投资额60亿元(61.70.80.9=60),即已完成计划任务,提前完成计划两个月。,结构相对指标是在对总体分组的基础上,以总体总量作为比较标准,求出各组总量占总体总量的比重,来反映总体内部组成情况的综合指标。,如男女生各自所占比重;男性人口比重;成绩优秀率;优等品比重;第三产业产值占总产值比重;恩格尔系数;基尼系数,2、结构相对指标,例:我国某年国民收入使用额为19715亿元,其中消费额为12945亿元,积累额为6770

13、亿元。则,能够反映总体单位数的结构和总体标志值的结构,深刻认识事物各个部分的特殊性质及其在总体中所占的地位。事物的变化总是开始于内部结构的演变。这种演变反映着事物发展变化的过程,掌握这一过程就能了解事物发展的趋势和规律。,结构相对指标的作用,又称比例相对数,是同一总体中不同部分数量对比的相对指标,反映总体中各部分之间数量联系程度、比例关系及协调平衡状况。,3、比例相对指标,如人口性别比例;积累与消费比例;一二三产业比例,例:我国某年国民收入使用额为19715亿元,其中消费额为12945亿元,积累额为6770亿元。则,说明,为无名数,可用百分数或一比几或几比几表示;用来反映组与组之间的联系程度或

14、比例关系。,又称比较相对数,是同一时间不同空间同类指标对比而得的相对数。用以表明同类事物在不同条件下的数量对比关系和差异程度。,4、比较相对指标,3、比较相对指标,如中国人口预期寿命与世界人口平均预期寿命的比较中国第三产业产值比重与美国第三产业比重的比较,例:某年某地区甲、乙两个公司商品销售额分别为5.4亿元和3.6亿元。则,子项与母项的内容不同结构相对指标是部分数量与总体总量的对比比例相对指标是同一总体内,部分数量与部分数量的对比比较相对指标是同一时间同类指标在空间上的对比说明问题不同结构相对指标用各组总量占总体总量的比重,来反映总体内部组成情况的;比例相对指标说明总体内各部分间的相互关系;

15、比较相对指标说明某种现象在不同空间下发展的不均衡程度。,结构相对指标、比例相对指标和比较相对指标的区别,又称动态相对数或发展速度,是同类现象指标值在不同时间上的对比,用以表明现象在不同时间上的发展变化程度。,5、动态相对指标,例:我国钢产量2003年为22234万吨,2002年为18237万吨。,又称强度相对数,是两个相关的、性质不同的总量指标之比,用以表明现象的强度、密度和普遍程度。,6、强度相对指标,例:某年某地区年平均人口数为100万人,在该年度内出生的人口数为8600人。则该地区,一般用、表示。其特点是分子来源于分母,但分母并不是分子的总体,二者所反映现象数量的时间状况不同。,无名数的

16、强度相对数,例:某地区某年末现有总人口为100万人,医院床位总数为24700张。则该地区,用双重计量单位表示的复名数,反映的是一种依存性的比例关系或协调关系,用来反映经济效益、经济实力、现象的密集程度等。,有名数的强度相对数,指标数值大小与现象的发展程度或密度方向相一致,指标数值大小与现象的发展程度或密度方向相反,保持对比指标的可比性相对指标与绝对数指标结合运用用于数值较大现象的分析各种相对指标结合运用相对指标基数不同不能直接相加,使用相对指标应注意的问题,1、注意指标间的可比性,相对指标抽象掉了具体的数量差异:1:2=50%10000:20000=50%,1998年相对于1997年,美国的G

17、DP增长速度为3.9,同期中国GDP增长速度为7.8,恰好为美国的2倍;但根据同期汇率(1美元兑换8.3元人民币),1998年中国GDP总量约合9671亿美元,约相当于同期美国GDP总量84272亿美元的1/9。,2、相对指标与总量指标结合使用,结构相对数比例相对数比较相对数动态相对数计划完成相对数强度相对数,(部分与总体关系)(部分与部分关系)(横向对比关系)(纵向对比关系)(实际与计划关系)(关联指标间关系),3、多种相对指标应当结合运用,人口性别比为1.03:1,1999年末我国共有总人口12.6亿人,其中男性人口为6.4亿,女性人口为6.2亿。,男性人口的比重为50.8,比1980年末

18、的9.9亿人增加了28,人口密度是美国的4.5倍,人口密度为130人/平方公里,人口出生率为15.23,女性人口的比重为49.2,动态相对数,比例相对数,强度相对数,比较相对数,结构相对数,结构相对数,强度相对数,某年级有两个班:1班及格率:96%2班及格率:90%年级及格率=(96%+90%)/2如何求?,基数不同,4、相对指标不能直接相加,第三节 平均指标分析,第三节 平均指标分析,一、平均指标的概念和特点二、平均指标的作用和种类三、算术平均数四、调和平均数五、几何平均数六、众数七、中位数八、平均数之间的相互关系九、应用平均指标应注意的问题,一、平均指标的概念和特点,把总体各单位标志值的差

19、异抽象化了平均指标是个代表值,代表总体各单位标志值的一般水平,特征,又称平均数,是指用来反映总体各单位某一数量标志在一定时间、地点、条件下一般水平的综合指标。,反映统计分布集中趋势或中心位置的特征值,截长补短,二、平均指标的作用,比较分析的作用,可作为论断事物的一种数量标准或参考,可分析现象间的依存关系,可进行数量上的推算和估计,不同空间或不同时间的对比,如平均成绩,如按企业规模分组,计算各组平均商品流通费用率。可反映企业规模与流通费用率间的依存关系,三、平均指标的种类,基本形式,1、算术平均数,以上公式中,分子与分母在经济内容上有着从属关系,即分子数值是个分母单位特征的总和,两者在总体范围上

20、是一致的,这也是平均指标与强度相对指标的区别所在。强度相对指标也是两个有联系的总量指标之比,但不存在各标志值与各单位的对应问题。,指标的含义不同。强度相对指标说明的是某一现象在另一现象中发展的强度、密度或普遍程度;而平均指标说明的是现象发展的一般水平。计算方法不同。强度相对指标与平均指标,虽然都是两个有联系的总量指标之比,但是,强度相对指标分子与分母的联系,只表现为一种经济关系;而平均指标是在一个同质总体内标志总量与单位总量的对比。分子是各单位标志值的总和,分母是单位总数,对比结果是反映总体各单位某一标志值的平均数。,强度相对指标与平均指标的区别,例如:,以此标准衡量,全国粮食产量与全国种粮农

21、民人数之比,计算得出农业劳动生产率,是个平均指标;而全国粮食产量与全国人口数之比,计算得出全国平均每人拥有的粮食产量,是个强度指标。因为,全国每一个种粮的农民都具有粮食产量这一标志。而全国人口中,却有很多人不具有这个标志。,算术平均数的两种计算形式,简单算术平均数 加权算术平均数,适用于总体资料未经分组整理、尚为原始资料的情况,式中:为算术平均数;为总体单位总数;为第 个单位的标志值。,A.简单算术平均数,平均每人日销售额为:,某售货小组5个人,某天的销售额分别为520元、600元、480元、750元、440元,则,【例】,适用于总体资料经过分组整理形成变量数列的情况,公式1,B.加权算术平均

22、数,式中:为算术平均数;为第 组的次数;为组数;为第 组的标志值或组中值。,式中:为算术平均数;为第 组的频率;为组数;为第 组的标志值或组中值。,公式2,身高 组中值 人数 比重(cm)(cm)(人)(%)150-155 152.5 3 3.61 155-160 157.5 11 13.25 160-165 162.5 34 40.96 165-170 167.5 24 28.92 170以上 172.5 11 13.25 总计 83 100,某年级83名女生身高资料,组距数列,次数f,频率f/f,变量值x,加权算术平均数,权数与加权,权数与加权,权数与加权,权数与加权,权数与加权,算术平均

23、数的计算取决于变量值和权数的共同作用:变量值决定平均数的范围;权数则决定平均数的位置,权数的选择,一般情况下,各组的频数、频率就是权数,但在计算相对数的算术平均数时不适用。以计算计划完成指数的平均数为例,某市所属15个企业产值计划完成情况如下:,计划完成程度%90-100100-110110-120合计,组中值%x95105115,企业数58215,计划完成数(万元)f1008001001000,实际完成数(万元)xf958401151050,由于各企业规模不同,不能使用企业数为权数,而选用产值为权数,且选用计划产值为权数,为什么?,总结,相对数求算术平均数用相对数的分母做权数,权数:加权算术

24、平均数中的权数,是标志值出现的次数(频数)f 或各组次数占总次数的比重(频率)。权数的作用:权衡平均数大小。某一组的次数或频率越大,则该组的标志值对平均数的影响就越大,反之越小。,权数及作用,受单位标志值大小的影响。受各标志值次数的影响,更准确的讲是受各组次数占总次数比重即频率的影响。,加权算术平均数的影响因素,算术平均数的数学性质,各个变量值与平均数的离差之和等于零,各个变量值与其算术平均数的离差平方和最小,-1,-1,-2,1,3,离差的概念,算术平均数的数学性质,两独立同性质变量代数和(差)的平均数等于各变量平均数的代数和(差),两独立同性质变量乘积的平均数等于各变量平均数的乘积,算术平

25、均数的数学性质,设a、b为任意常数,如果,则:,【例】设X=(2,4,6,8),则其调和平均数可由定义计算如下:,再求算术平均数:,求各标志值的倒数:,,再求倒数:,是总体各单位标志值倒数的算术平均数的倒数,又叫倒数平均数,2、调和平均数H,也有简单调和平均数和加权调和平均数之分。,适用于总体资料未经分组整理、尚为原始资料的情况,H为调和平均数;m 为变量值i 的个数;Xi为第i个变量值。,A.简单调和平均数,市场上某种蔬菜早市价格每斤0.25元,午市价格每斤0.2元,晚市每斤0.1元,如早中晚各买1元的菜,则平均每斤价格是多少:,购买总金额,购买总数量,举例,适用于总体资料经过分组整理形成变

26、量数列的情况,式中:为第 组的变量值;为第 组的标志总量。,B.加权调和平均数,公式,加权调和平均数,如果,加权算术平均数,可见:若调和平均数以各组的标志总量(m)为权数时,它就是算术平均数的变形公式,实际应用是选用那种方法要看掌握的资料情况而定。,已知 用基本平均数公式,己知 采用加权算术平均数公式,己知,采用加权调和平均数公式,平均数形式选择,STAT,苹果 单价 购买量 总金额 品种(元)(公斤)(元)红富士 2 3 6青香蕉 1.8 5 9,例1,若只知 x 和xf,f 未知,则只能使用加权调和平均,若已知 x 和f,则使用加权算术平均式,某企业某日工人的日产量资料如下:,计算该企业该

27、日全部工人的平均日产量。,例2,即该企业该日全部工人的平均日产量为12.1375件。,应采用加权算术平均数公式计算,计算该公司该季度的平均计划完成程度。,分析:,某季度某工业公司18个工业企业产值计划完成情况如下:,例3,某季度某工业公司18个工业企业产值计划完成情况如下(按计划完成程度分组):,计算该公司该季度的平均计划完成程度。,分析:,应采用平均数的基本公式计算,例4,某季度某工业公司18个工业企业产值计划完成情况如下:,计算该公司该季度的平均计划完成程度。,应采用调和算术平均数公式计算,例5,是N项变量值连乘积的开n次方根,用于计算现象的平均比率或平均速度,各个比率或速度的连乘积等于总

28、比率或总速度;相乘的各个比率或速度不为零或负值。,应用的前提条件:,3、几何平均数G,也分为简单几何平均数和加权几何平均数,适用于总体资料未经分组整理尚为原始资料的情况,式中:为几何平均数;为变量值的个数;为第 个变量值。,A.简单几何平均数,【例】某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为95、92、90、85、80,求整个流水生产线产品的平均合格率。,设最初投产100个单位,则第一道工序的合格品为1000.95;第二道工序的合格品为(1000.95)0.92;第五道工序的合格品为 1000.950.920.900.850.80;,A.简单几何平均数,因该流水线的最终合格

29、品即为第五道工序的合格品,故该流水线总的合格品应为 1000.950.920.900.850.80;则该流水线产品总的合格率为:,即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。,思考:若上题中不是由五道连续作业的工序组成的流水生产线,而是五个独立作业的车间,且各车间的合格率同前,又假定各车间的产量相等均为100件,求该企业的平均合格率。,因各车间彼此独立作业,所以有 第一车间的合格品为:1000.95;第二车间的合格品为:1000.92;第五车间的合格品为:1000.80。则该企业全部合格品应为各车间合格品的总和,即总合格品=1000.95+1

30、000.80,又因为,应采用加权算术平均数公式计算,即,不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。,适用于总体资料经过分组整理形成变量数列的情况,式中:为几何平均数;为第 组的次数;为组数;为第 组的标志值或组中值。,B.加权几何平均数,【例】某金融机构以复利计息。近12年来的年利率有4年为3,2年为5,2年为8,3年为10,1年为15。求平均年利率。,设本金为V,则至各年末的本利和应为:,第1年末的本利和为:,第12年的计息基础,第12年末的本利和为:,B.加权几何平均数,则该笔本金12年总的本利率为:,即12年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,

31、故计算平均年本利率应采用几何平均法。,B.加权几何平均数,若上题中不是按复利而是按单利计息,且各年的利率与上相同,求平均年利率。,B.加权几何平均数,则该笔本金12年应得的利息总和为:=V(0.034+0.052+0.151),这里的利息率或本利率不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。因为,假定本金为V,所以,应采用加权算术平均数公式计算平均年利息率,即:,几何平均数的应用特点,它适用于反映特定现象的平均水平,即变量的总水平不是各变量值的总和而是连乘积。如果数列中有一个标志值等于0或为负值。则无法计算几何平均数受极值影响较小,指总体中出现次数最多的变量值,用 表示,它

32、不受极端数值的影响,用来说明总体中大多数单位所达到的一般水平。,比如在服装行业中,生产商、批发商和零售商在做有关生产或存货的决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。此时众数合适的代表值,4、众数,众数的确定方法,单项式变量数列确定众数,必须以分组资料为前提,组距式变量数列确定众数,【例A】已知某企业某日工人的日产量资料如下:,计算该企业该日全部工人日产量的众数。,众数确定单项数列,出现次数最多的变量值就是众数.,【例B】某车间50名工人月产量的资料如下:,计算该车间工人月产量的众数。,众数确定组距数列,众数是一个位置平均数,不是根据全部单位的标志值计算得来,故不全面,但其优点是不受极端

33、值影响.当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数;当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为双众数或多众数,也等于没有众数)。,众数的应用,出生,1981.0,1980.0,1979.0,1978.0,1977.0,1976.0,1975.0,160,140,120,100,80,60,40,20,0,413名学生出生时间分布直方图,没有突出地集中在某个年份,众数的原理及应用,413名学生的身高分布直方图,出现了两个明显的分布中心,众数的原理及应用,将总体各单位标志值按大小顺序排列后,指处于数列中间位置的标志值,用 表示,不受极

34、端数值的影响,在总体标志值差异很大时,具有较强的代表性。,中位数的作用:,如果统计资料中含有异常的或极端的数据,就有可能得到非典型的甚至可能产生误导的平均数,这时使用中位数来度量集中趋势比较合适。,5、中位数,中位数的位置为:,即第3个单位的标志值就是中位数,【例A】某售货小组5个人,某天的销售额按从小到大的顺序排列为440元、480元、520元、600元、750元,则,中位数确定未分组资料,中位数的位置为:,中位数应为第3和第4个单位标志值的算术平均数,即,【例B】若上述售货小组为6个人,某天的销售额按从小到大的顺序排列为440元、480元、520元、600元、750元、760元,则,中位数

35、确定未分组资料,【例C】某企业某日工人的日产量资料如下:,计算该企业该日全部工人日产量的中位数。,中位数的位次,中位数确定分组数据-单项数列,【例D】某车间50名工人月产量的资料如下:,计算该车间工人月产量的中位数。,中位数确定分组数据-组距数列,向上累计,共 个单位,共 个单位,共 个单位,共 个单位,L,U,中位数组,组距为d,共 个单位,假定该组内的单位呈均匀分布,中位数下限公式为,中位数的应用特点,中位数不受极端的值的影响.各单位标志值与中位数离差绝对值的总和最小。,变量值34556910中位数 5平均值 6与中位数离差-2-1 0 0 1 4 5与平均数离差-3-2-1-1 0 3

36、4,绝对数值之和 13 14,设x取值为:、10,算术平均数、几何平均数、调和平均数之间的关系,当总体为对称钟形分布时,众数、中位数、算术平均数的关系,当总体为右偏钟形分布时,众数、中位数、算术平均数的关系,当总体为左偏钟形分布时,众数、中位数、算术平均数的关系,当分布是适度偏态时,三者近似关系:由此得,九、应用平均指标应注意的问题,(一)注意现象总体的同质性(二)总平均数与组平均数结合使用(三)注意极端值的影响(四)用分配数列补充说明平均数,不同质的单位不能计算平均数。例如,我们不能把小麦、棉花、茶叶等混合在一起计算“农作物平均亩产量”,九、应用平均指标应注意的问题,(一)注意现象总体的同质

37、性(二)总平均数与组平均数结合使用(三)注意极端值的影响(四)用分配数列补充说明平均数,九、应用平均指标应注意的问题,(一)注意现象总体的同质性(二)总平均数与组平均数结合使用(三)注意极端值的影响(四)用分配数列补充说明平均数,九、应用平均指标应注意的问题,(一)注意现象总体的同质性(二)总平均数与组平均数结合使用(三)注意极端值的影响(四)用分配数列补充说明平均数,总平均数反映了总体各单位在某一方面的同质性,但总体各单位在其他方面还存在性质上的差异,我们可以通过组平均数的计算来补充总平均数的不足,充分反映总体特征。,某企业2003-2004年工资情况统计表,生产工人按年龄分组10年以上10

38、年以下合计,2003年,工人人数人3007001000,月工资总额元4650007350001200000,平均工资元155010501200,2004年,只看总平均数显示?,看组平均数显示?,总平均数掩盖了两类工人的构成差异,总平均数不仅受各组变量水平的影响,还受各组结构变动的影响,九、应用平均指标应注意的问题,(一)注意现象总体的同质性(二)总平均数与组平均数结合使用(三)注意极端值的影响(四)用分配数列补充说明平均数,九、应用平均指标应注意的问题,(一)注意现象总体的同质性(二)总平均数与组平均数结合使用(三)注意极端值的影响(四)用分配数列补充说明平均数,算术平均数的计算受极端值影响较

39、大。但数列存在极端值时要先予以剔除,再计算平均值,或者计算其众数、中位数。1000 1200 1500 1300,极端值,九、应用平均指标应注意的问题,(一)注意现象总体的同质性(二)总平均数与组平均数结合使用(三)注意极端值的影响(四)用分配数列补充说明平均数,九、应用平均指标应注意的问题,(一)注意现象总体的同质性(二)总平均数与组平均数结合使用(三)注意极端值的影响(四)用分配数列补充说明平均数,平均数说明的是总体的一般水平,但把各单位数量标志值的差异抽象掉了,为了深入地说明问题,在利用平均数进行分析时,应结合原分配数列,分析平均数在原数列所处位置,以及各单位标志值在平均数上下分配情况。

40、,按计划完成程度分组%8590909595100100105105110110115合计,企业数1452015550,该数列的平均计划完成程度为103.4%,说明总体上该部门超额完成了计划,结合分配数列,我们不仅可以用该平均数把各企业分为先进和后进两部分,而且发现还有10个企业没有完成计划。,第四节 变异度指标分析,第四节 变异度指标分析,一、变异度指标二、全距三、四分位差四、平均差五、方差和标准差六、标志变异系数,集中趋势弱、离中趋势强,集中趋势强、离中趋势弱,一、变异度指标,又称标志变动度,是综合反映总体各单位标志值差异程度的指标,也是反映总体分布状况的特征值之一。,平均数是总体的一般水平

41、,而变异度指标度量的是总体统计分布的离中趋势。反映了平均数代表性的大小。,(一)变异度指标的概念,(二)变异度指标的意义,是衡量平均数代表性大小的尺度,变异度大,平均数代表性小,变异度小,平均数代表性大,可以反映社会经济活动过程的均衡性,变异度越小,社会经济活动过程越均衡,说明社会再生产的各要素的利用和配合越充分合理。,标志变异指标的种类,指所研究的数据中,最大值与最小值之差,又称极差。,【例A】某售货小组5人某天的销售额分别为440元、480元、520元、600元、750元,则,二、全距R,【例B】某季度某工业公司18个工业企业产值计划完成情况如下:,计算该公司该季度计划完成程度的全距。,优

42、点:计算方法简单、易懂;缺点:易受极端数值的影响,不能全面反映所有标志值差异大小及分布状况,准确程度差,往往应用于生产过程的质量控制中,全距的特点,把变量数列分为四等份,形成三个分割点,这三个分割点的数值称为四分位数,第二个四分位数为中位数,第三个四分位数与第一个四分位数之差为四分位差,Q.,中位数,下四分位数,上四分位数,三、四分位差QD,中位数,下四分位数,上四分位数,四分位差越大,说明Q1与 Q3 之间的分布越远离他们的中点Q2。说明中位数的代表性越小。反之,若四分位差越小,中位数的代表性越高。,未分组资料求四分位差,n为变量项数,152 154 154 155 155 156 156

43、156 156 157 158 158 159 159 160 160 160 160 160 160 160 160 160 160 160 160 161 161 161 161 161 161 161 162 162 162 162 162 162 162 162 163 163 163 163 164 164 164 165 165 165 165 165 165 165 165 166 166 166 166 166 167 167 167 168 168 168 168 168 168 168 169 170 170 170 170 170 171 171 172 172 172

44、174,四分位差167-1607(cm),分组资料求四分位差,2、计算向上累计次数,确定Q1Q3所在组。,1、确定位置,单项式数列:,组距式数列:,单项式数列:,167-160=7,计算向上累计数,确定上、下四分位数。,组距式数列:,简单平均差适用于未分组资料,是各个数据与其算术平均数的离差绝对值的算术平均数,用M.D表示,四、平均差,【例A】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的平均差。,即该售货小组5个人销售额的平均差为93.6元。,加权平均差适用于分组资料,【例B】计算下表中某公司职工月工资的平均差。,即该公司职工月工资

45、的平均差为138.95元。,优点:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。,一般情况下都是通过计算另一种标志变异指标标准差,来反映总体内部各单位标志值的差异状况,平均差,五、方差和标准差,方差(variance):各变量值与其算术平均数离差平方的算术平均数。标准差(mean square deviation Standard deviation):是方差的算术平方根。也称均方差、均方根差、离差均方根等。,2,简单式,加权式,1、一般标志的方差及标准差的计算,一般的计算过程:列

46、表,第一步计算均值,第二步计算离差,第三步离差平方,第四步乘以权数,一般标志的方差及标准差的计算,简单标准差适用于未分组资料,【例A】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的标准差。,即该售货小组销售额的标准差为109.62元。,标准差,(1)简单标准差,加权标准差适用于分组资料,标准差,【例B】计算下表中某公司职工月工资的标准差。,标准差,(2)加权标准差,即该公司职工月工资的标准差为167.9元。,标准差,(2)加权标准差,不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差

47、的正负值问题,可方便地用于数学处理和统计分析运算.,由同一资料计算的标准差的结果一般要略大于平均差。,标准差的特点,方差的数学性质,是非标志其值仅表现为具有某种特征或不具有某种特征两种情况的标志称为是非标志,也称交替标志。,性别:男、女(非男),产品质量:合格、不合格,1 0,1 0,2、是非标志的方差及标准差的计算,具有某种标志的总体单位数,不具有某种标志的总体单位数,总体单位总数,是非标志的均值及标准差的计算,是非标志值 x10合计,频率(成数)pq1,p0p,是非标志的平均数:,1-p0-p,是非标志值 x10合计,频率(成数)pq1,p0p,是非标志的方差和标准差:,是非标志的均值及标

48、准差的计算,某厂某月份生产了1000件产品,其中合格品900件,不合格品100件。求产品质量分布的集中趋势与离散趋势。,集中趋势,离散趋势,标准差的简捷算法,平均数作为数据的代表值起代表性的大小取决于数据间的变异程度,但当对两组量纲不同的数据的平均数的代表性做比较时,上述的全距、四分位差、平均差、方差、标准差都难以作出合理的评价。因为这些变异指标也有量纲。,可比,身高的差异水平:cm,体重的差异水平:kg,可比,用来对比不同水平的同类现象,特别是不同类现象总体平均数代表性的大小,六、标志变异系数,变异系数(离散系数):数列的离散水平指标与数列均值的比值。是以相对数表现的标志变异指标,反映了标志

49、值的变异程度和平均指标的代表性大小。,【例】某年级一、二两班某门课的平均成绩分别为82分和76分,其成绩的标准差分别为15.6分和14.8分,比较两班平均成绩代表性的大小。,一班平均成绩的代表性比二班大。,标志变异系数,第五节 偏度和峰度指标分析,偏度和峰度,偏度和峰度是用来表述统计数据形态特征的指标,是对一组统计数据分布的对称(或偏斜)程度和陡峭程度(或扁平)的度量。,非对称的,偏斜的分布,对称的、高度适中的分布,既偏斜又低平的分布,偏度和峰度,矩是用来描述统计数据分布的,偏度和峰度是通过矩来定义的。,k阶原点矩,偏度和峰度,k阶中心矩,偏度和峰度,中心矩和原点矩的换算,偏度和峰度,二、偏度,偏度:亦称偏度系数。是对统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。,偏度利用三阶中心矩定义,偏度和峰度,一阶中心矩衡为零,偶数阶中心矩为正数,奇数阶中心矩可以反映分布偏度。,三阶中心矩有计量单位,不便于比较,故用具有相同单位的3相除,去掉单位,偏度和峰度,峰度:描述数据分布陡峭程度的指标,是利用四阶中心矩定义的。,正态分布,高峰态,低峰态,偏度和峰度,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号