第二章统计数据.ppt_三一办公31ppt.com

资源描述

《第二章统计数据.ppt》由会员分享，可在线阅读，更多相关《第二章统计数据.ppt（192页珍藏版）》请在三一办公上搜索。

1、1,第二章统计数据,第一节统计数据的数据与种类第二节统计数据的搜集第三节统计数据的整理第四节统计指标第五节 EXCEL基本统计,2,第一节统计数据的数据与种类,一、统计数据的概念二、统计数据的种类,3,（二）说明总体单位特征的概念称为标志，如性别、考试成绩都是说明个别人的特征的标志。,一、统计数据的概念,数量标志：可以用数量表示的，“考试成绩”、“月工资”是数量标志。,品质标志：不能直接用数量表示的人的性别表现要么为男，要么为女；企业的经济类型表现为国有经济、合资经济、私营经济等。“性别”、“经济类型”就是,（一）统计数据是总体或总体单位某一特征的具体表现，是统计工作的成果。,

2、标志说明总体单位特征的数据，主要产生于统计调查阶段。,4,（三）统计指标说明总体特征的概念与具体数字称为指标。如我国2002年国内生产总值102398亿元，按可比价格计算，比上年增长8%，年末全国就业人员73740万人等都是统计指标。说明总体数量特征特征的数据，主要产生于统计整理和分析阶段，是综合数据。,指标名称（概念）：指标名称是在一定理论指导下，对所研究现象本质的归纳和抽象，是对统计指标质的规定性,指标数值（字）：指标数值是在质的规定性下，对现象具体量化的结果，是有计量单位的数字。,构成,5,二、统计数据的种类,（一）按是否可以直接用数字表示，统计数据可以分为定性数据和定量数据。（二）按

3、是否经过加工处理，统计数据有原始数据和综合数据之分。（三）按时间状况，统计数据可以分为截面数据和时序数据。,next,6,补充统计数据的计量层次,数据的计量尺度,不同计量尺度的数据有不同的表现形式，适合于不同的统计分析方法。,7,定类数据,计量层次最低对事物进行平行的分类各类别可以指定数字代码表示4.数据表现为“类别”5.具有或的数学特性,8,定序数据,对事物分类的同时给出各类别的顺序比定类尺度精确未测量出类别之间的准确差值数据表现为“有序的类别”、等级具有或的数学特性,9,定量数据,1.对事物的准确测度2.比定序尺度精确3.数据表现为“数值”4.具有+、-、或的数学特性,10,第二节统

4、计数据搜集,一、统计数据搜集的意义二、统计调查方案三、统计调查的方式四、统计数据的质量,11,一、统计数据搜集的意义,（一）定义有组织、有计划地搜集大量原始数据的过程。是统计工作的基础环节。（二）与一般社会调查的主要区别。主要着眼于数字资料的搜集；不是搜集个别单位的资料，而是搜集大量单位的资料并能够据以汇总计算形成说明总体的综合数据。,12,（三）对统计调查的要求,准确、及时、全面、系统。准确性（真实性、客观性）如实反映客观实际。真实性是统计的生命。及时性在规定时间内尽快提供统计资料。过时的信息有如“雨后送伞”。全面、系统调查方案规定调查的单位要全、项目要全，不能遗漏。资料残缺不全，就不能正

5、确、系统地反映现象总体的实质和规律性。,13,二、统计调查方案,（一）确定调查目的确定调查目的就是明确一项调查所要解决的问题。（二）确定调查对象和调查单位调查对象是所要调查事物的全体，由许多个别单位构成，即统计总体。调查单位是所要调查的具体单位，是调查项目的具体承担者，即总体单位。,14,调查单位要与调查的填报单位或报告单位相区别。填报单位:向上报告调查内容、提交统计数据的单位。它可能与调查单位一致，也可能不一致。如调查工业生产情况（目的），所有的工业企业是总体（对象），每一个工业企业是调查单位，同时每一个工业企业也是填报单位；而调查工业生产设备情况，所有的工业生产设备是调查对象，每一台设备

6、是调查单位，每一个工业企业是填报单位。,15,（三）确定调查项目调查项目是具体的调查内容，是调查单位具有的特征，由一系列品质标志和数量标志构成。为了便于调查和汇总，应该把调查项目按一定顺序排列在表格中，这就是调查表。一个调查单位填写一份的调查表称为单一表，若干个调查单位填写一份的调查表称为一揽表。（四）确定调查方式方法,16,（五）确定调查时间确定调查时间一是指确定标准时间，即调查资料所属的时间，一是指确定调查工作的起止时间。对时期现象，标准时间是一段时间，如2003年第三产业营业收入调查，标准时间是2003年1月1日至2003年12月31日，调查工作时间是2004年1月1日至1月31日；对

7、时点现象，标准时间是某一时刻，如第五次人口普查的标准时间是2000年11月1日零点，调查工作时间是2000年11月1日至10日。（六）确定其它事项包括确定调查机构、培训计划、是否需要试点、经费预算、资料报送程序和方法、数据公布时间等。,17,二、统计调查的方式,18,（一）统计报表概念、优点、局限性（二）普查作用：调查内容详细、提供重要国情国力资料;提供抽样框。特点：必须规定标准时间、统一进行、基本内容和指标解释统一并相对稳定。,1、全面调查,19,2、非全面调查,（三）重点调查重点调查是在所要调查的总体中选择一部分重点单位进行调查，用以反映总体基本情况的一种非全面调查。（四）典型调查典型

8、调查是在对调查对象有一定了解的基础上，有意识地选择少数典型单位进行的调查。（五）抽样调查抽样调查是以概率论和数理统计理论为基础，按照随机原则从调查对象中抽出一部分样本单位进行调查，再用部分单位资料推算总体数值的一种非全面调查方式。,20,三种非全面调查的比较,21,（六）我国统计调查方法体系改革的目标模式,建立以周期性普查为基础，以经常性的抽样调查为主体，以必要的以及报表、重点调查、综合分析为补充，搜集、整理基本统计资料的统计调查方法体系。,22,四、统计数据的质量,（一）统计误差含义：指统计数据与客观实际数据之间的差异。（二）统计误差种类：1 按来源不同登记性误差代表性误差 2 按误差

9、性质偶然性误差系统误差 3 按误差产生原因无意误差有意误差,23,一、统计整理的意义和步骤二、统计分组三、分布数列四、统计表五、次数分布图和类型,第三节统计数据的整理,24,2000网易杯全国大学生数学建模竞赛 DNA序列分类 2000年6月，人类基因组计划中DNA全序列草图完成，预计2001年可以完成精确的全序列图，此后人类将拥有一本记录着自身生老病死及遗传进化的全部信息的“天书”。这本大自然写成的“天书”是由4个字符A，T，C，G按一定顺序排成的长约30亿的序列，其中没有“断句”也没有标点符号，除了这4个字符表示4种碱基以外，人们对它包含的“内容”知之甚少，难以读懂。破译

10、这部世界上最巨量信息的“天书”是二十一世纪最重要的任务之一。在这个目标中，研究DNA全序列具有什么结构，由这4个字符排成的看似随机的序列中隐藏着什么规律，又是解读这部天书的基础，是生物信息学（Bioinformatics）最重要的课题之一。,25,虽然人类对这部“天书”知之甚少，但也发现了DNA序列中的一些规律性和结构。例如，在全序列中有一些是用于编码蛋白质的序列片段，即由这4个字符组成的64种不同的3字符串，其中大多数用于编码构成蛋白质的20种氨基酸。又例如，在不用于编码蛋白质的序列片段中，A和T的含量特别多些，于是以某些碱基特别丰富作为特征去研究DNA序列的结构也取得了一些结果。此外，利用

11、统计的方法还发现序列的某些片段之间具有相关性，等等。这些发现让人们相信，DNA序列中存在着局部的和全局性的结构，充分发掘序列的结构对理解DNA全序列是十分有意义的。目前在这项研究中最普通的思想是省略序列的某些细节，突出特征，然后将其表示成适当的数学对象。,26,这种被称为粗粒化和模型化的方法往往有助于研究规律性和结构。作为研究DNA序列的结构的尝试，提出以下对序列集合进行分类的问题：1）下面有20个已知类别的人工制造的序列（见下页），其中序列标号110 为A类，11-20为B类。请从中提取特征，构造分类方法，并用这些已知类别的序列，衡量你的方法是否足够好。然后用你认为满意的方法，对另外20个未

12、标明类别的人工序列（标号2140）进行分类，把结果用序号（按从小到大的顺序）标明它们的类别（无法分类的不写入）：A类；B类。请详细描述你的方法，给出计算程序。如果你部分地使用了现成的分类方法，也要将方法名称准确注明。这40个序列也放在如下地址的网页上，用数据文件Art-model-data 标识，供下载：网易网址：教育频道在线试题；教育网：News mcm2000教育网：,27,2）在同样网址的数据文件Nat-model-data 中给出了182个自然DNA序列，它们都较长。用你的分类方法对它们进行分类，像1）一样地给出分类结果。提示：衡量分类方法优劣的标准是分类的正确率，构造分类方法有许多

13、途径，例如提取序列的某些特征，给出它们的数学表示：几何空间或向量空间的元素等，然后再选择或构造适合这种数学表示的分类方法；又例如构造概率统计模型，然后用统计方法分类等。,28,1.aggcacggaaaaacgggaataacggaggaggacttggcacggcattacacggaggacgaggtaaaggaggcttgtctacggccggaagtgaagggggatatgaccgcttgg2.cggaggacaaacgggatggcggtattggaggtggcggactgttcggggaattattcggtttaaacgggacaaggaaggcggctggaacaaccggacg

14、gtggcagcaaagga3.gggacggatacggattctggccacggacggaaaggaggacacggcggacatacacggcggcaacggacggaacggaggaaggagggcggcaatcggtacggaggcggcgga4.atggataacggaaacaaaccagacaaacttcggtagaaatacagaagcttagatgcatatgttttttaaataaaatttgtattattatggtatcataaaaaaaggttgcga5.cggctggcggacaacggactggcggattccaaaaacggaggaggcggacggaggctac

15、accaccgtttcggcggaaaggcggagggctggcaggaggctcattacggggag6.atggaaaattttcggaaaggcggcaggcaggaggcaaaggcggaaaggaaggaaacggcggatatttcggaagtggatattaggagggcggaataaaggaacggcggcaca7.atgggattattgaatggcggaggaagatccggaataaaatatggcggaaagaacttgttttcggaaatggaaaaaggactaggaatcggcggcaggaaggatatggaggcg8.atggccgatcggcttaggc

16、tggaaggaacaaataggcggaattaaggaaggcgttctcgcttttcgacaaggaggcggaccataggaggcggattaggaacggttatgagg9.atggcggaaaaaggaaatgtttggcatcggcgggctccggcaactggaggttcggccatggaggcgaaaatcgtgggcggcggcagcgctggccggagtttgaggagcgcg10.tggccgcggaggggcccgtcgggcgcggatttctacaagggcttcctgttaaggaggtggcatccaggcgtcgcacgctcggcgcggcagga

17、ggcacgcgggaaaaaacg11.gttagatttaacgttttttatggaatttatggaattataaatttaaaaatttatattttttaggtaagtaatccaacgtttttattactttttaaaattaaatatttatt12.gtttaattactttatcatttaatttaggttttaattttaaatttaatttaggtaagatgaatttggttttttttaaggtagttatttaattatcgttaaggaaagttaaa13.gtattacaggcagaccttatttaggttattattattatttggatttttttttt

18、ttttttttttaagttaaccgaattattttctttaaagacgttacttaatgtcaatgc14.gttagtcttttttagattaaattattagattatgcagtttttttacataagaaaatttttttttcggagttcatattctaatctgtctttattaaatcttagagatatta15.gtattatatttttttatttttattattttagaatataatttgaggtatgtgtttaaaaaaaatttttttttttttttttttttttttttttttaaaatttataaatttaa16.gttatttttaaatt

19、taattttaattttaaaatacaaaatttttactttctaaaattggtctctggatcgataatgtaaacttattgaatctatagaattacattattgat17.gtatgtctatttcacggaagaatgcaccactatatgatttgaaattatctatggctaaaaaccctcagtaaaatcaatccctaaacccttaaaaaacggcggcctatccc18.gttaattatttattccttacgggcaattaattatttattacggttttatttacaattttttttttttgtcctatagagaaattactta

20、caaaacgttattttacatactt19.gttacattatttattattatccgttatcgataattttttacctcttttttcgctgagtttttattcttactttttttcttctttatataggatctcatttaatatcttaa20.gtatttaactctctttactttttttttcactctctacattttcatcttctaaaactgtttgatttaaacttttgtttctttaaggattttttttacttatcctctgttat,29,21.tttagctcagtccagctagctagtttacaatttcgacaccagttt

21、cgcaccatcttaaatttcgatccgtaccgtaatttagcttagatttggatttaaaggatttagattga22.tttagtacagtagctcagtccaagaacgatgtttaccgtaacgtqacgtaccgtacgctaccgttaccggattccggaaagccgattaaggaccgatcgaaaggg 23.cgggcggatttaggccgacggggacccgggattcgggacccgaggaaattcccggattaaggtttagcttcccgggatttagggcccggatggctgggaccc24.tttagctagctactt

22、tagctatttttagtagctagccagcctttaaggctagctttagctagcattgttctttattgggacccaagttcgacttttacgatttagttttgaccgt25.gaccaaaggtgggctttagggacccgatgctttagtcgcagctggaccagttccccagggtattaggcaaaagctgacgggcaattgcaatttaggcttaggcca26.gatttactttagcatttttagctgacgttagcaagcattagctttagccaatttcgcatttgccagtttcgcagctcagttttaacgcg

23、ggatctttagcttcaagctttttac 27.ggattcggatttacccggggattggcggaacgggacctttaggtcgggacccattaggagtaaatgccaaaggacgctggtttagccagtccgttaaggcttag28.tccttagatttcagttactatatttgacttacagtctttgagatttcccttacgattttgacttaaaatttagacgttagggcttatcagttatggattaatttagcttattttcga29.ggccaattccggtaggaaggtgatggcccgggggttcccgggag

24、gatttaggctgacgggccggccatttcggtttagggagggccgggacgcgttagggc30.cgctaagcagctcaagctcagtcagtcacgtttgccaagtcagtaatttgccaaagttaaccgttagctgacgctgaacgctaaacagtattagctgatgactcgta31.ttaaggacttaggctttagcagttactttagtttagttccaagctacgtttacgggaccagatgctagctagcaatttattatccgtattaggcttaccgtaggtttagcgt32.gctaccgggcagtct

25、ttaacgtagctaccgtttagtttgggcccagccttgcggtgtttcggattaaattcgttgtcagtcgctctrtgggtttagtcattcccaaaagg33.cagttagctgaatcgtttagccatttgacgtaaacatgattttacgtacgtaaattttagccctgacgtttagctaggaatttatgctgacgtagcgatcgactttagcac34.cggttagggcaaaggttggatttcgacccagggggaaagcccgggacccgaacccagggctttagcgtaggctgacgctaggcttagg

26、ttggaacccggaaa35.gcggaagggcgtaggtttgggatgcttagccgtaggctagctttcgacacgatcgattcgcaccacaggataaaagttaagggaccggtaagtcgcggtagcc36.ctagctacgaacgctttaggcgcccccgggagtagtcgttaccgttagtatagcagtcgcagtcgcaattcgcaaaagtccccagctttagccccagagtcgacg37.gggatgctgacgctggttagctttaggcttagcgtagctttagggccccagtctgcaggaaatgcccaa

27、aggaggcccaccgggtagatgccasagtgcaccgt38.aacttttagggcatttccagttttacgggttattttcccagttaaactttgcaccattttacgtgttacgatttacgtataatttgaccttattttggacactttagtttgggttac39.ttagggccaagtcccgaggcaaggaattctgatccaagtccaatcacgtacagtccaagtcaccgtttgcagctaccgtttaccgtacgttgcaagtcaaatccat40.ccattagggtttatttacctgtttattttttcc

28、cgagaccttaggtttaccgtactttttaacggtttacctttgaaatttttggactagcttaccctggatttaacggccagttt,30,DNA 序列分类方法分析参赛队员：王文宝刘科张建刚摘要：本文对DNA序列的分类问题，通过提取DNA序列的某些特征，构造分类方法，建立数学模型，并进行统计分析。其中构造分类方法的标准有：DNA序列中各种氨基酸的绝对数、酸碱性、亲水性和疏水性，以及DNA序列中嘌呤的比例。所运用的统计分析方法有，判别分析法，比例分析法。数据检验及误差分析方法有：回代法，相互验证法等。建立的模型有：氨基酸含量分类模型，嘌呤含

29、量分类模型，疏水性氨基酸含量分类模型，碱性氨基酸含量分类模型。对分析计算的结果分别用图形及表格表示，并用已知类别的序列对分类模型进行检验及误差分析，最后利用各种分类模型对所有待分类的DNA序列进行了分类。,31,根据现代细胞学和遗传学的研究得知，控制生物性状遗传的主要物质是DNA（脱氧核糖核酸）。DNA可以表示为四个字符A、T、G、C排列成的序列，A、T、G、C分别表示构成DNA的4种不同碱基。由这4个字符组成的64种不同的3字符串中大多数用于编码构成蛋白质的20种氨基酸，除此之外，人们对它的内容还知之甚少，但也发现在DNA序列结构中的一些规律性。探索DNA信息的关键就在于找出DNA序列的结构

30、，尤其是其中4个字符排列中隐藏的规律，这同时也是生物信息学（Bioinformatics）最重要的课题之一。,32,现有已知类别的20个人工制造的DNA序列，已经分为A、B两类，需要从中找出规律，提取特征，构造分类方法，并以这20个序列为检验，衡量方法的优劣；然后以该方法对另外20个未知类别的人工序列以及182个自然DNA序列分类。,33,二十种氨基酸分类表,34,35,各DNA序列中每种氨基酸的摩尔含量多少是由序列的结构及其DNA分子的分子量等特征决定的，而其中大多数又是用于编码蛋白质，决定DNA的属性。因此，对DNA进行分类，充分统计DNA分子内每种氨基酸的绝对数，具有重要意义。其中20个

31、已知类别的人工制造的各DNA序列中各种氨基酸绝对数如下：,36,LaoCo 邮购公司,LanCo邮购公司的董事会会议开得十分热闹。争论的焦点是公司目前的高退货率。在退货对公司的影响上，大家的看法没有分歧退货极大地削弱了公司的赢利能力。然而在如何解决问题上，董事会分成两大阵营：一方认为，通过加快发货速度，就可以有效减少退货；而另一方则认为这样做除了提高发货成本，进一步侵蚀利润外，不会有其他效果。LanCo的经理决定，第一步先要搞清楚“退货问题”，然后再采取必要手段减少退货，以提高公司的赢利能力。,37,LanCo邮购公司是一家非常成功的商品邮购公司。顾客按照商品目录寄来订单，然后公司再按订单发出

32、货物。lanCo的目标市场是中低收入的家庭。商品目录刊登在杂志和报纸上。公司保存有一个庞大的商品目录分发清单，清单列出了领取目录者和以前从公司邮购过商品的顾客。公司每年给这些人寄出大致对应于四个季度的四份目录，11月初加寄一份节日附加目录。随着销售的稳定增长，公司现在的年销售额达7000万美元。,38,为了和要求顾客在发货前付款的大公司竞争，LanCo公司像许多邮购公司一样，也采用贷到付款(cashon-delivery，COD)的交易方式。COD方式的优点是销售阻力很小，能带来相对较大的销售总额。COD之所以吸引顾客，部分原因是在这种方式下，如果商品寄到时情况和发出订单时相比发生了变化，顾客

33、可以很容易地拒收商品。但这却给LanCo公司带来了很头疼的问题按价值计算，目前退货已占到公司全部销售总额的30。退货每增加1意味着公司的净利润损失就要增加40万美元，董事会成员们望着指示商品退货率的红线，心急如焚。,39,经理Horace Levinson收集了一些数据(见表)，以努力搞清楚“无人认领退货”的问题，进而减少这种情况的发生。LanCo公司怎样才能降低正在慢慢扼杀公司的“无人认领退货”的数量呢?,40,41,42,43,44,根据原始数据构造新变量表,45,46,统计分组结果：,47,（二）内容数据处理：分类、汇总、表现（制表）数据管理：输入、贮存、更新、输出（三）步骤制定统计

34、整理方案、审核原始资料、数据处理和表现、数据贮存,一、统计整理的意义和步骤,（一）统计整理含义统计整理是指根据统计研究的需要，将统计调查阶段所搜集到的大量个体资料进行科学的分类汇总、加工处理，或对已经经过加工的次级资料再加工，使之系统化、条理化，成为能够反映事物总体特征的综合资料的过程。,48,二、统计整理的基本方法-统计分组,（一）统计分组的含义和作用1、概念-统计分组就是根据统计研究的需要，将总体中的所有单位按照一定的标志分为若干部分。对总体分;对个体合。突出组与组之间的差异、抽象组内各单位差异2、作用划分类型、反映结构比例、揭示依存关系3、原则科学性、完备性、互斥性,49,三、分布

35、数列-统计分组整理的基本结果,（一）分布数列的含义和构成 1、意义：将总体各单位按某个标志分成若干组，列出各组的总体单位数或各组单位数在总体单位数中所占的比重，这样形成的数列称为分布数列，它表明总体单位在各组的分布状况。2、构成要素各组名称或变量值次数（频数或频率）3、种类,50,（1）品质数列,按品质标志分组形成的分布数列,二、分配数列的种类,51,表2-1 某公司职工文化程度状况,文化程度工人数比重（%）小学 400 8初中 1500 30高中 2600 52大学 500 10合计 5000 100,品质标志,52,性别是品质标志,53,（2）变量数列,单项式数列一个变量值为一个

36、组；适合于：离散型变量且变动范围小组距数列以一定区间的变量值为一个组；适合于：离散型变量变动范围大、连续变量等距数列异距数列,54,概念：,组距（等距、异距）上限下限,组限（开口、闭口）组的界限,、,55,某企业日产量,日产量是数量标志,56,57,58,（三）变量数列组数和组限的确定从原则上讲，组数和组限的确定要力求能够反映总体单位分布的特征和分布的集中趋势，突出组与组之间的差异。一般地讲，组数不宜过多，以免次数分布过于分散，反映不出分布特征，说明不了问题。反之，组数也不能太少，太少与不分组差不多，同样不能说明问题。按“上限不在组内”的规定进行整理。,59,变量数列的编制步骤,确定

37、全距=最大值-最小值；（排序）先确定组数确定组距确定组限表现现象的度、规定的界限体现分布的集中趋势考虑到习惯、便于对比,60,某月啤酒公司60个销售点的销量,48 71 52 53 36 41 69 58 47 60 53 29 41 72 81 37 43 58 68 42 73 62 59 4451 53 47 66 59 52 34 49 73 29 47 1639 58 43 29 46 52 38 46 80 58 51 67 54 57 58 63 49 40 54 61 58 66 47 50 单位：桶,61,啤酒销售量的分布数列,销售桶数销售点数频率(%)19以下 1

38、 1.72029 3 5.03039 5 8.34049 16 26.75059 20 33.36069 9 15.07079 4 6.780以上 2 3.3 合计 60 100.0,62,(四)累计次数与累计频率如果我们要了解大于或小于某个数的次数或百分数有多少，就需要将各组的次数进行累计。次数的累计可以从变量值较小的组向变量值较大的组累计向上累计。向上累计次数反映小于该组上限的次数或百分数总共有多少。次数累计也可以从变量值较大的组向较变量值较小的组累计向下累计。向下累计次数反映大于该组下限的次数或百分数总共有多少。,63,（四）次数累计,64,某班学生考试成绩次数表,65,累计次数分布的

39、应用：将全社会从业人员按收入水平分组，从低收入到高收入组汇总计算向上累计频率，得洛伦茨曲线。,A,B,20世纪初意大利经济学家基尼，根据洛伦茨曲线找出了判断分配均等程度的指标基尼系数：,累计人数（%）,0,累计收入（%）,绝对平均曲线，绝对不均等曲线，实际分配曲线,66,基尼系数(洛伦茨系数)=A/(A+B),表示收入（或财富）的不均等程度。在01 之间。系数越大，表示收入分配越是趋向不均等，洛伦茨曲线的弧度越大联合国有关组织规定：高度平均比较平均差距相对合理差距偏大两极分化0 0.2 0.3 0.4 0.5,67,东亚各国间的收入差距依然巨大发展中国家迎头赶上是水平分工的前提关志

40、雄 2002年6月公布的通商白皮书指出，参与全球化进程的国家之间的经济水平差距出现了缩小的趋势、战后的东亚地区就是一个典型的例子。作为其波及的途径，白皮书强调贸易关系的加强和投资的扩大促进了区域内的经济结构升级和地区间的水平分工，从而发挥缩小亚洲各国间收入差距的作用。然而，缩小收入差距的步伐仍然非常缓慢，而且像在1997年1998年的亚洲金融危机中所显示的那样，其过程并不会一帆风顺。当前，地区内部贸易仍然以按各国发展阶段进行的垂直分工为主导。水平分工与其说是缩小区域内差距的重要原因，不如说是其结果。,68,针对缩小收入差距的问题，我们选择日本、中国、亚洲四小龙和东盟主要四国为对象，计算了东亚地

41、区1990年和2000年的基尼系数。作为参考基准，我们还以欧盟十五国和中国各省份为对象进行了同样的计算（图1）。结果显示，东亚地区的基尼系数虽然从1990年的0.78降至2000年的0.72，但这个数字不仅远远大于发达国家为主的欧盟地区(2002年为0.1)，甚至高于被认为存在严重的地区间差距的中国(0.25)很多。归根结底，90年代亚洲地区收入差距的缩小，很大程度上缘于发达国家日本的经济停滞，而不是由于亚洲各发展中国家的迅猛发展。实际上，受亚洲金融危机冲击，大多数亚洲国家的经济增长率低于80年代。加之汇率大幅度下调，印度尼西亚和泰国等部分东盟国家在90年代以后，与日本的收入差距反而扩大了。,

42、69,而另一方面，90年代的日本经济停滞，GDP占东亚地区的份额已经从1990年的71.9下降到了2000年的65.1%，但是其地区经济超级大国的地位没有任何变化。同样，与增长迅猛的中国相比，差距虽有所缩小，但2000年的GDP规模仍是中国的4.4倍，人均GDP规模则为43.8倍，仍是天壤之别。中国依旧是人口大国，而不是高收入国家。由于按相同产业分类的产品交换（即产业内贸易）已经相当活跃，于是东亚地区被认为已经确立了水平分工体制。然而，由于经济差距依然悬殊，因此实质上该地区目前仍以垂直分工为主。也就是说，针对按相同产业分类的产品，无论是最终产品，还是零部件等中间产品，高附加值产品（或者工序）在

43、日本和亚洲四小等高收入国家（或地区）生产，而低附加值产品则在以中国为首的低收入国家生产。要使水平分工体制得以实现，其前提条件就是消除收入差距，使其他国家的收入水平接近日本，当然谈论这一话题尚为时过早。这样，与其说东亚通过水平分工消除收入差距，不如说只有消除了差距，才能实现真正的水平分工。,70,71,按人口从人均GDP低的国家（中国国内为各省份）向高的国家（同上）排列，按从低向高逐渐加入人口，并同时计算出与累积人口（占全体的比率）对应的累积收入（占全体的比率）。“劳伦兹曲线”的横轴是人口对累计构成的比率，纵轴是收入对累积构成的比率。基尼系数则由劳伦兹曲线与收入平均分布线即45度线之间围起的弓形

44、面积占45度线以下的三角形面积的比例计算得出。该系数数值位于01之间，越接近1，表明差距越大。,72,四、统计表,表现经过整理的统计数据的表格。1、统计表的构成按形式：标题总标题、横栏标题、纵列标题横行、纵列数字按内容：主词(主栏)宾词(宾栏),73,2、统计表的种类,按主词是否分组及分组标志的多少：简单表分组表复合表,74,五、次数分布图整理结果的另一表现形式,直方图折线图曲线图,（一）次数分布图,75,统计图直观地表现统计整理的常用的统计图,1、条形图,76,2、轮廓图（线图）,77,3、饼图（圆形图）,78,79,4、面积图,80,（二）次数分布的主要类型,钟型分布中间多、两头

45、少对称分布如正态分布左偏分布（负偏）右偏分布(正偏）U型分布 J型分布,81,（二）次数分布的类型次数分布的类型主要有三种：1、钟型分布钟型分布的特征是中间变量值出现的次数多，极大变量值和极小变量值出现的次数少，即“中间大，两头小”，其曲线图犹如一口古钟。钟型分布又分为对称分布、左偏分布和右偏分布。,82,2、U型分布U型分布与钟型分布正好相反，呈现出“中间小，两头大”的特征。人口按年龄分组的死亡率的分布就呈U型分布。,83,3、J型分布 J型分布呈现“一头大、一头小”的特点。如果变量值增大，次数也增多，这种分布称为正J型分布；如果变量值增大，次数反而减少，这种分布称为反J型分布。,84,第

46、四节统计指标,一、总规模、总水平的描述总量指标二、现象的对比分析相对指标三、集中趋势的度量平均指标四、离中趋势的度量变异指标,85,（补充）统计指标的种类,（一）根据指标所反映的内容不同，分为：数量指标（外延指标）反映客观现象总体规模和水平，说明总体的外延范围的大小或数量的多少，数量指标的数值大小必然会随总体范围变化而变动。质量指标（内涵指标）反映客观现象总体的一般水平或相对水平，说明总体的数量对比关系，其数值大小与总体范围大小的变动没有直接关系。,86,统计指标的种类（续）,（二）根据指标数值的表现形式不同，分为：总量指标也称为统计绝对数相对指标也称为统计相对数平均指标也称为统计平均数两

47、种分类的关系数量指标总量指标质量指标相对指标、平均指标,87,猜猜它是什么数？小康基本标准（1）人均国内生产总值2500元（按1980年的价格和汇率计算，2500元相当于900美元）；（2）城镇人均可支配收入2400元；（3）农民人均纯收入1200元；（4）城镇住房人均使用面积12平方米；（5）农村钢木结构住房人均使用面积15平方米；（6）人均蛋白质日摄入量75克；（7）城市每人拥有铺路面积8平方米；,88,（8）农村通公路行政村比重85；（9）恩格尔系数50；（10）成人识字率85；（11）人均预期寿命70岁；（12）婴儿死亡率3.1；（13）教育娱乐支出比重11；（14）电视机普及率100

48、；（15）森林覆盖率15；（16）农村初级卫生保健基本合格县比重100。,89,统计指标的种类（续）,（三）统计指标按性质不同，可分为：正指标指标数值越大越好如企业的利税总额、劳动生产率等逆指标指标数值越小越好如产品单位成本、废品率、犯罪率等适度指标在一定范围内波动才说明现象变化处于正常状态，过高或过低都不理想如基尼系数在0.30.4之间比较合理,90,一、总量指标,（一）总量指标的意义总量指标也称为统计绝对数表明现象总规模或绝对水平绝对数的形式表示是统计资料汇总的直接结果作用是认识社会经济现象的起点；是进行管理的重要依据；是计算相对指标、平均指标的基础。,91,1、按反映总体的特征（内

49、容）分为：总体总量即总体单位总数表示总体本身的规模大小标志总量即总体各单位某一数量标志值总和。表示所研究现象的总水平。总体单位总量与标志总量的区分，不是固定不变的，而是随着研究目的和研究对象的不同而变化的。如：某地区工业企业职工总数是：总体总量以该地区每个工业企业职工为总体单位时标志总量以该地区每个工业企业为总体单位时,（二）总量指标的分类,92,2、按反映的时间状况分时期指标也称为流量反映总体在一段时期内活动过程的总量，指标数值可以累计相加，数值大小和时间的长短有直接关系；时点指标也称为存量是反映总体在某一时刻（瞬间）状况的总量数值不能累计相加，数值的大小和时间间隔的长短没有直接关

50、系。试判断下列指标中哪些是时期指标？在校学生人数、招生人数、毕业生人数、出生人数、死亡人数、迁移人数、从业人数、失业人数,（二）总量指标的分类（续）,93,（二）总量指标的分类（续）,3、按计量单位不同分为：实物（量）指标计量单位为实物单位指以事物的自然属性和特点进行计量的单位，包括：自然单位：如人、只、台、件，是长期习惯使用形成，用于离散型数据。度量衡单位：kg、cm、，用于连续型数据。标准实物单位：按某一标准（含量、规格等）折算后的实物单位，用于将用途相同、但规格或含量不同的物品数量汇总。如粮食、能源（标准吨）等；复合单位：吨公里、人公里、人次数、工日特点使用价值明确；综合性能差，不同使

展开阅读全文