《城市综合经济实力的主成份分析.doc》由会员分享,可在线阅读,更多相关《城市综合经济实力的主成份分析.doc(10页珍藏版)》请在三一办公上搜索。
1、城市综合经济实力的主成份分析 城市综合经济实力的主成份分析 欧俊豪马逢时姬孟祥 摘自“数理统计与管理”摘要欧俊豪等.城市综合经济实力的主成份分析.对全国19个大城市的1993、1995二年数据进行了主成份分析,提出用第一主成份作为城市综 合经济实力的度量,给出了这些城市综合经济实力的排序。关键词:城市综合经济实力,主成份分析,第一主成份Use the Principal Component Analysis to RankThe Citys Synthetic Economi
2、cs PowerOu Junhao,Ma FengshiJi Mengxiang(Tianjin University,300072)(Statistics Bureau of Tianjin )AbstractIn this paper,the authors raise that the first principal component can be the m 
3、;easure of the citys synthetic economic power.According to the data of nineteen largest cities of China in 1993 and in 1995,the orders of citys synthetic ec onomic p
4、ower are given.Key words:Citys synthetic economic power,Principal compone nt analysis,The First principal component.随着工业化进程的加快,城市的数量不断增加,个体规模不断扩大,城市在社会经济生活中 的主导功能愈加显著。当今世界已步入了全球性经济大协作、资源市场大竞争、经济循环一 体化时代,城市作为国家(区域)的经济、政治、科技和教育文化发展中
5、心,它已成为经济循 环的主角,而决定每个城市在激烈市场搏击中的地位、作用、未来发展态势的主要因素是它 们各自拥有的综合经济实力。近年来,为贯彻落实党中央提出的可持续发展战略,一些学者对构建城市综合经济实力评价 指标体系进行了探索和研究。我们在学习参考这些结果的基础上,利用多元统计分析中的主 成份分析法,使用SAS统计计算软件包,对我国19个城市的1993和1995二年的一些指标进行 了分析,提出使用第一主成份来评价城市综合经济实力的方法。现将有关结果整理成此文, 供大家参考。一、成果发展前沿黎永林和林燕华在1及2中,提出要科学地反映中
6、心城市的基本特征,仅用几个指 标是不够的,必须构建城市综合实力评估指标体系,力求准确地反映现代化中心城市的整体 功能。他们建立的评价城市综合实力的指标体系由5个指标群,15个领域35个指标构成。 如在第一指标群经济发展下包括三个领域:1)综合经济实力2)经济结构3)宏观经济调控 ,共包含六个指标:1)人均国内生产总值2)三次产业之比3)第三产业就业人数占全社会劳动 者比重4)第三产业中四个层次之比5)投资率6)物价上升幅度。在具体计算指标值时,首先列 出本城市的战略目标(数值),再求出目前已实现数值占战略目标的比值,最后再将所得这些&
7、nbsp;值加权求和而得到总得分(100分为满分)。在计算中所使用的各指标的权系数是事先给定的 。我们认为这种方法的优点是选定的指标涉及城市社会的诸多方面,考虑问题较全面、细致 ,是一种有效的评估城市综合实力的方法。但有其缺点:一是选用指标过多,计算太繁;二 是各城市间不能比较;三是得分值依赖远景规划目标,会出现“城市规划远景目标越高则目 前得分越少”这种现象,这显得不够合理。近日,在未署名文章3中称:“国内有关人士”用层次分析法,使用了八个指标对九个 城市进行了城市综合经济实力的比较,结果广州名列第一。此文利用1993年的数据4,
8、使用的是八项人均指标(详见表1说明)。它所选用的综合评分Y是由八个指标加权平均而来的 (权系数用层次分析法事先确定,文中未予列出)。我们认为,这八项指标对于涵盖城市综合 实力确实具有代表性,选之进行计算简洁实用。但是,该文对各项指标都使用人均指标 ,它对总体概括描述功能显然减弱了,因而不尽完全合理。如果对于深圳进行同样的计算, 由于深圳的各项人均数值,除了个别项外,其余各项数值均高于广州。按照此文方法,势必 得出深圳综合经济实力为全国之首的结论,而这显然是不够合理的。二、城市综合经济实力的主成份分析1、定义依据及方法原理根据世界环境与发展委员会
9、发表的报告我们共同的未来(1987年)和国务院发布的中国 二十一世纪议程的指导思想及原则,我们采用中国城市经济发展研究中心提出的城市综合 经济实力的概念:城市综合经济实力是指城市所拥有的全部实力、潜力及其在国内外经济社 会中的地位和影响力。从此定义可以看出,评价城市综合经济实力应使用城市经济总量(而 不是人均量),应该包括国内生产总值、固定资产状况、拥有的交通运输能力、现代通讯设 施状况、商贸市场水平、对外交流水平、人才状况及社会医疗保障水平等统计指标。为此, 我们选用下列八个指标,使用了各城市的总量数值(详见表1)。表1相关系数矩阵
10、 Z1 Z2 Z3 Z4 Z5 Z6 Z7 Z8 Z1 1.0000 0.9615 0.7869 0.9549 0.6354 0.9271 0.20 14 0.3976 Z2 1.0000 0.7216 0.9625 0.5875 0.9371 0.1727 0.42 08 Z3 &n
11、bsp; 1.0000 0.8411 0.3914 0.8090 0.3664 0.6238 Z4 1.0000 0.5112 0.9811 0.2219 0.5258 Z5 1.0000 0.5608 -.1956 -.0435 Z6 1.0000 0.
12、1182 0.4973 Z7 1.0000 0.5207 我们使用的主成份分析就是要从较多的指标中找出较少的几个综合的指标,而这些指标能较 好地反映原来资料的信息。第一主成份Y是原来各变量的线性组合且具有最大的方差。将主 成份分析用于反映城市经济状况的数据上,则第一主成份很自然的就是最能反映城市总体状 况的综合经济实力。而第一主成份在各变量上的系数就是求综合经济实力的标准化了的加权 系数。所以,我们可以用第一主成份的数值作为评价城市综
13、合经济实力的标准。至于第二主 成份,它将能反映城市经济状况的另一些特点,具体含义见下面论述。为了使主成份分析更加有效,城市个数要大于指标个数,且越大越好。但实际计算中也不可 能取太多城市。我们选出19个特大城市(1995年选了18个),资料全部取自4-8。选 用的八个指标Z1-Z8含义如下:Z1:国内生产总值(亿元)Z2:固定资产投资(亿元)Z3:货运总量(万吨)Z4:社会消费品零售额(亿元)Z5:外贸出口额(亿美元)Z6:拥有电话机数(万门)Z7:每万人中科技人员(指有中级以上技术职称)数Z8:每万人拥有的医院床位数。对于上述数据,我们用统计软件包SAS进行了主
14、成份分析,得到下述结果。相关系数矩阵的特征根数值依次为5.25450,1.57995,0.50441,0.35134,0.23049, ,累积比率依次为0.65681,0.85431,0.91736,0.96127,。第一主成份PRIN1的计算公式为(这里zi是标准化后的Zi数值,下同) PRIN1=0.420z1+0.415z2+0.384z3+0.429z4+0.254z5+0.421z6+0.123z7+0.251z8( 1)第二主成份PRIN2的计算公式为PRIN2=0.119z1+0.115z2-0.164z3+0.024z4+0.501z5+0.091
15、z6-0.641z7-0.525z8(2)仔细分析这两个公式中的系数值,我们可以看到前两个主成份的含义是明显的。第一主成份 (PRIN1)在各个变量上的系数都是正的,而且数值上相差不大,因而可以认为PRIN1代表总的 经济水平,亦即综合经济实力。当然,较大的系数是在Z1、Z2、Z3、Z4及Z6上,亦即这几个 指标最能代表综合经济实力。按第一主成份之值排序,可得下列之表2。在此表中城市的顺 序是按PRIN1的数值由大到小,即综合经济实力由强到弱而列出的。此结果显示:上海(PRIN 1=6.785)明显居于全国首位,北京(4.527)、广州(2.3
16、85)次之。可以看出,综合经济实力的 排序与Z1、Z2、Z3、Z4及Z6的总的顺序大体保持一致,但与其中任何一个并不总保持完全一 致。这说明了综合经济实力不能只用任何一个指标完全代替(即使采用最有代表性的国内生 产总值Z1也不行),它确实是考虑了多项指标的综合情况而得到的。从上面第二主成份(PRIN2)的公式(2)中可以看出,它在变量Z5上是较大的正值,而在变量Z7 、Z8上是较大的负值,其含义是有较多出口而只有较少的知识分子、较少的病床将获得较大 的数值。深圳名列第一,福州、广州、厦门次之。PRIN2也可以粗略地被认为是对“低投入
17、外向型”的度量。由于取两个主成份的累积贡献率已达到85.4%,已可以说明主要问题了。将第一主成份PRIN1作为横轴,将第二主成份PRIN2作为纵轴,每个城市就有了两个坐标 ,因而可以在平面上标出一个点。把这十九个城市全部标出就可以得到主成份坐标图(限于 篇幅此图从略)。2、指标的选取从表2中可以看到Z5与Z7、Z8的相关系数是负值,这意味着出口额较多之城市常常只有较少 的知识分子及较少的病床数,而这似乎不太合理。事实上,东南沿海地带不少城市确实存在 这种情况。而且在统计数字中,Z7(万人含知识分子数)并不能准确可比(不同城市间、同一 城市各年间
18、均不一定可比)。例如,由于户籍管理原因,许多知识分子奔赴深圳创业,这些 人中多数未能计入深圳的统计资料中。深圳市万人中只含116个中级职称的知识分子显然是 不够符合实际的。我们删除变量Z7及Z8,再进行主成份分析就得到了更清晰的结果。表2前两个主成份表(按第一主成份值为序) 城市 上海 北京 广州 天津 大连 沈阳 第一主成份 6.78498 4.52690 2.38547 0.97757 0.19034 0.11930 第二
19、主成份 0.78022 -1.08869 1.24419 0.59031 -0.99935 -2.04574 第一主成份名次 1 2 3 4 5 6 武汉 深圳 成都 重庆 杭州 西安 南京 -0.46792 -0.62625 -0.80446 -0.82453 -0.85382 -0.85548 -0 .90376&
20、nbsp;-0.40730 3.20260 -0.35251 -0.05864 0.2363 -2.03781 -0.26 295 7 8 9 10 11 12 13 青岛 哈尔滨 济南 长春 福州 厦门 -0.98600 -1.04772 -1.43990 -1.62870 -2.19944 -2.34659 0.46742&
21、nbsp;-0.62998 -0.93095 -0.20483 1.46532 1.03239 14 15 16 17 18 19 这时,特征根值依次为 4.93348,0.67707,0.28621,0.07378,累积比率依次为 0.82 225,0.93509,0.98279,0.99509,。第一主成份PRIN1的计算公式为 PRIN1=0.440z1+0.434z2+0.381z3+0.442z4+0.294z5+0.438z6(3)第
22、二主成份PRIN2的计算公式为PRIN2=0.026z1-0.008z2-0.370z3-0.192z4+0.902z5-0.107z6(4)公式(3)中的第一主成份各系数值与公式(1)用全部八个变量进行分析相差不大,它仍是正系 数的加权组合,仍代表各城市的综合实力。上海依然名列第一,以下依次为北京、广州。第 二主成份则以Z5为主要部分,其系数高达0.90,亦即它主要说明外向型经济的程度。结果, 深圳名列第一,广州、上海跃居第二、三名。至于为何北京名列最后,这是由于我们选用的 指标Z5是外贸口岸出口总额,而北京是内陆城市,不象上海、广州、天津那样都有大海
23、港, 因而北京的Z5数值明显偏低。较好的办法应该是用“出口创汇总值”来代表,但是目前各种 年鉴尚没有此类指标。删除变量Z7及Z8后,我们可以看到前两个主成份贡献率高达93.5%, 比原来有很大增长。前两个主成份数值见表3,主成份坐标图见图1。表3前两个主成份表(删除Z7及Z8,按第一主成份数值为序) 城市 上海 北京 广州 天津 深圳 大连 第一主成份 6.70397 4.16150 2.49861 1.05471 0. 12
24、001 -0.14422 第二主成份 0.49658 -1.88335 1.06498 0.19956 2.30771 0.28870 第一主成份名次 1 2 3 4 5 6 沈阳 武汉 重庆 杭州 青岛 成都 南京 -0.47666 -0.57326 -0.61603 -0.73002 -0.73877 -0.769
25、76 -0 .90278 -0.56421 -0.50645 -0.61569 -0.38547 0.41256 -0.43164 -0. 18264 7 8 9 10 11 12 13 西安 哈尔滨 济南 长春 福州 厦门 -1.28904 -1.33266 -1.55961 -1.59056 -1.74873&nb
26、sp;-2.06669 -0.31284 -0.15074 -0.14106 -0.14468 0.21761 0.33109 14 15 16 17 18 19 图193年各城市的主成份坐标图(删除Z7 、Z8)三、实证分析我们根据1995年统计资料5,用本文的方法进行分析,得出了类似的结果。采用的 指标 含义皆同前,只是Z6由拥有电话机数换成了邮电业务总量(亿元)。相关系数矩阵的 特征根值依次为5.17735,1.5797
27、1,0.62183,0.26742,累积比率依次为0.64717,0.8 4463,0.92236,0.95579,。与前述一样,可以得到第一主成份PRIN1的计算公式为PRIN1=0.419z1+0.417z2+0.293z3+0.433z4+0.288z5+0.401z6+0.268z7+0.249z8(5)第二主成份PRIN2的计算公式为:PRIN2=0.149z1+0.123z2-0.026z3+0.026z4+0.506z5+0.152z6-0.571z7-0.597z8(6)以这两个公式的系数值与(1)及(2)相比较,可以看出相应系数相当稳定,我们选择(1)或(5)&nb
28、sp;作为分析综合经济实力的公式是合适的。取前两个主成份数值已达到总变差的84.4%。从199 3年到1995年各城市的综合实力排序仅有较小变化。四、结论通过上述分析我们得出如下结论:1)在适当选取指标后,使用多元统计分析中的主成份分析法,可以将第一主成份数值作 为城市综合经济实力的度量。其公式具有较稳定的系数且所得结果可靠可信。2)由于各指标间有密切关系,评价城市综合经济实力时,不必选取过多指标。如在“指标的 选取”一节中所述,选取Z1至Z6共六个指标就已经获得相当准确的结果了。3)主成份坐标图(如图1)具有很强的直观意义,各城市的特点及相似性都非常清楚地展示出
29、 来,这是一个很有用的分析工具。作者单位:未欧俊豪马逢时(天津大学数学系300072)姬孟祥(天津市统计局300020)参考文献1林燕华(1995),“广州迈向现代化国际大都市的指标与目标研究”,城市统计 科研文集,首届科学论文讨论会,p216-229.2黎永林 林燕华(1996),“构建城市综合实力评估指标体系”,城市统计科研 文集,第二次科学论文讨论会,p181-201.3未署名(1997),“国内城市综合实力排名次广州列居首位”,信息快报, 1997年4月25日第一版.4国家统计局(1993)中国城市统计年鉴,中国统计出版社.5国家统计局(1995)中国城市统计年鉴,中国统计出版社.