《第九章空间计量经济学ppt课件.ppt》由会员分享,可在线阅读,更多相关《第九章空间计量经济学ppt课件.ppt(68页珍藏版)》请在三一办公上搜索。
1、第九章空间计量经济模型,第一节 空间计量经济学概述第二节 空间权重矩阵的设定和选择第三节 空间自相关的检验第四节 空间线性回归模型第五节 空间计量的实证例子,空间计量经济学由荷兰经济学家Jean Paelinck在1974年提出,后经Anselin等人发展,最终形成了学科框架体系。,第一节 空间计量经济学概述,空间计量经济学发端于空间相互作用理论及其进展,沿着模型和数据驱动两条路线发展。,从模型驱动看,理论经济学的兴趣越来越从彼此独立的决策主体模型转向明确解释系统中不同主体(参数或效用)相互作用的模型。即分析个体之间的“直接”相互作用以及单个个体的相互作用是如何导致集体行为和总体模式。从数据驱
2、动看,计量经济学的热点由时间序列数据转向空间数据。空间数据之间并非完全独立,而是存在着某种空间联系和关联性,但是经典的计量经济学分析方法的基本出发点是样本独立假设。因此无法直接用经典计量分析方法揭示与地理位置相关的空间数据关联和依赖性。,空间计量经济学研究包括以下四个感兴趣的领域:计量经济模型中空间影响的确定,合并了空间影响的模型的估计,空间影响存在的说明检验和诊断,空间预测。空间计量经济学广泛应用于区域科学、地理经济学、城市经济学和发展经济学等领域。如研究区域经济、土地使用、房屋价值、人均收入、环境状况等,空间计量经济学了弥补地理空间临近带来的空间相关性和空间异质性,通过空间结构参数化方法能
3、更准确地检验空间变量相互影响的关系、方向和强度,空间依赖性(spatial dependence):表现为观测值与区位之间的一致性空间异质性(spatial heterogeneity):表现为每一空间区位上事物及变量的独特性。,空间效应,地区之间的经济地理行为之间一般都存在一定程度的空间交互作用,即空间效应,包括空间依赖性和空间异质性。,空间依赖性,空间依赖性也叫空间自相关性,这并不意味着空间上的观测值缺乏独立性,并且空间相关性的强度和模式由绝对位置或相对位置(布局、距离)决定。空间相关性是指一地所发生的事件,行为与现象,会直接或间接影响到另一地发生的事件行为和现象。通常我们假定距离较近的观
4、测值之间的空间相关程度比距离较远的程度高。,空间相关性是指第 个空间观测单元的观测变量 与其他各地观测变量之间存在着函数关系,空间自相关通常是空间相关性的核心内容,是用来测试空间某点的观测值是否与其相邻点的值存在相关性的一种分析方法。可用来表示属性值相似性与位置相似性的一致程度,一般而言,空间相关性来源于以下几个方面:(1)观测数据地理位置接近(geographical proximity)(2)截面上个体间互相竞争(competition)和合作:(3)模仿行为(copy cat):在一群体中,个体会重复或模仿一个或几个特定个体的行为。(4)溢出效应(spillover effect):溢出
5、效应是指经济活动和过程中的外部性对未参与经济活动和过程其中的周围个体的影响。(5)测量误差:,根据空间相关性的来源,可将空间相关性产生的原因分为两大类:相邻空间单位存在空间交互影响和测量误差,从而将空间相关性划分为真实(Substantial)空间相关性和干扰(Nuisance)空间相关性。,真实空间相关性反映现实中存在的空间交互作用(Spatial Interaction Effects),比如区域经济要素的流动、创新的扩散、技术溢出等。,干扰空间依赖性可能来源于测量问题,当 时,,空间异质性,空间异质性(也叫做空间不均匀性或空间差异性):各变量由于所处的区位位置不同而存在的差异性。从统计学
6、角度看,空间异质性是指研究对象在空间上非平稳,这违背了经典统计学所要求的所有样本都来自于同一总体的假设。可表示为:于检验不同区域间的空间依赖性,并不仅限于相邻区域空间异质性意味着地理空间上的区域缺乏均质性,存在发达地区和落后地区、中心(核心)和外围(边缘)地区等经济地理结构,从而导致经济社会发展和创新行为存在较大的空间上的差异性。的相关性,这是一种对拟合残差的检验),对于空间异质性,只要将空间单元的特性考虑进去,大多可以用经典的计量经济学方法进行估计。但是当空间异质性与空间相关性同时存在时,经典的计量经济学估计方法不再有效,而且在这种情况下,问题变得异常复杂,区分空间异质性与空间相关性比较困难
7、。空间变系数的地理加权回归模型(Geographical Weighted Regression,简记为GWR)是处理空间异质性的一种良好的估计方法。,空间异质性,第二节 空间权重矩阵的设定和选择,定义空间对象的相互邻接关系,这需要借助一种工具即空间权重矩阵。通过空间权重矩阵我们可以用简单的数字来表示复杂的空间地理位置关系。空间计量经济学引入空间权重矩阵,这是与传统计量经济学的重要区别之一,也是进行空间计量分析的前提和基础。通常定义一个二元对称矩阵来表达 个位置上空间单元(例如区域)之间的邻接关系,空间滞后解释为邻近观测单元上某一随机变量的加权平均,或作为一个空间平滑滤波器 或 的第 行是。这
8、正是 所有邻居的加权平均,赋予邻居的权重为为了减少或消除了区域间的外在影响,并使得W变得不再具有量纲,进行行标准化,一般以邻接标准和距离标准来分类空间权重矩阵,即分为基于邻接概念的空间权重矩阵(Contiguity based spatial weights matrix)和基于距离概念的空间权重矩阵(Distance based spatial weights matrix)。,(一)一阶邻近矩阵(the First Order Contiguity Matrix),另一种在实际分析中经常遇到的情况就是空间单元是由一些不规则的面单元构成,如图9.2.3所示的一些空间单元,可依据Haining
9、(2003)的说明给出对应的空间权重矩阵。,(二)二阶邻接矩阵(the Second Order Contiguity Matrix),二阶邻接矩阵表示了一种空间滞后的邻近矩阵。也就是说,相邻地区的相邻地区的空间信息,可反映空间扩散的进程,即随着时间的推移,起初对相邻区域产生的影响将会扩散到更多的区域。字母A表示我们要分析的空间单元对象,字母B表示A的全部二阶Rook邻居,三、基于距离的空间权重矩阵(Distance Based Spatial Weights),(一)基于空间距离的空间权重矩阵,空间权值指标随区域 和 之间的距离 的变化而变化,其取值取决于选定的函数形式。一般有欧式距离、Ch
10、ebyshev距离,Braycur距离,Canberra距离和 Gcircle距离.由于空间距离的计算公式不统一,Pace(1997)提出了有限距离的设定,(二)基于经济距离的空间权重矩阵,在经济学领域,距离的测度对象可以是各个地区任何两个变量之间的距离,如区域间的交通通勤时间,交通运输流、信息通讯量、经济发展水平、资本流动、劳动力流动,贸易流动、人口迁移等。在社会学领域,距离的测度对象还可以为居民的文化素质、社会网络合作关系的远近和人际关系的亲疏等。,较多地使用了以经济发展水平差异为距离定义的对象,一般称之为经济距离权重矩阵。为第 i 个空间单元第t年 经济变量的取值,复合空间权重矩阵,减少
11、空间权重选择主观性的途径:采用复合空间权重矩阵。假如有三个空间权重矩阵,一个是于邻近的权重矩阵 一个是基于空间离的权重矩阵,还有一个基于经济距离的权重矩阵,则可基于上述三个矩阵的加权设定如下的嵌套空间权重矩阵,第三节 空间自相关的检验,一、空间自相关的形式表达,时间序列上的自相关空间自相关空间地理关系导致的自身影响邻居,邻居反过来影响自身均衡结果受到自身的影响某种特定关联结构导致的自相关表示空间自相关的方法是指定一个空间随机过程,可分为两种类型:空间自回归过程(SAR)和空间移动平均过程(SMA)。,空间自回归过程(SAR)定义为:或,空间移动平均过程(SMA)定义为:或,二、探索性空间数据分
12、析,探索性空间数据分析(Exploratory Spatial Data Analysis,ESDA)是一种具有识别功能的空间数据分析方法,主要用于探测空间分布的非随机性或空间自相关性 ESDA本质上是由数据驱动的探索过程,而不是由理论驱动的演绎推理过程,其目的是“让数据自己说话”,通过数据分析来发现问题。ESDA主要使用两类工具:第一类称为全局空间相关性,一般用Global Morans I指数、Global Gearys C指数测度;第二类称为局部空间相关性,一般用局部空间自相关统计量LISA(局部Moran、Geary指数等)、Moran散点图来测度。,(一)全局空间自相关分析:Mora
13、n指数,Morans I 指数:,对于该指数,可以用标准化统计量Z来检验n个是否存在空间自相关,Z的计算公式:当值为正且显著时,表明存在正的空间自相关;当值为负且显著时,表明存在负的空间自相关;当值为零时,观测值呈独立随机分布。,Gearys C指数,Gearys C指数用的是中值离差的叉乘,强调的是观测值之间的离差,其公式为:,Gearys C指数总是取正值,一般介于0到2之间(2不是一个严格的上界)。当Gearys C的值接近1时,表示不存在空间自相关;当Gearys C的值小于1时,表示存在正的空间自相关,相似的属性在空间上呈现集聚;当Gearys C的值大于1时,表示存在负的空间自相关
14、,相异的属性在空间上呈现集聚。,Local Morans I指数又称为LISA(Local indicators of spatial association)用来度量 区域与其周围地域在空间上的差异程度和它们的显著性对于第 个区域 或,(二)局部空间自相关分析:Local Morans I 指数,高的 值表示高值的样本集中在一起,而低的 值表示低值的样本集中在一起,(二)局部空间自相关分析:Geary指数,29,以(Wz,z)为坐标点的Moran散点图,常用来研究局部的空间的不稳定性,它对空间滞后因子Wz和z进行了可视化的二维图示。Moran散点图的4个象限,分别对应于区域单元与其邻居之间4
15、种类型的局部空间联系形式:第1象限代表了高观测值的区域单元被同是高值的区域所包围的空间联系形式;第2象限代表了低观测值的区域单元被同是高值的区域所包围的空间联系形式;第3象限代表了低观测值的区域单元被同是底值的区域所包围的空间联系形式;第4象限代表了高观测值的区域单元被同是底值的区域所包围的空间联系形式;,(二)局部空间自相关分析:Moran散点图,空间相关性表现在两个方面:空间实质相关(spatially substantive dependence)。反映现实中存在的空间交互作用(Spatial Interaction Effects)。空间扰动相关(spatial nuisance de
16、pendence)。由归入随机干扰项的,没有作为解释变量的影响因素的空间相关性所引起的。,根据模型设定时对“空间相关性”的体现方法的不同,空间计量模型主要分为空间滞后模型(SAR)、空间误差模型(SEM)、空间杜宾模型(SDM),第四节 空间线性回归模型,空间滞后模型(SAR):当被解释变量之间的空间依赖性对模型显得非常关键而导致了空间相关时,反映因变量的影响因素会通过空间传导机制作用于其他地区;空间误差模型(SEM):当模型的误差项在空间上相关时,反映区域外溢是随机冲击的作用结果;空间杜宾模型(SDM):加入解释变量及其溢出效应而增强了的空间滞后模型。空间滞后模型、空间误差模型、空间杜宾模型
17、是空间计量经济学模型的基本类型。,一、空间线性回归模型的设定,分别是与被解释变量、解释变量的空间自回归过程和随机扰项的空间自回归过程相关的矩阵,(9.4.4),若(P+3个约束),产生经典线性回归模型,如 所示,且满足:,误差协方差矩阵的对角线元素为:Z为P+1个外生变量,若(P+1个约束),产生混合的回归空间自回归模型:,若(P+2个约束),产生具有空间自回归随机干扰项的线性回归模型:,若(P+2个约束),产生具有空间自回归随机干扰项的线性回归模型:,空间滞后模型,空间误差模型,空间杜宾模型,若(P+1个约束),产生具有空间自回归随机干扰项的混合的回归空间自回归模型:,广义空间模型(gene
18、ral version of the spatial model,SAC),横截面数据:空间滞后模型,空间滞后通常被假定是空间自回归过程,因此空间滞后模型又称为空间自回归模型,其表达式如下:其中,y是因变量,X是解释变量,W是空间权重矩阵,是参数向量,是空间滞后项Wy的参数,其衡量观测值之间的空间相互作用程度,是白噪音干扰项。空间滞后项视为一个内生变量,而且适当的估计方法必须解释这种内生性。,横截面数据:空间误差模型,空间误差模型的表达式常用的有如下几种:空间AR(1)的形式:其中,W是空间权重矩阵,是回归残差向量,是自回归参数,衡量了样本观察值中的空间依赖作用,即相邻地区的观察值y对本地区观
19、察值y的影响方向和程度,当地区之间的相互作用因所处的相对位置不同而存在差异时,则采用这种模型。,空间MA(1)的形式:(moving average)其中W是空间权重矩阵,为白噪声空间ARMA(1)的形式为:,实际上还有其他更高阶的设定情况,但鉴于估计中的空间权值问题比较复杂,目前一般空间计量模型都局限于一阶滞后模型、一阶自回归或一阶移动平均模型,且常用的比较多的是空间误差自相关,即AR(1)的形式。,横截面数据:空间杜宾模型,空间杜宾模型(Spatial Drubin Model,SDM)的形式,模型中 为直接效应参数,一个空间单元上的解释变量的变化对它自身被解释变量的影响,为间接效应参数,
20、一个空间单元上的解释变量的变化对其它空间单元的被解释变量的影响。,对空间杜宾模型右端的被解释变量移项整理之后得到,面板数据空间线性回归模型,在面板数据空间计量经济模型中,,空间滞后因变量,空间滞后自变量,空间滞后随机干扰项,面板数据空间权重矩阵形式为,空间面板滞后模型:,空间面板误差模型:,空间面板杜宾模型:,二、空间线性回归模型的估计及检验,(一)空间线性回归模型的估计 空间计量模型采用普通最小二乘法进行估计将不再适用,工具变量估计(IV)、广义矩估计(GMM)和极大似然估计(ML)是合适的估计方法。若采用极大似然估计,可根据极大似然值的对数值、AIC、SC来度量,极大似然值的对数值越大越好
21、,而AIC、SC越小越好。,如何选择工具变量Q?仅仅利用样本信息构造工具变量。利用备选的空间矩阵作为工具变量。,空间滞后模型的IV估计,空间滞后模型的ML估计,ML估计量等价于GLS估计量。,ML估计的一阶极值条件,估计步骤:分布采用OLS估计模型(1)和(2),得到相应的估计量和残差;将残差估计量带入似然函数,估计;利用 的估计量,估计随机项协方差矩阵;采用GLS重新估计模型(1)和(2);利用估计结果重新估计;,空间误差模型的ML估计,实际上等价于一个EGLS估计。,空间误差模型的ML估计,估计步骤和迭代过程与空间滞后模型ML估计类似,1、不存在空间自回归时空间残差相关的LM检验,不存在空
22、间自回归时,空间残差相关检验的原假设是模型残差不存在空间相关。,(二)空间计量模型的检验,检验方法:两个拉格朗日乘数检验,即LMLAG、LMERR和稳健的LMLAG、LMERR,利用对数似然函数,写出Lagranian函数为:,该检验统计量有两个备择假设,也就是说,该统计量对于空间残差自相关和空间残差移动平均两种空间效应均有检验效力。,2、存在空间自回归时空间残差相关的LM检验,存在空间自回归时,空间残差相关检验的原假设仍然是模型残差不存在空间相关。,检验统计量的构造原理与前述类似。统计量为:,原假设中模型的OLS估计量,该检验统计量有两个备择假设,对于空间残差自相关和空间残差移动平均两种空间
23、效应均有检验效力。,3、不存在空间残差相关时空间自回归效应的LM检验,在不存在空间残差相关时,检验模型是否存在空间实质相关。检验的原假设和备择假设:,如果原假设成立,则模型是经典单方程线性模型;如果原假设被拒绝,则可以确定模型的设定形式为空间自回归模型。,原假设中模型的OLS估计量,模型检验的对数似然函数,4、存在空间残差相关性时空间自回归效应的LM检验,当模型存在空间残差相关性时,检验是否存在空间自回归效应。检验的原假设和备择假设分别是:,如果原假设成立,则模型是空间残差自回归模型;如果原假设被拒绝,则可以确定模型的设定形式为空间自回归残差自回归模型,模型不仅存在空间残差相关,也存在空间实质
24、相关。,检验的统计量:,该检验统计量对于原假设中模型的残差结构为空间移动平均效应也同样适用。,5、判别准则,上述检验都是在一定的假设前提下进行的。检验1是在不存在空间自回归的假设下检验是否存在空间残差相关;(统计量称为LMERR)检验2是在存在空间自回归的假设下检验是否存在空间残差相关;(统计量称为R-LMERR)检验3是在不存在空间残差相关的假设下检验是否存在空间自回归效应;(统计量称为LMLAG)检验4是在存在空间残差相关的假设下检验是否存在空间自回归效应。(统计量称为R-LMLAG)由于事先无法根据先验经验判断这些假设的真伪,有必要构建一种判别准则,以决定哪种空间模型更加符合客观实际。,
25、判别准则:如果在空间效应的检验中发现LMLAG较之LMERR在统计上更加显著,且R-LMLAG显著而R-LMERR不显著,则可以断定适合的模型是空间滞后模型;相反,如果LMERR比LMLAG在统计上更加显著,且R-LMERR显著而R-LMLAG不显著,则可以断定空间误差模型是恰当的模型。,第五节 空间计量的实证例子,先运用GeoDa软件对空间计量经济学做一个入门的介绍,随后采用Stata软件对空间计量经济学做一个拓展性的介绍。(一)GeoDa软件介绍 GeoDa是Anselin为了空间数据分析和空间回归分析而开发的一个软件,目前常用的版本为GeoDaTM0.95i,可以从网址http:/geo
26、da.uiuc.edu/downloadin.php免费下载,GeoDa软件的启动界面,要求输入shape文件的文件名及可用的关键字。一个shape文件包括一个主文件(*.shp)、一个索引文件(*.shx)、一个dBASE表文件(*.dbf)和一个空间参考文件(*.prj),在出现的文件对话框中选择shape格式的中国地图(地图来自Lesage(2005)附带的中国地图文件,没有显示重庆市)作为Input Map,关键字默认为Code。,在地图窗口中点击ColorMap,可改变颜色,还可改变其他地图设置。,菜单栏由11项组成:File(打开和关闭文件)、View(选择要显示的工具栏)、Win
27、dows(选择或重新排列窗口)、和help(软件属性的介绍),其余7项是GeoDa特有的有Edit(控制地图窗口和图层)、Tools(空间数据处理)、Table(数据表格处理)、Map(制图和地图平滑)、Explore(统计图表)、Space(空间自相关分析)、Regress(空间回归)和Options(特殊应用选项),(二)GeoDa软件的空间相关分析功能,单击菜单Edit按钮中的WeightCreat,出现制作空间权重矩阵的界面:基于邻近和基于距离的空间权重矩阵,(1)在对话框中选择shape格式的中国地图作为Input File,并将空间权重矩阵的命名和输出路径作为Save Output
28、。(2)为该空间权重矩阵选择一个关键变量作为标识(可利用默认值)。(3)选择权重确定方式,根据生成的空间权重矩阵,就可进一步进行空间相关性分析。本章以一阶“车”相邻规则生成了空间权重矩阵,以此计算我国2009年人均GDP的Morans I 指数,并可画出对应的Moran散点图和LISA图。,(三)中国省域研发创新的空间计量分析,利用Stata 14软件中的xsmle命令估计面板数据空间计量模型。选取我国各省市研发人员全时当量和研发经费为自变量,分别记为rdp、rd,选取各省市的专利申请授权量为因变量,记为inno。首先生成面板空间权重矩阵W根据命令xsmle lninno lnrd lnrdp,model(sar)wmat(W)fe noeffects,得到空间滞后模型的结果。根据命令xsmle lninno lnrd lnrdp,model(sem)emat(W)fe noeffects,得到空间误差模型的结果。,根据命令xsmle lninno lnrd lnrdp,model(sdm)wmat(W)durbin(lnrd lnrdp)fe noeffects,得到空间杜宾模型的结果。,我国研发创新的空间滞后模型结果,我国研发创新的空间误差模型结果,我国研发创新的空间杜宾模型结果,