《数学建模论文基于双线性系统、差分方程的人口增长模型.doc》由会员分享,可在线阅读,更多相关《数学建模论文基于双线性系统、差分方程的人口增长模型.doc(17页珍藏版)》请在三一办公上搜索。
1、基于双线性系统、差分方程的人口增长模型摘 要社会经济的许多领域的规划都必须考虑人口这一重要因素。而人口普查只能为我们提供某几个时间点的横截面数值,但在现实生活中,人们常常需要其他时间点的人口总数及其构成。于是一个迫切的任务就是如何用少数的几个时点的信息比较准确的得到较详尽的其他时点的人口数据。人口系统发展是一个动力学过程,为强惯性系统,人口死亡率和出生率构成人口增长的双线性系统。针对中短期预测,基于统计理论,将5年的死亡出生率,死亡率求期望,建立了人口增长的定常差分方程模型,预测至2015的人口发展趋势,通过MATLAB求解得到2015年的总人口为14.17亿,乡村城镇化趋势明显;并且人口在2
2、025左右出现峰值,约为15.1亿。针对长期预测,根据动力学发展过程理论,当时间尺度接近惯性系统的时间常数(社会人口的平均寿命)时,人口状态将发生明显改变。由此建立了人口增长的时变差分模型。并通过MATLAB求解,预测2050年的人口总数为14.33亿,人口系统达稳定状态。然后,利用Leslie矩阵分析模型的稳定性。当时间t(年)充分大时人口增长也趋于稳定。针对长期模型的检验,对不同的总和生育率做出了人口总数的变化曲线。得出当总和生育率的更替水平临界值略大于2.0。关键词:差分方程,强惯性系统,Leslie矩阵,总和生育率一.问题重述与分析1.1问题重述中国乃泱泱人口大国,人口规模是城市规划和
3、土地利用总体规划中一项重要的控制性指标,人口规模是否合理,不仅影响到未来地区经济和社会发展,而且会影响到地区生态环境可持续发展。 因此准确地预测未来人口的发展趋势,制定合理的人口规划和人口布局方案具有重大的理论意义和现实意义。根据国家人口报告,对短期、中期和长期人口预测作如下定义:十年内为短期,十到十五年为中期,五十年及其以上为长期。人口发展过程是一个很缓慢的过程。它的“时间常数”接近平均期望寿命约七、八十年的时间。人口状态随时间变化的过程称为人口发展过程。目前,中国人口发展出现了新的特点,突出表现为老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化等因素,这些因素都影响着中国人口的增
4、长。要能有利于人口与经济的社会的协调发展,必须将人口总量峰值控制15亿人左右,全国总和生育率在未来30年应保持在1.8左右。同时,近年的低生育水平反弹势能大,维持生育水平代价高,这就必须创新工作思路、机制和方法。在确定人口发展战略时,必须着眼于人口本身的问题,处理好人口与经济资源环境之间的相互关系。构建和谐社会,又要优先投资人的全面发展。1.2问题分析本题是一个人口发展预测的问题。人口发展与一般种群增长一样,是由自然增长率决定的。然而,人类个体是一种社会的个体,所以人口发展有自己的特点。想到人口的迁移,性别比例等。人口发展受政策的影响,例如计划生育;也要受到人们意识的影响,像生育意识等。但是从
5、社会层面上看,生育意识在整个社会上体现为妇女的生育模式。首先,数据的处理。在经过分析和验证后,适当修正题中的个别有误数据后,利用有效数据进行建模求解。我们要提取出死亡率、生育率等,这是求解人口增长模型的必要数据。其次,模型建立。和一般的预测模型一样,本模型也是个预测模型,所以考虑到用前一年的信息来推得下一年,于是我们想到差分方程模型。同时,将死亡率与出生率分开,分别与当年的人口相乘,于是得到一个双线性的模型,即死亡与出生都与当年的人口成线性关系。最后,利用已有信息,对中短期与长期进行预测,得出反映人口发展与人口构成的关键指数。二.符号系统符号意 义单位年度总人口数万人年度岁的人口总数万人年度岁
6、的女性人数万人年度岁的男性人数万人年度岁的妇女平均每人一年生育的子女数 万人年度人口的平均年龄岁年度岁的年龄死亡率_年度男女性别比_年度岁的女性比例_年度人口相对出生率_年度自然增长率_三.模型假设1) 中国的市、镇、乡三个系统的整体封闭,不考虑国际上人口流动;2) 十年内为短期,十到十五年为中期,五十年及其以上为长期;3) 婴儿出生年份过了年底12月即为一岁;4) 90岁及其以上年龄的人在模型建立和求解中,都按90岁考虑; 四.模型分析与建立4.1 模型分析为了对我国中长期和长期人口进行预测,必须考虑我国人口的实际特征,传统的指数模型,logistic模型都不能够得到令人满意的结果,因而必须
7、建立适合中国人口增长的数学模型,宋健模型对于预测中国的人口增长具有借鉴作用。 在建立人口增长模型时,首先不考虑国际人口流动,即假设中国为一封闭的大系统,但由于我国人口地区分布的特征不能简单的用一个笼统的模型进行概括,所以可以假设市,镇,乡为独立的系统,通过对每个系统的人口增长建立预测模型,最后通过求和得到全国的人口增长预测模型。考虑到市,镇,乡每个系统均可用改进的宋健模型进行预测,因而我们首先建立对所有子系统都使用的人口增长预测模型:4.1.1封闭人口系统的离散模型1)死亡人口用表示时间,并且以年度为单位。用表示年度(比如2001年)满周岁但不到周岁的人口总数,是人能活到的最高年龄,题中,取为
8、90+。年度各年龄的人口总数叫做人口年龄构成,记为向量形式,叫做人口状态向量。年度满周岁的人口数,经过一年后变成了,其中有一部分人由于各种原因而死亡,死亡人口数为。据此定义年龄死亡率函数 (1)得: (2)2)下面再讨论生育人口 首先定义女性比例函数,它是年度岁的妇女人数与岁总人口数之比,即 (3)式中,年度满岁总人口数为,则年满岁的妇女人数为。妇女育龄区间记为,和分别为有生育能力的妇女的最小和最大年龄,题中,。用年龄别生育率表示年度年龄为周岁的妇女平均每人在一年内所生子女数。再用表示年度年龄为岁的妇女组在一年内所生育子女总数,则有 (4)新生人口,即所有育龄妇女在年度一年内所生育子女总数为
9、. (5) 令, (6) 并且满足下述条件 (7)将(6)式两边从到对求和,则有 (8)其中就是妇女总和生育率,为每名妇女按照某一年的各年龄组生育率度过育龄期,平均可能生育的子女数,是衡量生育水平最常用的指标之一。 将(8)代入(5)中,便得到 (9)由式(9)可以得出,年出生的人口数与该年总和生育率成正比。满足条件(7)的,称为妇女生育模式。它反映了不同年龄上育龄妇女的生育水平。的大小说明周岁年龄上生育水平的高低,用统计学语言,即不同生育年龄上的加权因子。在式(9)中 (10)就是年度生育了孩子的妇女加权平均数。同样与妇女平均数成正比。将(2)、(9)联立起来,就得到一个封闭的人口发展离散方
10、程组。 , (11) 引入向量和矩阵符号,人口状态向量 ,人口状态转移矩阵 ,生育矩阵 其中,。则上述离散方程组(11)可表述为下述向量形式,即为封闭系统的人口增长模型: (12)4.1.2开放人口系统的离散模型式(12)描述的是封闭人口发展过程,如果考虑人口迁入、迁出和人口城镇化的趋势。引入人口迁移向量: (13)其中,是年度年满岁的人口迁移数量,迁入为正,迁出为负。是带有统计性质的随机变量。将式(13)加入式(12)得到完整的人口增长模型: (14)上述方程为完整的人口发展离散方程。右端第一项反映了死亡因素对人口发展的影响;第二项反映了生育因素对人口发展的影响;第三项反映了迁移对人口发展的
11、影响。方程右边反映年度人口年龄构成演变到年度。方程左边则是年度人口年龄构成。因此,方程组(14)全面反映了出生、死亡、迁移和时间这四个影响人口发展的基本因素。上式(14)中,妇女总和生育率是控制量,通过控制、调节来改变和控制人口的发展趋势。状态向量是年龄构成。从控制论的观点来看,式(14)是一个双线性系统。针对市、镇和乡三个系统而言,均为开放人口系统,但把市、镇和乡作为一整体,则为封闭的人口系统。即有,。4.2 人口增长预测模型的建立针对市、镇和乡三个系统,用分别表示年度市、镇和乡的总人口。最终基本模型为, (15)五.模型进一步分析与求解5.1数据分析 通过对附录2中的数据进行分析,以及与中
12、华人民共和国国家统计局()上的数据进行对比,发现附表2中2001-2004年的城市男、城市女、镇男、镇女、乡男、乡女的数据应为1抽样调查数据;2005年的应为1.31。另外,2003年的城市妇女生育率、镇妇女生育率、乡村妇女生育率比起其他年份少了一个数量级。所以,在模型建立求解中,对上数数据进行修正。另外,在尝试对2001-2005年死亡率、生育率等做拟合时,发现1-3次的拟合都不理想,四次以上已经没有意义。下面给出2001-2005年20岁城市男性的死亡率的散点图(图1):图1 2001-2005年的城市男性死亡率散点图图中散点拟合的符合度太低,根据统计理论,采用期望作为一个计算的标准。5.
13、2 中短期人口预测短期模型直接由上面基本模型式(15)计算,下面进行简化分析与实现5.2.1中短期人口预测模型简化根据国家相关政策,定制人口预测十年内为短期,十到十五年为中期。这里取5年为一个时间段,2005年为初始点,预测短期2010年,中期2015,2020年的人口结构。先观察市、镇、乡三元结构的发展趋势,每个子系统占总体系的比例,利用Matlab 拟合工具箱,2001到2005年数据拟合,随时间呈线性关系(如图2),图2市镇乡人口比例其中线型最粗(最上一条)为乡村人口比例曲线, 中间一条为城市人口比例曲线, 下面一条为乡村人口比例曲线, 首先模型假设中国为一个大的封闭系统,其中的三个子系
14、统市,镇,乡之间相互依存,分别记为S1, S2, S3(如下图3所示)图3这里绕开了迁移率求解,对于市、镇、乡三元结构,巧妙地打断市、镇、乡三个子系统之间的联系。因为对于中短期预测,三个子系统独立发展按照模型4.1求解得到人口数与实际考虑迁移按照4.2求解得到的人口总量,经过误差分析,检验均符合较好。表1 2001和2005年人口结构表指标2001年人数/万人2005年人数/万人总人口122055.9129662.4城市29537.235938.2镇15825.522205.95乡76693.271518.2男性6537070309女性5668659354故,以2001年数据为初始条件,利用封
15、闭系统模型4.1的式(12),与迭代求得2005年人口结构如下,并与表1中实际2005年数据对比。表2 2005年数据对比指标求得2005年人数/万人实际2005年人数/万人相对误差/%总人口131260.0129662.41.23市36380.035938.21.21镇22480.022205.951.23乡72400.071518.21.22男性66916.065506.01.24女性64344.064094.01.19通过上表分析,得到 S1、S2、S3系统最终都符合的优化模型: (5.1.1)再由数据分析中可知,死亡率、生育率可用作均值处理。进而简化模型为: . (5.1.2)5.2.
16、2 中短期人口预测模型求解中短期定义为520年,取2005年数据作为初始值,带入(5.1.2)差分方程,求得2010,2015年这两个关键时间点的横截面人口结构,如下表:表3 2010年与2015年人口结构指标2010年人数/万 人2015年人数/万人总人口135510141730城市4156148217镇3039539670乡6355453843014岁25044275481564岁10247010268065岁及其以上15052185231) 城镇化分析:乡村人口比例(饼图中分离的部分)逐年下降,乡村城镇化明显。2005年比例 2010年比例 2015年比例2)平均年龄:表 4 平均年龄年
17、份平均年龄200535.0328201036.5485201537.55633)中短期(20052030年)预测总人口曲线图.图4 短期人口预测 图中曲线峰值出现在2025年附近,峰值人口约为15.1亿。5.3长期人口预测模型由于一种人口政策的社会效果不能在数年内看出其全部表现。制定政策的人甚至不能期望在他们自己的寿命范围内看出该项政策的最终结局,只有后代才能根据实际效果来评价其正确与否。因为市、镇、乡依据4.2中的基本模型:由于基本模型各项参数均是含时变量,对中短期预测影响不大,但在长期预测中,若忽略时间因素,时间上的误差积累,将导致预测的误差越来越大。比如图5 短期模型预测长期人口下面,用
18、5.1中的短期模型来估计2020年以后的人口发展,如图5。发现在2025年以后,过了一个峰值之后,人口总数持续上升,显然背离了实际情况。所以此模型对长期预测不再适用。因此,长期预测要求找到参数随时间的变化规律。首先,迁移向量随时间变化,但是考虑到人口迁移主要受到政策的控制和城市人口的容纳度的影响,所以:其中,是关于时间的总体趋势函数,而是考虑迁移受多种因素影响,而产生的波动。长期模型与短期的差别除了在迁移上,还表现在人口转移矩阵和生育矩阵。同样,考虑长期模型的影响因素复杂性,类似,给出下面修正式:用于计算的死亡率:生育矩阵修正为:于是有: 其中与为分别加入和后所得。5.3.1长期人口预测求解为
19、了方便求解,将 用的简单函数进行处理,这里是用进行计算。1)根据模型假设,50年预测为长期,取2050年时间截断面,2050年人口结构如下表表 5 2050年人口结构指标2050年人数/万人总人口143270市48081镇53540乡41663男子73211女子70059014岁227961564岁8905665岁及以上357672)由上表得,2050年,市、镇、乡比例如下图:图 6 2050年市、镇、乡人口比例3)平均年龄,对比2005。2010。2015年的平均年龄,人口结构逐步趋向老龄化,最终达稳定状态。六.模型评价与检验6.1 模型稳定性分析模型4.2中式(12),为双线性系统,其中人
20、口状态转移矩阵,人口状态向量是m维向量,因此,系统的状态空间是m维的欧几里德空间向量,它是由一切m维向量所组成的实线性空间。可以写为,令,即Leslie矩阵,得, (15)系统的稳定状态由Leslie矩阵决定。据文献2:定理1 矩阵有唯一的正特征根,且它是单重的,对应的正特征向量 矩阵的其个特征根都满足, (16)定理2 若矩阵第一行有两项顺次元素都大于0,则式(16)中仅等号不成立,即, (17)且由式(15)表示的满足 (18)从上述定理可以对时间充分大()后人口按年龄组的分布的性态做出如下分析:1) 由式(18),有 (19)这表明当t充分大时,人口年龄的分布趋向稳定,其各年龄组的数量占
21、总量的比例与特征向量中对应分量占总量的比例相同,即就表示了人口按年龄组的分布状况,故可称为稳定分布,它与初始分布无关。2) 由式(19)又可以得到 这说明当t充分大时人口增长也趋于稳定,其各年龄组的数量都是上一年度的倍,即人口增长完全由Leslie矩阵的唯一正特征根决定。显然,当时,人口递增;时,人口递减;时,人口总量不变。其中可称为固有增长率。6.2 模型检验6.2.1. 对短期模型中三系统处理方案的讨论:针对5.1中市、镇、乡三个系统,做以下分析:由于(一)三个系统之间可以一步到达,所以我们认为三个系统之间的人口只进行一次迁移(从始点至终点)。例如群体从乡迁移到镇再到市,迁移人口进行了两次
22、迁移,但本模型将其当作从乡到市的一次转移。(二)群体人口的出生率,死亡率,生育率在中短期时间范围内受环境的影响很小因而忽略不计,并认为迁移人口的出生率,死亡率,生育率仍与原所在系统保持一致,例如有群体P从乡迁移到市,但群体P的出生率,死亡率,生育率仍旧保持不变具有乡系统的属性(出生率,死亡率,生育率)。(三)本问题中系统区别于系统的因素可以认为是出生率,死亡率,生育率;并把这些因素作为系统的属性。由于,在10-15年之间转移的人口至多只能产生一代,因而可以考虑以下三种情况:1) 假设所有的迁移人口在新系统中不产生下一代,即可以把他算作原所在系统的人口,因而对于每个小系统而言,虽然有流动人口,但
23、就整个大的封闭系统而言不受影响。 2) 假设所有的迁移人口在新系统中产生下一代.虽然在新系统中产生后代,但他的数量仍旧与其在原系统中所产生的后代相同,所以对整个大的封闭系统不产生影响。3) 迁移的人口中一部分产生后代,一部分不产生后代。根据(1),(2)的分析知迁移人口对整个大系统不产生影响。6.2.2. 长期预测模型中,对总和生育率的讨论在长期预测模型中,针对不同的得到2005-2050的人口总数变化趋势。可见,在与之间,人口最终会趋于稳定,时2045年后的人口增长也比较缓慢。这与人口增长的特点是一致的。因为,一旦达到生育更替水平,出生和死亡将逐渐趋于均衡,在没有国际迁入与迁出的情况下,人口
24、将最终停止增长,保持稳定状态。图 7 不同总和生育率下的人口增长趋势6.3 模型优点1在4.2的模型建立中,死亡率和出生率(也就是相应的人口的自然增长率)作为此人口预测模型的基础,这是符合种群增长模型的特点的。同时,人口增长模型有自身的特点,比如迁入与迁出。于是,我们由封闭模型来得到了考虑迁入、迁出的开放模型。与此同时,在本题中,根据模型假设将中国看作一个封闭系统,其中包含三个开放的子系统。从而得到符合本题实际的差分模型。所以,从模型建立过程来看,此模型符合从一般到特殊的过程。从模型考虑因素来看,包含了影响人口的重要因素。2在短期模型中,考虑到此模型具有短期的特点,所以部分参数变化对整体的影响
25、较小。所以,做出合理的简化,方便了模型的求解。而由5.1中的定量检验得到2005年总人口误差为1.23%,市、镇、乡相应的人口误差分别为:1.21%,1.23%,1.22%。而男、女性人口误差为1.24%,1.19%。3在长期模型中,尽管最终发现人口总数趋于稳定,但是在人口发展过程中,由于多因素的影响,可能产生波动。于是,在模型中加入了扰动项。基于这点的考虑,使得模型更加充分。4此模型与Logistic模型相比,多考虑了人口结构的作用。比如,各年龄段的人口,性别比等等。6.4 模型缺点1把整个中国看作一个封闭的系统,不考虑外国人口的迁入与本国人口的迁出。这在人口发展历史上是不可取,所以本模型作此假设,也就限定了此模型的应用范围。2在短期模型中,简化处理时,忽略了一些参数的变化,必定会损失一些精度。这里也可视为模型的不足之处。比如,将死亡率等取期望,将人口状态转移矩阵 转化为常矩阵进行计算,这样必然导致存活人口与实际有差异。七.参考文献1 宋健 于景元,人口控制论,北京:科学出版社,1985.52 姜启源 谢金星 叶俊,数学建模(第三版),北京:高等教育出版社,2003.83 叶其孝 姜启源等译,数学建模(第3版),北京:机械工业出版社, 20054 陈杰,MATLAB宝典,北京:电子工业出版社,2007.15 王彦,八十年代以来我国人口发展的数学模型和展望,政学者论文集,2002