中国人口增长预测模型张孟琦、王光昭、陈阔指导教师:杨亚莉(空军工程大学,西安 L25)摘要:本文从中国60年代开始出现的回声婴儿潮现象,以及如今中国城乡人口生育差异和男女比例失调等特点出发,将市、镇、乡中不同性别人口按年龄段分别处理,并引入农村人口向城镇迁移的因素,建立起一个关于中国人口增长的常微分方程组初值问题的数学模型和Leslie矩阵迭代模型。
还利用该模型对中国未来人口的增长变化进行了预测。
并通过MATLAB软件编程分别建立长、短期男女人口比例模型,针对男女比例失调问题,就中国男女比例变化趋势对未来中国人口的增长变化的影响进行了预测与讨论。
关键词:回声婴儿潮;男女比例;老龄化;城镇化1、引言:近年来中国出生人口性别比持续升高,第五次全国人口普查为117,2003年抽样调查为119,个别省份超过130。
2005年1%抽样调查为118.58。
城乡均出现异常,农村失调程度更为严重。
预计到2020年,20-45岁男性将比女性多3000万人左右。
同时,中国也是目前世界上唯一一个采取干涉生育措施的国家,因此我们想就此对我国未来男女比例的影响做出分析。
在这里我们要引入回声婴儿潮(Echo baby boom)的概念来分析我国的人口情况。
下图(底图来源:世界银行)是中国1962年以来40多年间的人口自然增长率曲线(蓝色):因为1962年之前有过5年左右的非自然增长,所以我们把50年代的数据不计入分析过程。
进入60年代,随着“三年困难时期”结束,生产在一定程度上恢复稳定,又加上鼓励生育,所以在1962年-1971年期间第一个稳定的婴儿潮B,其峰值发生在1966年(红线1)。
70年代中期开始调整了生育政策,并且随着生产生活的模式的变化,之后人口增长率陡降。
80年代以后,婴儿潮B的大多数女性开始进入生育年龄(当时全国平均是22岁),开始迎来了第二批稳定生育高峰,婴儿潮C,这个C的形状是B的复制,就像回声一样一波一波的,所以称为(第一)回声婴儿潮,发生在1982年-1991其峰值出现在1988年(红线2,即1966+22,完全符合生育年龄均值)。
现阶段是平均生育年龄是27岁,随着回声婴儿潮C中出生的人口逐渐进入生育年龄,理论上潮D的峰值应该出现在2015年,但是尽管现在全国已经放开二孩政策,近几年的曲线却较为平缓,回声婴儿潮D并没有如期而至。
通过分析,我们认为这主要是由于人们生育观念改变导致的,因而我们可以认为在未来如果不考虑世界大战、重大灾害等重大事件,总人口自然增长率将不会有较大波动,我们将在这个条件下建立模型推算未来的男女比例。
2.模型的预备知识2.1模型假设1)不考虑国境间人口流动对人口统计的影响;2)不考虑所统计的数字中的人口漏报的现象;3)不考虑各地方生育法规的灵活性政策对全国人口政策影响;4)不考虑针对少数民族的特殊政策;5)不考虑多胞胎的情况;6)90岁以上的人口统视为一个年龄段群体;7)国内社会经济形势基本稳定;8)国内人口迁移为农村向城市的单项迁入,且关于年龄的分布不随时间变化;9)在预测时间内,没有发生重大的社会政治事件和严重的流行性疾病、自然灾害等影响人口发展的事件。
2.2基本概念及符号说明1)出生率:某一阶段种群内出生个体数与种群总数量的比值,对人类是指某年每1,000人对应的活产数。
2)死亡率:衡量一部分种群中,一定规模的种群大小、每单位时间的死亡数目(整体或归因于指定因素)。
人类死亡率通常以每年每一千人为单位来表示。
3)总和生育率:指该国家或地区的妇女在育龄期间,每个妇女平均的生育子女数。
这种生育率计算方式,并非建立在真正一组生育妇女的数据上,因为这涉及等待完成生育的时间。
此外,这种计算模式并不代表妇女们一生生育的子女数,而是基于妇女的育龄期,国际传统上一般以15岁至44岁或49岁为准。
一般来讲如果总和生育率小于2.1(对已发展国家来说),新生人口是不足以弥补生育妇女和其伴侣数量的。
4)性别比:指族群中雄性(男性)对雌性(女性)的比率。
3、模型建立3.1主模型的建立由于在讨论到出生率和死亡率时涉及到不同年龄段的问题,所以需要对上述每一类人口在各年龄段所占的比例分别做出估计。
90岁以后各年龄的人口数较少,死亡率具有相同的特征,为方便起见,我们将其作为一组数据来处理。
通过对上述数据的分析及相关资料(《世纪之交的中国人口》等)中的一些讨论,可以看出,老龄化的结果造成老年人口增加,而幼年和青壮年的人口在总人口中所占的比例则逐步减少。
数据分析还表明,育龄妇女的生育年龄主要集中在20至35岁,且其生育率趋于常数。
我们用下标n (1、2、3)分别表示地区(市、镇、乡); 设()j n CY ,()j n CX ,()j n DY ,()j n DX 分别为男、女出生人数和男、女死亡人数函数,()j i a n ,Y ,()j i a n ,X 分别为男、女人数占总人数比例函数,以男性人口为例,男性出生人口总数占总人口数的函数表达式为:()1j 0a +,n Y =()1j n n +j SUM CY )(其中i 为所对应的年龄(90岁以上统一表示为90+),j 为所对应的年份按男女出生人数比率分配为105:100其中表示第j+1年男性新生儿即0岁人口占总人口的比重。
然后我们通过利用加权求和的方式求出第j 年总的出生()1j 0a +,n Y人数:()j n CY +()j n CX =()∑=5015i j i a ,n C ×()j i a n ,Y ×()j n SUM设()j a n C ,()j a n DY ,()j a n DX 分别为育龄妇女生育率和男、女死亡率函数,采用加权求和的方式,计算第j 年内死亡的总人数为:()j n DY +()j n DX =()∑+=900i n j i Y a ,D ×()j i a n ,Y ×()j n SUM我们设()j n SUM 为总人数函数,则有()1j n +SUM =()j n SUM +()j n CY +()j n CX -()j n DY -()j n DX这样我们很容易求得第j 年某城市的人口总数以及男女各占的比例,但同时,问题出现了,我们很容易发现这个模型中存在一点错误,那就是人会随着时间的推移,年龄也随之增长,而且并没有把各个年龄阶段死亡的人数计算清楚,只能大概了解到死亡的总数,这样的话很容易导致误区,从而导致结论的不可靠性。
现在我们对模型进行进一步更正,每j+1年i+1岁的人数所占比例(2005年除外)更正为()1j 1i a ++,n Y =()j i a n ,Y ×[]),(j i aDY -1n 利用EXCEl 进行迭代计算,算出所需年份的总人数,男女所占的比例。
整理公式为:()()()()[]()()j i aC SUM DX Y CX CY n ,2005j i a 12005i a j j n n 5015i j 2005n n n ⨯⨯-⨯⎥⎦⎤⎢⎣⎡=+∑∑=,, 以女性为例,2005年后第j 年求市女性各个年龄的人数的迭代矩阵模型为()()()()()()05.11,90...1,01,...1,0,...,0⨯⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛-+-+⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛--=⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛j X j X C j i X j X B j i X j X n n n n n n n n其中,我们按照国家现阶段的现实情况把男女出生比例定为105:100。
⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛=919191903221.....................0...00....0....0b b b b B n表示i(0<=i<=89岁和大于89岁女性的存活率。
⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛=0..................................0.......00.....0150115c c C n(15<=j<=49)表示j 岁镇女性生育率。
3.2模型的确定由于上面已确定了城镇和农村的男女各年龄段的比例函数,现在误区,导致结论的不可靠性我们就可以按前面所作的基本假设,即生育率是由育龄妇女的数量决定的、农村和城镇育龄妇女的生育率均不变、出生人口性别比均不变、各年龄段的人口的死亡率也均不变,以及农村人口按照一定的常数比例向城镇迁移这几个j 1c ()()1i 2i b ++要点,按照各类人口的出生率、死亡率和迁移率这三个方面来建立下面的方程模型:设ω,θ,λ——市、镇、乡人口总数;1α——市育龄妇女生育率,2α——镇育龄妇女生育率,3α——乡育龄妇女生育率;1β——市男性死亡率,2β——镇男性死亡率,3β——乡男性死亡率;1γ——市女性死亡率,2γ——镇女性死亡率,3γ——乡男女性死亡率;()()()⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡=∑∑∑===335015i 33225015i 22115015i 11--j i aX j--j i aX j --j i aX djd γβαλλγβαθθγβαωω,,,d d d d 该模型表明,各类人口的出生率取决于相应育龄妇女的数量;而死亡率的改变是因为中国进入老龄化;市、镇、乡的人口增长率还存在着较大的差别;农村人口的城市化正在稳步向前。
这均反映出中国人口增长的各个特点。
3.2迁移率子模型的建立人口迁移和流动作为一种复杂的社会经济现象,对荆棘发展、人口分布起着重要影响。
流动迁移对剩余率有着非常显著的影响,所以在进行人口预测时就必然要考虑迁移率。
但由于人口迁移流动的概念界定和统计口径上的不同以及我国户籍制度等问题,加之各次普查和全国性的抽样调查得到的多是存量指标,故不能得到精确的人口迁移数据。
所以按人口城镇化水平年均增长1个百分点计算。
考虑城镇化对人口增长的影响很明显,我国城镇化进程不可能按照线性增长长期发展下去。
据文献,到2020年,中国城镇化率讲达到最大值,中国城镇化将逐渐变缓,最终进入城镇化比率为0.7~0.8的平稳区。
鉴于上述特点,我们采用Logistic 曲线进行数据拟合,得到如下城镇化趋势的预测式C (t )=’t 0501.0e 0443.1175.0-+从上图我们可以看到城镇化率不断提高到2100年左右时接近0.75,该数据是根据国家发展规划得到的。
城镇人口则先增后减,体现出两个阶段的人口发展;第一阶段是2050年之前,城镇率的影响占据主要地位,大量的农村人口涌入到城市或由于许多农村发展而变成城镇人口。
因此城市人口不断增加,乡村人口净增长也呈现出上升趋势,而农村人口测不断下降。
第二阶段是2050年之后,一方面全国总人口不断下降,城镇人口发展增速也不断减小,因此均呈现出下降趋势。