北方民族大学学士学位论文论文题目:中国人口增长预测模型院(部)名称:信息与计算科学学院学生姓名:赖银波专业:数学与应用数学学号:20040291指导教师姓名:高义讲师论文提交时间: 2008年5月26日论文答辩时间: 2008年5月30日学位授予时间:北方民族大学教务处制中国人口增长预测模型摘要本课题来源于2007年全国大学生数学建模竞赛甲组A题,本文以中国人口发展为研究对象,首先综合分析题目提供的信息讨论了已有的一些预测方法及其适用的范围和优缺点,然后结合我国人口发展现状和题目提供的数据表确立了以2000年人口普查数据为基础数据、以大学生数学建模提供的2001年到2005年的各分量数据为预测指导方向、以2006年和2007年的公报数据为结果检验参照数据的整体建模思想,并在建模过程中提出了人口年龄推移算法,即通过上一年年末市镇乡男女各年龄人口数量、育龄妇女生育率和人口死亡率,计算出本年的出生人口数和死亡人口数,并结合2001年到2005年市镇乡人口比拟合出未来人口迁移变化式,在此基础上根据上一年年末人口总数加上当年出生人口数和迁进人口数,减去当年死亡人口数和迁出人口数,获得本年年末人口数量.依次进行推移,对未来30年中国人口进行预测.预测结果显示在未来30年中国人口规模将保持增长的趋势,2010年为13.4亿,2020年为13.9亿,并在2034年达到峰值14.2亿,中国人口实现零增长. 在此期间人口自然增长率持续平稳下降,妇女生育保持稳定的低水平,死亡率保持较低水平,人口抚养比持续下降,城镇化水平进一步提高,人口年龄结构继续向老年型人口转变.文章最后结合预测结果提出了我国未来应继续坚持贯彻实施计划生育政策和加强关注农村老年人口等人口政策的建议.关键词:中国人口数学模型人口预测人口政策The Model of Chinese Population Growth PredictionAbstractThe subject stems from the problem A of the 2007th China undergraduate mathematical contest in modeling(CUMCM).Firstly, the paper discusses several prediction methods and their advantages and disadvantages. Secondly, based on the census data in 2000, analyzed the data provided by CUMCM-2007, tested by the data from the BO of 2006 and 2007, combined development of Chinese population, the paper states the model of Chinese population growth prediction, gives an algorithm of age process of Chinese population, that is to say, by the population of males and females at all ages coming from cities, towns and villages last year, calculate this year’s population was born and population was died, then integrate the population of cities, towns and villages between 2001 and 2005 to add up to a comparable movement of population in the future. On this basis, according to the total population in the end of last year with population was born and population moved-out, then get the number of this year’s populati on. Thirdly, used by the model, the paper predicts Chinese population in the next 30 years and analyzes the results.The results demonstrate that Chinese population will maintain the scale of growth trend in the next 30 years, it is to 1.34 billion in 2010, to 1.39 billion in 2020 and reaches its peak 1.42 billion in 2034, and begins to achieve zero growth. During this period, the natural population growth rate maintains steady decline, women's fertility maintains a stable low-level, the mortality maintains a relatively low level, the population dependency ratio continues to drop, the level of urbanization further improves, the age structure of population continues to change to the one of the elderly.Finally, combined the results, the paper gives proposals that the family planning policy should continue to be held on and the concern of the elderly in rural areas should continue to be strengthened in the future.Key words: Chinese population,mathematical model,population prediction,population policy目录第一章常用的人口预测方法 (1)1.1 引言 (1)1.2 常用的人口预测方法 (1)第二章人口年龄推移预测模型 (5)2.1 问题分析 (5)2.2 基础数据的修订 (5)2.3 模型的建立 (11)2.4 数据结果及其检验 (12)第三章中国未来人口变化 (13)3.1 主要数据分析 (13)3.2 未来人口政策取向 (16)第四章总结 (18)致谢 (19)主要参考文献和资料 (19)附录A 主要数据图表 (21)附录B 程序代码及其说明 (24)第一章 常用的人口预测方法1.1 引言中国是世界上人口最多的发展中国家.人口多,底子薄,人均耕地少,人均占有资源相对不足,是我国的基本国情,人口问题一直是制约中国经济发展的首要因素.中国政府自1980年在全国城乡实行计划生育基本国策以来成果卓著, 据国家计生委“计划生育投入与效益研究”课题组的研究成果, 20年共少生2.15亿个孩子.若从70年代算起, 至今至少少生3亿人, 有效地控制了人口的快速增长, 为中国现代化建设、全面实现小康打下坚实的基础, 同时也为世界人口的增长和控制做出了杰出贡献.但是由于中国人口基数大, 人口增长问题依然十分严峻,仍然对我国社会、环境、资源和经济产生巨大的压力.跨入21世纪我们仍然要面对新的人口问题, 人口已由增长型向稳定型过渡, 人口结构不再是金字塔型, 至少应该是畸形金字塔[6].这样的人口结构将会给社会带来各种负面影响, 例如少儿抚养比、失业问题、负担系数、老龄化问题.因此, 在未来人口发展政策及人口预测中, 考虑到人口结构问题至关重要; 同时, 资源日益匮乏, 人口总数的增加也使得我们不得不关心人口总数将如何发展.在我国现代化进程中, 必须实现人口与经济、社会、资源、环境协调发展和可持续发展, 进一步控制人口数量,提高人口质量, 改善人口结构.因此, 准确预测未来30年人口数量及其增长, 可以为中国经济和社会发展决策提供科学依据,对于加速推进我国现代化建设有着极为重要的现实意义.1.2 常用的人口预测方法认识人口数量的变化规律,建立人口模型,做出较准确的预报,是有效控制人口增长的前提.长期以来许多学者在这方面作了不少的工作,提出了丰富的方法和模型,以下是其中几种比较典型的人口预测模型和方法:1.2.1 人口算术增长模型[4]人口增长每年按一定的增长速度进行增长,几乎接近一次函数,在许多因素不清楚的情况下,运用以下比较简便的公式预测未来的人口数量:)1(00n r P P n += 或 mn P P n +=0其中:n P 为n 年后的人口总数0P 为基年人口总数n 为预测时期长度(年数)0r 为基期人口增长速度m 为平均每年净增人口数量运用这种方法进行预测, 除了要求人口增长符合算术增长这一规律外, 还要求未来人口净增长量或增长速度大小方向均不变(至少相对稳定), 实际上很难满足, 因此这一公式未得到广泛应用, 若运用的话计算结果较为粗略.1.2.2 人口几何增长模型[4]在人口增长初期,外界对人口增长几乎不产生影响,这时人口按固定的增长率进行增长,符合几何增长模式,其公式如下:n n r P P )1(0+=其中:n P 为n 年后的人口总数0P 为基年人口总数n 为预测时期r 为人口增长速度这种方法假定人口按固定增长率增长, 但实际上不可能, 故经常有一定时期的人口年平均增长速度(或增长率)作为上式中的值, 这种公式的人口变动方向一致, 而人口本身的结构问题并不考虑在内.1.2.3 人口指数增长模型[4]在人口增长初期,经过数据的拟合可以看出,人口增长相对来说更符合指数增长,因此也存在着人口指数增长预测:rt t e P P 0=其中: t P 为t 时刻的人口总数0P 为起始时刻的人口总数e 为自然对数的底r 为人口增长率t 为时间长度这种方法实际上是人口几何增长的连续形式.它也是在假定各年人口增长率(增长速度)为常数的情况下运用,但是从长期来看,任何地区的人口都不能无限增长,即对于较长期人口预测,这个模型并不适用,这种方法也未考虑到人口结构问题对人口未来增长的影响.1.2.4 阻滞增长模型(Logistic 模型)[1]运用人口指数增长模型,在一定时期内是比较合理的,但是人口并不能无止境的增长,当人口发展到一定数量的时候,由于自然资源、环境条件等因素对人口的增长起着阻滞作用,并且随着人口的增加,阻滞作用越来越大,人口增长速度肯定要下降,从而使人口趋于最大容量,因此,在19世纪中叶荷兰生物数学家 Verhulst 提出了阻滞增长模型:rt m mt e P P P P -⎪⎪⎭⎫ ⎝⎛-+=110其中:t P 为t 时刻的人口总数m P 为人口极限规模(特定参数)e 为自然对数的底t 为时刻长度r 为固有增长率这种方法考虑到人口总数增长的有限性, 且提出了人口总数增长的规律即随着人口总数的增长, 人口增长率逐渐下降,大体上描述出了人口发展的变化规律.缺点在于在短期内如 30 - 50 年内人口增长率可能因人口生育率上升、死亡率下降等原因而呈上升趋势.1.2.5 灰度预测算法[8]在未来人口预测及人口发展政策研究过程中,必不可少的要考虑到多方面因素的影响,既有社会经济因素,自然环境因素,也有传统习俗和思维方式方面等的因素.这些因素之间的结构关系相当复杂,且处于动态变化之中,其运行机制和变化规律以及它们对人口的变化的作用无法精确表达.这些都反映出人口系统具有明显的灰色性,它是一个既含有许多已知信息,又存在许多未知或未确知信息的灰色系统.所谓的灰度预测方法,就是根据人口系统的普遍发展规律,以序列数作一次类加生成后,再建立微分方程,具体如下:给定原始数据序列)](,),2(),1([)0()0()0()0(n X X X X =,可分别从)0(X 序列中,选取不同长度的连续数据作为子序列.然后对子序列建立GM(1,1):(1) 确定任一子数据序列)](,),2(),1([)0()0()0()0(n X X X X i =.(2) 对子数据序列作一次累加生成记为: )](,),2(),1([)1()1()1()0(n X X X X i=, 其中∑===tk n t k X t X 1)0()1(,,2,1),()( .(3) 构造矩阵B 与向量n Y⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡-+-+-+-=1)),1()((2/111)),2()3((2/1)),1()2((2/1)1()1()1()1()1()1(n X n x X x X x B , ))(,),3(),2(()0()0()0(n X X X Y n =.(4) 用最小二乘法求解系数aˆ n T T Y B B B u a a 1)(ˆ-=⎥⎦⎤⎢⎣⎡=. (5) 建立GM (1,1)模型au e a u X k X ak +-=+-))1(()1(ˆ)0()1(, (6) 将)1(ˆX还原 )(ˆ)1(ˆ)(ˆ)1()1()0(k X k X k X-+=, (7) 求出)()0(k X 与)(ˆ)0(k X之差及相对误差 )0()0()0(ˆXX -=ε, %100)/()0()0()0(⨯=X E ε.灰度预测模型主要是通过单数列数据对未来进行预测,反映的是事物的整体,要求这组数据的变化比较稳定.一个明显的例子是在采用在灰度预测模型预测中国未来50年人口变化时,获得的是一条逐渐接近某一峰值的曲线[8],而具体的分析明显显示中国人口在未来50年内会出现一次峰值,但在此后这个数据将开始下降.因此对于变化比较明显的数据或者对于中国这种畸形金字塔人口结构[6],一般不会考虑采用灰度预测法.在后面的模型建立中,有部分数据的预测与灰度预测模型的要求和适用范围十分接近,为了建模的需要,根据以上思想我们在MATLAB 环境下编写了一个灰度预测程序:huidu.m (附录B-1).以上人口预测方法的特点是单数列预测,其预测结果只获得总人数和总的增长率,在形式上只运用预测对象自身的时间序列建立模型,与其相关联的因素没有参与建模和运算,并且尽管各个方法预测都有其合理性, 但它们各自的精度及时间范围相差较大,对未来人口的更深入全面研究帮助甚微.第二章人口年龄推移预测模型2.1 问题分析本课题和部分数据资料来自于2007年全国大学生数学建模试题A题.在对题目进行深入的研究,尤其是对题目提供的数据表进行全面分析后,我们发现这个数据表包含着许多人口增长随时间变动的要素,如市、镇、乡分性别各年龄人口数、出生率、死亡率、男女出生性别比和育龄妇女生育率等,同时常识告诉我们,某一岁在去年的人口数减去这一岁在去年的死亡数,可以推出下一岁在今年的初始人口数,而下一岁在明年的初始人口数又可以通过下一岁在今年的初始人口数减去这一岁在今年的死亡数.结合2001年和2005年各年龄人数比率图像(如图2-1)可以看出这是一个类似于流水的问题,不同的是这个水流除了源头之外,其他水域的水只有流出没有流入,而且源头每年水的流入量又可以通过部分水域水量计算出来,即0岁的人口数即当年的新生婴儿数,可以通过妇女的生育率进行推导计算.综合这些信息,我们考虑对市镇乡男女各年龄上一年的比例和人口调查数据等相关信息进行分析和预测,获得下一年出生人口、死亡人口和迁移人口,然后通过上一年年末人口加上下一年出生人口和迁进人口,再减去死亡人口和迁出人口,获得下一年的人口数量,称这种方法为人口年龄推移预测模型.图2-1 2001年与2005年按年龄人口比2.2 基础数据的修订对于人口年龄推移预测算法,主要考虑从人口的出生、死亡和迁移等三个方面进行研究,但是在研究这三个方面之前有一个关键的问题,就是基础数据和预测参数,预测结果是否接近真实取决于基础数据的准确性和预测参数的合理性.在对题目附件提供的数据进行分析后,不难发现,历年市镇乡各年龄男女真实人口数并没有给出,而仅仅只是给出了历年样本容量,当然,通过查找历年总人口数据,然后按比例进行分配,并以此作为基础数据未尝不可,但是样本容量体现全体本身就存在很大的局限性,其准确性十分脆弱.为了使数据更为合理,最好能够找到实际具体的整体数据.值得庆幸的是,2000年我国进行了第五次全国人口普查,这次普查获得了相当丰富的数据,因此,本模型考虑采用此次人口普查数据作为基础数据的原始数据来源,主要参考《第五次人口普查数据(2000年)》[13].基础数据是人口预测的出发点,基础数据质量的高低直接影响到人口预测的精度,因此,在使用基础数据之前,需要对其进行评估,并对数据进行必要的修订.第五次全国人口普查的同时,国家统计局也对中国人口进行抽样调查,在对结果进行评估和修订后显示,2000年人口普查对总人口漏报率大约为1.81%(2072万人),0~9岁的漏报率在5%以上,在10~45岁有许多年龄上的重报;出生有较严重的漏报,而且农村地区更为严重;死亡也有相当程度的漏报.在综合分析了1990~2000年人口变化后学者们认为2000年0-9岁漏报人口为2081万人,我们根据这一结果对2000年人口普查数据进行了回填,并假设0-9岁人口漏报发生在乡村地区[13].2.2.1育龄妇女生育率的修订与出生关系比较密切的数据主要是育龄妇女生育率.建模题目给了2001年到2005年市镇乡按年龄的育龄妇女生育率和1995年到2005年市镇乡育龄妇女总生育率,对于后者,如图2-2,可以看到,尽管出现波动,但历年市镇乡育龄妇女生育率整体是在下降,并且变化相对比较稳定,通过回归和模拟,可以计算出下降参数并且预测未来短期内市镇乡育龄妇女生育率;2001年到2005年市镇乡按年龄的育龄妇女生育率结合自身的变化,并根据上面提供的市镇乡育龄妇女生育率的变化,推测出未来短期内市镇乡按年龄的育龄妇女生育率.具体解决过程如下:1、给定的数据表中缺少2000年的市镇乡妇女生育率,对于预测未来20年的生育率存在阻碍,对此首先通过MATLAB中的最小二乘法函数polyfit()进行拟合,程序如下(通过对比,在取四次拟合时获得的曲线与给定的点较吻合):x=[1 2 3 4 5 7 8 9 10 11];x2=[1 2 3 4 5 6 7 8 9 10 11];y=[37.271 36.61 37.77 36.22 35.1 31.03 26.68 26.7 29.13 26.3];%市妇女生育率,缺少2000年数据[p,s]=polyfit(x,y,4);y2=polyval(p,x2);y2(6);2、分别再取y为下数列重复以上操作,y=[43.651 45.9 40.69 41.73 42 37.11 34.87 35.9 35.91 32.61];%镇妇女生育率,缺少2000年数据y=[54.505 57.83 55.79 53.63 50.9 46.3 45.17 44.3 43.56 39.92];%乡妇女生育率,缺少2000年数据可获得2000年市镇乡育龄妇女生育率分别为:32.35% 38.51% 48.00%如图2-2,可以看出,曲线平稳下降,并未出现大的波动,很适合运用灰度预测方法,因此调用附件程序huodu.m(B-1)分别对以上y值进行预测,获得市镇乡妇女未来生育率(附表一).图2-2 历年育龄妇女生育率曲线2.2.2 各年龄育龄妇女生育率的修订其实,在人口年龄推移预测模型中,育龄妇女总平均生育率并不能作为其中的一个计算数据参与运算,对于出生人口的求解,按年龄分配的育龄妇女生育率才是实际用到的数据,也是人口年龄推移预测模型的关键点之一.但是育龄妇女总平均生育率也并非一点用处都没有,通过观察数据可以看出,未来20年内,妇女生育继续保持稳定的低水平,生育率有逐渐减小并趋于平稳的趋势,一般保持在1.5个千分点左右并以每年0.1个千分点左右进行减少,这便为按年龄分配的育龄妇女生育率的预测提供了方向.五年的按年龄分配市镇乡育龄妇女生育率并不能准确地预测未来按年龄分配市镇乡育龄妇女生育率,但结合对育龄妇女总平均生育率的分析,通过对数据的修正,便可以获得下一年市镇乡育龄妇女各个年龄的生育率.为了使计算量不至于很大,也使过程相对简单些,通过对比和参考曲线后决定对年龄进行按段分析.通过参照附图1.1、1.2、1.3后,考虑用如下这种分配:15到18岁为一组,这组生育率没有明显的变化,因此在模型中将取01-05年五个值的平均值;19到22岁为一组,可以看出这组数据有明显变大的趋势,只是变化的速率不是很大,同样可以采用取递增量平均值的方法;23到30岁一组,这一组有明显减小的趋势,而变化速率各不一样,因为跨距不是很大,综合之后决定采用按年龄点进行拟合预测;30到49岁为一组,与第一组一样,变化并不是很明显,因此同样考虑按年龄取01-05年的平均值.2.2.3 市镇乡男女出生性别比的修订如图2-3,对于市镇乡的出生性别比在短期内跳跃性很大,几乎是无法进行预测,但考虑到其波动的范围比较小(介于110到125之间),因此,在对未来30年的预测时,同样可以考虑运用灰度预测方法,运用过程同2.2.2,获得未来30年市镇乡男女出生性别比附表二.但获得的数据是以女性为100人进行比例分配,为了在后面建模中方便的使用这组数据,我们在EXCEL软件环境下,将数据转化成百分比分配的数据组.图2-3 市镇乡男女出生性别比曲线2.2.4 死亡率的修订人口死亡水平是造成人口数量和结构变化的重要因素之一,特别是预期寿命和婴儿死亡率是衡量社会经济发展程度和人民生活质量的重要指标.在EXCEL软件环境下对2001年到2005年的各区域、各年龄死亡率并结合2003年中国人口统计年鉴[7] 的分析后可以看出,这五年死亡率并没有明显的改变,总体保持在低水平,仅以每年0.02个千分点左右进行下降.从分年龄段的死亡率看对人口死亡率下降起明显作用的是0岁和64岁以上年龄段死亡率的降低,尤其是0岁婴幼儿死亡率呈下降趋势,下降幅度最大的是65 岁以上的老年人口的死亡率,婴幼儿死亡率下降的主要原因是计划生育,优生优育为广大育龄妇女所接受的妇女卫生保障体系和服务质量进一步提高,儿童计划免疫普及儿童医疗保健和生活条件不断改善,同时老年人口的医疗保健条件改进和生活质量都有了很大的提高,使老年人口死亡率下降.换句话说就是在未来短期内,中国人口的死亡率将维持现在这种低水平(假设未来短期内不会发生重大的人口非正常死亡事件).因此,同样可以采用2000年的人口普查数据为基础数据,对于后来产生的下降变化,主要考虑分别在0岁婴儿死亡率和64岁以上老年人口死亡率进行参数修正.如图2-4可以看出,尽管市镇出生婴儿死亡率波动比较大,但是整体水平都大致保持不变(通过数据分析发现略有下降),只有乡村出生婴儿的死亡率下降得比较快,乡村婴幼儿死亡率下降的主要原因是计划生育优生优育为广大农村育龄妇女所接受妇女卫生保障体系和服务质量进一步提高,儿童计划免疫普及儿童医疗保健和生活条件不断改善.因此,我们只考虑乡村出生婴儿的死亡下降规律.图2-4 历年出生婴儿死亡率2.2.5 迁移问题在众多人口预测模型中,迁移问题都是被忽略的一个问题,主要存在以下几个原因:首先,从大的方面讲迁移又分为境内外迁移和市镇乡的人口迁移.前者又叫移民,由于中国的飞速发展,前景非常好,有越来越多的国外朋友申请移民中国,不过反过来,中国飞速发展背后产生了一定的环境、自然资源问题,还有国外如西欧和北美等经济发达国家,经济、医疗和教育水平等仍在世界前列,中国公民往境外移民也有相当的比例,因此,移民一般都是被假设为平衡,因此被忽略了;而后者,在中国现阶段的情况,主要是农村人口向市镇方向迁移,还有市镇的发展向农村扩张,城镇人口比重是衡量经济发展水平特别是工业发展水平的重要标志,随着我国改革开放和经济建设的发展,城镇化水平有了较大提高.在一般情况下,如果从单一的人口总数预测,城镇化并没有什么意义.但在人口年龄推移预测模型中,迁移问题就显得非常重要了,从上面对出生率、死亡率及出生性别比分析不难看出,市镇乡由于素质、观念等因素不同,在这些方面都存在着很大的不同.而这些又是影响人口变化的关键因素.因此,本着尽可能减小误差的原则,我们考虑运用数学建模提供的每年人口抽样调查的样本容量(人数)数据,在转化成百分比后,分析未来市镇乡人口迁移变化方向.图2-5 历年市镇乡按性别迁移比曲线通过图2-3曲线可以看出乡男性与女性人口比例逐年平稳减少而镇市男性与女性人口比例逐年平稳增加,同样可以采用灰度预测方法,但此时要求六个数据之和为1,由曲线还可以看出历年市镇男性人口和女性人口比率是几乎相等的,而历年乡村男性人口比率明显比女性人口比率高,说明乡村重男轻女思想还是比较严重的.2.2.6 市镇乡人口按年龄性别分配这是一个关乎全局的问题,无论是生育、死亡还是迁移,都要有一个具体的人口数量与之组合,同时这个数据又随着市镇乡人口按年龄性别分配比例每一年都在改变,而它的变化也是要通过生育、死亡和迁移的变化随时间推移的,这几个因素是相互联系,形成一个整体.通过市镇乡育龄妇女按年龄分配的数据和各自的生育率,可以计算出本年度市镇乡的出生婴儿数,再通过出生性别比分配,很容易就获得下一年市镇乡0岁男婴与女婴的人数.同样地,本年各年龄段人数减去当年死亡人数,再加上本年本年龄段的净迁进量,便可获得下一年度本年龄段的人数.2.2.7 预测参数的确定在人口年龄推移预测模型中,育龄妇女出生率、出生性别比、人口死亡率、迁移等数据并不是一成不变的,随着时间的推移,人口的结构、素质、观念的变化以及城市化进程的推进,这些数据都在变化着.通过对2001年到2005年的各组数据进行分析对比后可以发现,尽管这些数据都在变化,但是变化的幅度不是很大,而且都相对比较稳定,十分符合灰度预测的适用范围,因此,对于以上各组数据的变化预测,我。