当前位置:文档之家› 人口预测模型(经典)

人口预测模型(经典)

中国人口预测模型摘要本文对人口预测的数学模型进行了研究。

首先,建立一次线性回归模型,灰色序列预测模型和逻辑斯蒂模型。

考虑到三种模型均具有各自的局限性,又用加权法建立了熵权组合模型,并给出了使预测误差最小的三个预测模型的加权系数,用该模型对人口数量进行预测,得到的结果如下:其次,建立Leslie 人口模型,充分反映了生育率、死亡率、年龄结构、男女比例等影响人口增长的因素,并利用以1 年为分组长度方式和以5 年为分组长度方式预测短期据:模型检验以上模型的正确性关键字:一次线性回归灰色序列预测逻辑斯蒂模型Leslie 人口模型BP神经网络一、问题重述1.背景人口增长预测是随着社会经济发展而提出来的。

由于人类社会生产力水平低,生产发展缓慢,人口变动和增长也不明显,生产自给自足或进行简单的以货易货,因而对未来人口发展变化的研究并不重要,根本不用进行人口增长预测。

而当今社会,经济发展迅速,生产力达到空前水平,这时的生产不仅为了满足个人需求,还要面向社会的需求,所以必须了解供求关系的未来趋势。

而人口增长预测是对未来进行预测的各环节中的一个重要方面。

准确地预测未来人口的发展趋势,制定合理的人口规划和人口布局方案具有重大的理论意义和实用意义。

2.问题人口增长预测有短期、中期、长期预测之分,而各个国家和地区要根据实际情况进行短期、中期、长期的人口预测。

例如,中国人口预期寿命约为70 岁左右,因此,长期人口预测最好预测到70 年以后,中期40—50 年,短期可以是 5 年、10 年或20 年。

根据2007年初发布的《国家人口发展战略研究报告》(附录一)及《中国人口年鉴》收集的数据(附录二),再结合中国的国情特点,如老龄化进程加速,人口性别比升高,乡村人口城镇化等因素,建立合理的关于中国人口增长的数学模型,并利用此模型对中国人口增长的中短期和长期趋势做出预测,同时指出此模型的合理性和局限性。

二、问题的基本假设及符号说明问题假设1.假设本问题所使用的数据均真实有效,具有统计分析价值。

2.假设本问题所研究的是一个封闭系统,也就是说不考虑我国与其它国家的人口迁移问题。

3.不考虑战争瘟疫等突发事件的影响4.在对人口进行分段处理时,假设同一年龄段的人死亡率相同,同一年龄段的育龄妇女生育率相同。

5.假设各年龄段的育龄妇女生育率呈正态分布6.人类的生育观念不发生太大改变,如没有集体不愿生小孩的想法。

7.中国各地各民族的人口政策相同。

符号说明a i(t) ------------------ 第t 时间区间内第i个年龄段人口总数c i(t) ------------------ 第t 时间区间内第i个年龄段人口总数占总人口的比例c i k(t) ------------------ 第t 时间区间内第i 个年龄段中第k 年龄值人口总数占总人口的比例A(t) ------------------ 第t 时间区间内各年龄段人口总数的向量P(t) ------------------- 第t 时间区间各年龄段人口总数向量转移矩阵b i(t) ------------------- 第t时间区间内第i 个年龄段人的生育率d i(t) ------------------- 第t 时间区间内第i个年龄段人的死亡率d i k(t) ------------------ 第t 时间区间内第i个年龄段中第k年龄值的死亡率s i(t) ------------------- 第t时间区间内第i 个年龄段人的存活率h(t) ------------------- 第t 时间区间男性人数与女性人数的比值e i(t) ------------------- 第t时间区间内第i 个年龄段育龄妇女的生育率m --------------------------- 每个年龄段上年龄值的数目三问题分析本问题是一个关于人口预测的问题,与以往不同,本问题需要根据中国特殊的国情去研究,我们根据对问题的分析并结合实际情况认为对人口产生主要影响的因素有以下四个:生育率、死亡率、年龄结构、男女比例。

在这里需要说明的是对于人口产生影响的一些因素,如经济发展状况,生态环境情况、已婚夫妇对生育所持的态度、医疗技术的发展等,我们认为它们对人口的增长是通过作用于以上四个指标而间接发挥作用的。

而对于诸如战争爆发、疾病流行等突发因素,由于其不可预测性,我们不考虑1.生育率生育率代表育龄妇女生育人口的能力,从一定意义上讲生育率的高低控制着人口增长率高低,通常来说生育率越高人口增长率越高,所以说生育率是人口增长的源头。

生育率的影响因素很多,首先是年龄因素,不同年龄段的育龄妇女的生育率不同,通常20 岁至30 岁的育龄妇女的生育率最强;此外是地域因素,受政策因素、观念认识、周边环境等影响乡村育龄妇女的生育率高于城市育龄妇女的生育率;还有其它因素的影响,比如大规模疾病会降低育龄妇女的生育率。

2.死亡率死亡率表示一定时期内一个人口群体中死亡的人数占该人口群体的比值,和生育率一样死亡率的高低同样控制着人口增长率高低,如果说生育率是人口增长的源头,则死亡率是人口增长的汇点。

同样影响死亡率的因素很多,首先不同年龄段的死亡率不同,通常老年人和刚出生的婴儿的死亡率较高;从长远来看,随着医疗水平的提高,整个人口群体的死亡率将会成下降趋势;此外一些突发事件,如战争、疾病等,将会使使那一段的人口死亡率大幅度提高。

3.年龄结构年龄结构反映了总体人口在各年龄段分布情况,年龄结构蕴涵的信息量很大,从其中我们可以实现对很多问题的分析,比如从年龄结构我们可以分析出社会的老年化程度,此外从年龄结构我们可以判断出不同时间段人口出生的情况,比如年龄结构不仅反映了总体人口在各年龄段分布情况,而且考虑到不同年龄段人口生育率、死亡率不同等情况,我们可以在年龄结构中有效反映这些差异4.男女比例男女比例反映了总体人口中男性与女性人数的比较关系,男女比例值能反映 出体人口中男性与女性人数是否协调,男女比例主要受男女出生比和男女死亡率 的影 响,男女出生比正常范围在103-107,也就是说出生100 个女儿的同时会 有 103 — 107 个男儿出生,但是在现实社会中,女性死亡率低于男性,所以男性 与女性人数大致相等,社会维持在一个稳定状态。

但目前我国男女出生比超过 110,这不仅将导致男女比例失调,还会对人口的预测产生影响,所以在人口预 测时必须将男女比例问题考虑进去。

考虑到人口预测分为中短期预测和长期预测,两类预测因为涉及的时间长短 不同,所以考虑的因素不同,采用的方法不同。

对于中短期预测,我们假设生育率、死亡率、年龄结构、男女比例均维持在同一 稳定水平,这样我们采用方法有很多,。

对于长期预测,我们需要考虑生育率、死亡率、年龄结构、男女比例等因 素随时间变化,此外城乡人口迁移对城乡人口结构产生影响,尽管以上因素短期 内积累效应较小,但在长期中必须考虑。

在预测方法上我们选用了基于以往人口数据的一次线性回归,灰色、时间序 列预测,逻辑斯蒂模型和基于年龄结构并生育率、死亡率随时间 Leslie 人口模型中国人口预测模型四 数学模型4.1.熵权组合模型有关于人口增长预测的模型很多,比如灰色 GM (1,1),移动平均数法, 指数平滑法,一元线型回归,马尔萨斯人口模型,宋健人口模型等等,但是每种 预测方法的精度往往也不同。

组合模型和单个模型比起来,具有较高的预测精度, 组合预测的关键就在于确定各个预测方法的权重。

本文将从一个新的角度进行研究,即从信息论的观点出发,根据各个体预测方按人口统计量建立模型中短期长 期按影响增长因素建立模型法误差指标的信息熵,确定组合预测模型的权重,进行人口组合预测模型。

本文选用了一元线性回归法,逻辑斯蒂模型法,灰色GM(1,1)模型法对中国人口增长进行预测。

而1978至2005年的数据见本文表一。

.4..1.1 灰色预测模型1.模型建立灰色系统是指部分信息已知,部分信息未知的系统。

灰色系统的理论实质是将无规律的原始数据进行累加生成数列,再重新建模。

由于生成的模型得到的数据通过累加生成的逆运算――累减生成得到还原模型,再有还原模型作为预测模型。

预测模型,是拟合参数模型,通过原始数据累加生成,得到规律性较强的序列,用函数曲线去拟合得到预测值。

灰色预测模型建立过程如下:1) 设原始数据序列X(0)有n个观察值,X(0)=X(0)(1),X(0)(2),...,X(0)(n),通过累加生成新序列X(1)= X(1)(1), X(1)(2),..., X(1)(n),利用新生成的序列X(1)去拟和函数曲线。

2)利用拟合出来的函数,求出新生序列X(1)的预测值序列X(1)3)利用X(0)(k)= X(1)(k) - X(1)(k -1)累减还原:得到灰色预测值序列:X0 =X0(1),X0(2),...,X0(n+m)(共n+m 个,m个为未来的预测值)。

将序列X(0)分为Y0和Z0,其中Y0反映X(0)的确定性增长趋势,Z0反映X(0)的平稳周期变化趋势。

利用灰色GM(1,1)模型对X(0)序列的确定增长趋势进行预测2 模型求解根据2006 全国统计年鉴数据整理得到全国历年年度人口统计表如表1.年份1978 年1980 年1985 年1989 年1990 年1991 年1992 年总人口/9625998705105851112704114333115823117171万人年份1993 年1994 年1995 年1996 年1997 年1998 年1999 年总人口/万人11857119850121121122389123626124761125743年份2000 年2001 年2002 年2003 年20042005 年总人口/万人126743127627128453129227129988130756(0)X(0)= 96259 98705 105851 112704 K 127627 128453 129988 130756利用Matlab 软件对原是数列X(0)进行一次累加,得到新数列为X(1),如表2:(1)X(1)X(1)(2)X(1)(3)X(1)(4)X(1)(5)X(1)(6)X(1)(7)X(1)(8)拟核值108504109773111056112354113668114997116343误差-9799.1-3921.81647.81978.32154.62173.62175.0误差/﹪-9.93-3.70 1.46 1.73 1.86 1.86 1.84 X(1)X(1)(9)X(1)(10)X(1)(11)X(1)(12)X(1)(13)X(1)(14)X(1)(15)拟核值117702119079120471121879121879123304124746误差2147.72042.51918.21746.61456.61039.9538.3误差/﹪ 1.79 1.69 1.57 1.41 1.170.830.42X(1)X(1)(16)X(1)(17)X(1)(18)X(1)(19)X(1)(20)X(1)(21)拟核值126204127680129173130683132211133757误差-53.3-720.1-1456.4-2223.4-3001.3-3010.4误差/﹪-0.04-0.56-1.13-1.71-2.30-2.421、利用表2,拟合函数,如下:x(t +1) = 9280043e0.011624t -91837842、精度检验值c =0.3067 (很好)P =0.9474 (好)3、得到未来20 年的预测值:年份2006 年2007 年2007 年2008 年2009 年2010 年2011 年总人口/万人135321.2136903.4138504.1140123.5141761.9143419.4145096.2年份2012 年2013 年2014 年2015 年2016 年2017 年2018 年总人口146792.7 150245.5 152002.2 153779.4 155577.4 157369.5 159236.8 /万人4.1.2一元线性回归法根据表一中的数据,本文建立一元线性回归模型Y =a+bX进行预测;Y为人口数单位:万人X为年份。

相关主题