当前位置:文档之家› 数学建模人口预测

数学建模人口预测

摘 要中国是一个人口大国,人口问题与我国的经济发展等方面息息相关。

随着我国人口数量的不断变化,人口的老龄化问题也日益突显,政策的调整不可或缺。

从当初实行计划生育政策到逐步放开生育政策再到全面实行二孩政策,我国人口发展呈现了一些新特点。

本文旨在通过多种预测方法对“全面二孩政策”下的人口数量及其结构进行预测,筛选出了经济发展的指标,并分人口结构对经济发展的影响,结论如下:针对问题一,本文参考中国国家统计局等官方资料的数据统计出各年人口总数、自然增长率等数据,建立了logistic 模型,得出人口总数的变化公式,然后建立GM(1,1)预测模型,预测2016年的人口总数,再利用SPSS 进行回归、曲线估计,得出最为符合的方程式,再利用MATLAB 函数拟合工具箱对所得数据进行拟合。

预测出2017-2030年间人口先增后减,在2021年达到峰值。

针对问题二,通过建立BP 神经网络模型,利用GM(1,1)灰色预测处理人口结构数据得到训练及测试数据集,将数据BP 神经网络算法进行多次训练,最终得到具有相当精度的稳定预测结果。

提取相当数量的经济指标并对其进行主成分分析降维处理,之后对主要经济指标及人口结构指标进行多元回归分析得到2020-2030年人口结构对经济发展的影响。

针对问题三,关键词:灰色预测 BP 神经网络 Leslie 人口结构预测模型问题假设1.将我国看做一个封闭系统,没有人口的迁入和迁出2.人口增长只与人口基数、生育率、死亡率等有关3.没有大规模战争及瘟疫等传染性疾病4.假设短期内没有外来物种对人类生存造成影响5.假设所有数据均为准确数据6.假设2050年前医疗水平和科学技术不会对人类的死亡率、出生率造成影响模型符号说明: r : 人口自然增长率 x :总人口数0x :初始年份的人口数量t :时间)()0(k x :灰色预测的原始序列 )(ˆ)0(k x:灰色预测的原始数列预测值 ij x :第i 个指标的第j 个数据i d :第i 岁的死亡率i b :第i 岁的生育率问题一 模型建立首先,我们建立了logistics 模型,具体如下)0(x x rxdtdx == 其次,建立GM(1,1)预测模型GM(1,1)是一阶微分方程模型,其形式为:u ax dtdx=+ 离散形式:u k x a k x =+++∆))1(())1(()1()1(预测公式:a u e a u x k xka ˆˆˆˆ)1()1(ˆˆ)1()1(+⎥⎦⎤⎢⎣⎡-=+- 由导数可知:tt x t t x dt dx t ∆-∆+=→∆)()(lim0 当t ∆很小并且取很小的1单位时,则近似的有:txt x t x ∆∆=-+)()1( 写成离散形式:))1(()()1()1(+∆=-+=∆∆k x k x k x tx由于tx ∆∆)1(涉及到累加列)1(x 的两个时刻的数值,因此,)()1(i x 取前后两个时刻的平均代替更为合理,即将)()(i x i 替换为)]()1([21)1().,...,3,2()],1()([21).,...,3,2()],1()([21)1()1()1()()()()()(k x k x k x n i i x i x x n i i x i x i i i i i ++=+=-+==-+))1(()()1()1(+∆=-+=∆∆k x k x k x txu k x a k x =+++∆))1(())1(()1()1()]()1([21)1()1()1()1(k x k x k x ++=+整理可得 u k x k x a k x+++-=+))]1()((21[)1()1()1()0(表示为矩阵形式:⎥⎦⎤⎢⎣⎡⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎣⎡⋯-+-⋯+-+-=⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡⋯u a n x n x x x x x n x x x 111)]1()([21)]2()3([21)]1()2([21)()3()2()1()1()1()1()1()1()0()0()0( 不妨令T n x x xy ))(),3(),2(()0()0()0(,⋯=令⎥⎦⎤⎢⎣⎡=⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎣⎡⋯-+-⋯+-+-=u a U n x n x x x x x B ,111)]1()([21)]2()3([21)]1()2([21)1()1()1()1()1()1( 则y B B B ua U BU Y T T 1)(ˆˆˆ-=⎥⎦⎤⎢⎣⎡==,模型求解1.对logistics 模型进行求解 得到总人口变化公式:rte x x 0= (0x 为初始年份人口数,21≥t )2.利用GM (1,1)模型,根据1996-2015年中国总人口数据,对2016年总人口数进行预测。

根据所建立的模型,编写GM (1,1)灰色预测MATLAB 程序,预测结果如下: 后验差比值为:0.082408 系统预测精度好下个拟合值为 138651.1856 图为灰色预测所得图像3.通过调查得到前20年(1996-2015)的人口自然增长率数据,利用SPSS 进行回归、曲线估计,得到二次型,线性下的人口自然增长率函数最为符合 如下表所示 线性及二次型下的2R 最为接近1方程式 模型摘要參數評估 R 平方F df1df2顯著性常數 b1 線性.781 64.195 1 18 .000 9.327 -.281 二次曲線模型 .985 553.075 2 17 .000 11.477 -.867 S.67437.174118.0001.641.977即(1)2ct bt a r ++=(2)bt a r += (其中b a ,均为常数) 曲线估计SPSS 过程详见附录利用MATLAB 函数拟合工具箱对所得数据用两个函数进行拟合可以得到自然增长率的线性函数为 t r 2809.0327.9-= (二次曲线情况下同理,此处不再列出) 二次曲线函数为 202793.08673.048.11t t r +-=将二次曲线函数代入rte x x 0=中进行检验,发现人口数量会一直保持高速增长,显然不符合实际,MATLAB 作图如下同理,对线性函数进行检验,所得图像如图所示发现人口增长速率过快,需要添加相关因素指标对其进行约束,题目中给出了全面二孩政策条件,通过查阅相关资料及文献可以确定二孩政策的影响ε,将所得ε代入自然增长率函数并进一步代入总人口函数,通过MATLAB作图可得由图像可以看出人口总数会在十几年内达到顶峰,然后开始出现速率较慢的负增长得到每年人口数据如下(2017-2030)147120 150280 152640 154170 154850 154660 153600 151690 148970 145480 141270 136420 131000 125080问题二模型建立1.建立一个与问题一中相同的GM(1,1)模型2.建立BP神经网络模型,神经网络是由大量神经元互联而构成的网络3.建立一个综合评价模型我们在阅读了大量文献后,选择了如下指标:GDP,人均GDP,居民消费水平,城镇居民人均可支配收入,总抚养比,就业人员数,居民消费价格指数,能源生产总量,能源消费总量,人均生活能源消费量,全社会固定资产投资总额,货物进出口总额,外商直接投资合同项目,注册资本,服务进出口总额,对外劳务合作年末在外人数。

在实际过程中发现我们所用指标过多,不利于我们之后的分析评价。

我们采用主成分分析法,对指标进行降维处理,可得到7个主要经济指标。

用这7个主要指标与相关人口指标进行多元回归分析。

模型求解1.利用GM(1,1)灰色预测算法,取1996-2005年的相关人口数据,并对2006-2015年的相关人口数据进行预测,得到相应的人口数据。

我们选择的具体人口数据指标有:自然增长率,总人口,0-14岁人口数量,15-64岁人口数量,65岁及以上人口数量,城镇人口数量。

2.将上一步中通过灰色预测得到的2006-2015年相关人口数据作为训练数据集,2006-2015年的真实相关人口数据作为测试数据集,将训练数据集和测试数据集利用归一化函数进行归一化处理,得到区间为[-1,1]的归一化的数据,代入BP神经网络算法并对其进行训练,经过多次的训练之后,我们得到了稳定的且具有相当精度的预测数据,利用反归一化函数对BP 神经网络的预测数据进行处理,得到各项指标的正常数据。

经过与同期灰色预测数据及真实数据的对比,我们发现BP神经网络所得数据较灰色预测数据更为精确、合理。

3.建立人口结构与经济发展指标体系如下:指标指标代码x总人口1x0-14岁人口2x15-64岁人口3x65岁及以上人口4x城镇人口5y人均GDP1y居民消费水平2yGDP3y服务进出口总额4y城镇居民可支配收入5y人均生活能源消费量6y外商直接投资合同项目7我们所研究的人口结构与经济发展问题受多个因素影响,这就需要建立多元回归方程,进行多元回归分析。

在进行回归分析之前,我们需要对所有指标的数据进行标准化处理,处理数据所用方程为)min()max()min(ij ij ij ij ij x x x x X --=,进而利用回归方程ε++⋯⋯+++=n n x l x l x l l y 22110,其中系数n l l l ,,,21⋯⋯表示该因素的重要程度,ε为回归系数。

利用SPSS 多元回归分析处理结果如下54217542165421554214542135421254211779.4310.3848.1295.0634.0283.0870.0132.0179.0034.0085.0634.1163.0655.00221.0019.0724.1024.0763.0028.0280.0871.1284.0808.0043.0052.0813.1142.0866.0038.0359.0831.1379.0763.0049.0x x x x y x x x x y x x x x y x x x x y x x x x y x x x x y x x x x y +-+--=++---=-+--=++---=-+--=-+--=-+--=求解结果在不实施全面二孩政策条件下,根据1996-2015年人口结构对经济发展的影响以及预测所得2020-2030年人口结构,分析可得:0-14岁人口、总人口、65岁及以上人口对各项经济指标的影响较大,问题三:首先介绍一下Leslie 算法。

依据年鉴的数据,可以将全国总人口按年龄大小等间隔的分成96个年龄组,从0到95岁,时间和年龄都是离散化的,而且年龄间隔也为一年。

记年龄n i ,,2,1⋯⋯=,记年份k t ,,2,1⋯⋯=(设初始年为第一年)由于生育政策的变化,会直接影响到适龄妇女的生育率,而对死亡率等影响不大,所以可以把死亡率i d 看为不变,所以我们只需对妇女人口数随时间的变化进行分析即可估算出人口的变化规律设第i 岁的生育率为i b ,该数据可由统计年鉴获得;各个年龄段妇女的存活率为i i d S -=1,在社会环境稳定的条件下,假设i b 和i S 不随时间变化,设i 岁的妇女的人数为i x ,定义妇女的人口分布向量)](,),(),(),([)(321t x t x t x t x t x n ⋯⋯=,则按照Leslie 模型的概念,第1+t 年的人口数量 )()1(1t x b t x i ni ii ⨯=+∑=,该式子已经去除了婴儿的死亡率,1,,2,1),()1(1-⋯⋯=⨯=++n i t n S t x i i i此时记矩阵⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯=--00000121121m n n S S S b b b b L则)()1(t x L t x ⨯=+因此当L 、)0(x 已知到时候,对所有)0()(x L t n t⨯= 矩阵L 即为Leslie 矩阵对Leslie 矩阵进行修正在上文提到的由于Leslie 模型中所用的)(t x i 只是时段t 所有年龄组的妇女数目,预测结果也是女性总数,为了得到某一年的人口总数,必须先预测未来某一年的性别比例才可得到总人数,而男女性别比例是会变化多,这样预测出的总人口数误差较大。

相关主题