一.研究区概况及数据来源 (2)二.全国人口空间分布规律 (2)(一)人口空间分布 (2)(二)人口面积洛伦兹曲线 (4)三.全国人口时序变化特征 (4)(一)全国人口时序变化 (4)(二)人口预测 (5)三.全国人口空间变化规律 (6)四.全国人口变化的空间相关性 (9)1949——2009年中国人口时空变化分析杜洋1,毛宇飞1(1.北京师范大学地理学与遥感科学学院,北京新街口外大街19号100875;)摘要:本文的目的是通过对1949-2009年中国各省区人口统计数据的研究,获得中国人口时空变化规律。
利用GIS技术和洛仑兹曲线,探究人口的空间分布规律;利用人口数学模型研究中国人口的时时序变化规律同时对人口进行合理的预测;引入水文学中的变差系数和偏态系数两个参数,探究全国人口空间分布变化规律,包括人口重心变化和人口平衡性变化;利用多元线性回归的内相关关系探究人口变化的空间相关性。
关键字:人口时空变化一.研究区概况及数据来源中国位于亚洲大陆的东部(北纬53°30′—北纬4°东经135°05′—73°40′)、太平洋西岸,陆地面积约960万平方公里。
中国是世界上人口最多的发展中国家。
第六次全国人口普查数据显示,我国总人口为1370536875人。
计划生育是中国的一项基本国策。
本文数据主要来源于《新中国六十年统计资料汇编》、1990-2009全国统计年鉴,以及全国1:500万矢量化地图。
二.全国人口空间分布规律(一)人口空间分布根据2009年全国各省市人口总量及行政区域面积,计算出各地的人口密度(人口密度=人口总量/行政区域面积),如图1。
从图中可以看出,东部人口密集,西部人口稀疏,东西部人口密度差别很大,其中全国人口密度最高的地区是上海,人口密度最高达3046.3人/平方千米,西藏人口密度最低,为2.4人/平方千米,上海人口密度为西藏人口密度的1269.292倍。
平原、盆地人口多,高原、山地人口少。
东部的黄淮海平原、华北平原、长江中下游平原、珠江三角洲、四川盆地为我国人口高度密集区,人口密度多在400人/平方千米以上;而广大西北内陆人烟稀少,青藏高原、横断山区、天山南部人口十分稀少,人口密度在10人/平方千米以下。
经济中心和重点开发区人口密集。
从图中可以看出人口密度大于1000人/平方千米的地区多为区域经济中心,如北京、天津以及上海,分别是京津冀城市群与长三角城市群的核心城市,在全国经济排名中占有领先的地位。
图1.全国人口密度图(2009年)根据人口密度9级的划分,可以将全国人口空间分布划分为集聚核心区、高度密集区、中度集聚区、低度集聚区、一般过渡区、相对稀疏区、绝对稀疏区、极端稀疏区及基本无人区。
如图2所示,由此可以看出,北京、上海、天津属于集聚核心区,人口密度均大于1000人/平方千米。
高度密集区有河南、山东、江苏、浙江和广东。
黑龙江、陕西、四川、云南属于一般过渡区,在空间上与胡焕庸人口分界线吻合。
基本无人区主要分布在西北、西南地区,有新疆、西藏、青海以及内蒙古。
图2.全国人口密度9级图(二)人口面积洛伦兹曲线将各省区人口总量按从小到大顺序排序,从人口总量最少的省份开始算起,进行人口和面积的累积,分别求出该数值占全国人口总量与面积的比例,每个省区对应一组人口和面积比。
以累积人口比为横轴,累积面积比为纵轴,将该组数据绘制到平面直角坐标系中,连接相邻点得到总人口与面积的洛伦兹曲线图,如图3所示。
由此可见,总人口与面积洛伦兹曲线偏离45°对角线的程度较大,说明人口分布很不均衡,约90%的人口集中在不到60%的土地上,剩下40%土地上只集中了10%左右的人口。
图3.总人口与面积的洛伦兹曲线三.全国人口时序变化特征(一)全国人口时序变化1949年—2009年,除1987年人口总量明显减少外,中国总人口几乎呈直线上升的趋势增长,从1949年52173.29万人增长到2009年131660.7万人,增长速率高达1324.79万人/年。
根据人口年增长速率,如图3,可以将中国人口增长可以分为3个阶段。
第一个阶段为较高速率的平稳增长阶段(1949年—1971年),增长速率以2.7%为基线波动变化,最大值为3.65%(1971年),最小值为-1.07%(1959年)。
人口增量31498人,年均增长1432人。
从以上可以看出,这阶段人口增长速率变化不大,总体上保持为较高速率增长的状态。
第二阶段为速率波动下降阶段(1972年—1992年),增长速率从2.35%下降到了1.99%,在这期间经历了4次大幅下降和3次大幅上升的波动过程,增长速率的最大值高达13.50%(1989年),最小值为-6.30%(1984年),人口增量为35849人。
可见,此阶段人口数量有增有减波动幅度大,增长速率有所减小,但总量仍保持增长。
第三阶段为较低速率的平稳增长阶段(1993年—2008年),增长速率保持在1%以下,以0.7%为基线波动变化,出现了两次低谷分别为1996年的-1.62%和2004年的-0.84%,人口增量为11306人,年均增长707人,约为第一阶段人口年均的一半。
图3.中国总人口及其年增长速率变化特征(二)人口预测在人口发展的某一时期,人口可能会在短时期内呈现出线性增长趋势,即每年的人口增长速度较一致,这时可以用一元线性回归模型来对未来较短时间内的人口进行预测。
一元线性回归模型如下:P(t)=a+bt式中,t为年份,P(t)为t年的人口数量,a、b是模型参数。
根据全国人口增长的阶段性,分别用1949年—2008年(60个样本)、1972年—2008年(37个样本)、1993年—2008年(16个样本)三组阶段性的人口数据,借助SPSS软件拟合出三个全国人口的一元线性回归预测模型,如表1。
表1.三阶段样本下全国人口的一元线性回归预测模型模型数据序列样本数一元线性回归模型R2 平均相对误差模型1 1949-2008年60 Y=1436.299t-2748000 0.982 23.03% 模型2 1972-2008年37 Y=1335.596t-2547000 0.931 12.66% 模型3 1993-2008年16 Y=650.681t-1176000 0.938 2.20% 从表中可以看出,三个模型的拟合度R都比较高,模型3的平均相对误差最小,所以选用模型3作为全国人口预测模型,预测2012-2030年人口。
预测结果表明,2020年全国人口总量将达到138375.6万人,2025年全国人口总量将达到141629万人,2030年全国人口总量将达到144882.4万人。
(实际上由于1993-1996年重庆人口数据没有找到,造成模型3预测2010年人口为131868.8万人,与实际第六次人口普查137053.6875万人不符,但理论上模型3较模型1、2更精确)三.全国人口空间变化规律人口具有比较强烈的变动性,在这里运用加权平均的算法计算中国人口中心的变化。
同时本文引入变差系数和偏态系数这两个水文变量,以度量中国人口空间分布的均衡程度和不同地区的人口变化差异。
4.1人口重心的空间变化人口重心的计算是以每个省的人口为权重,近似每个省人口的重心为各省的省会,对全国人口重心进行加权平均,分别获的经度和维度与年份的关系图。
从这幅图中我们可以看出,从1949—1964年这个时间段,中国人口重心向东偏移,这是因为,建国后社会趋于稳定,生产力恢复使得东部人口急速增加。
自1965-1978年,人口重心向西部偏移,这与当时的国家政策密不可分,上山下乡使得大量人口去支援西北。
1982-1995年,人口重心持续西移。
1995-2009,人口重心又向东移动,原因是东部经济的快速增长,使得人口向东部集聚。
从总体来讲,六十年以来中国人口重心的经度变化不大,范围在113.25E-118E,人口的东西分布格局没有大的变化,呈现波动状变动。
从这幅图中我们可以看出,1949-1964年,人口重心持续向北移动,这是因为建国初期,国家大力开发东北,人口向东北迁移。
1964-2009年,人口重心持续的向南移动,这个过程原因比较复杂,一方面是因为国家政策的均衡化,另一方面是由于南方的经济发展使得人口向南方集聚。
总体来说,建国六十年来,人口重心的维度变化也不大,范围在32.45N-32.32.80N 范围内变动,前期由于历史原因人口重心向北移动,但是在可以预见的将来,人口重心向南偏移的趋势不会发生变化。
通过计算我们可以得出,人口分布重心可以用一个标准圆圈定,圆心在(32.60N,113.5E),半径为40km 。
1949-2009年,人口重心都可以落入这个范围内。
由此我们可以看出,60年来中国的人口重心变化非常小。
4.2全国人口空间平衡性分析在对空间平衡的分析中,我们引入了两个水文学变量:变差系数和偏态系数。
变差系数是描述随机变量相对于均值离散程度的统计参数,以标准差与均值之比表示。
变差系数的大小可以表示各个变量大小的均衡程度。
其公式如下: 变差系数(CV )=标准差(σ)/平均值(x )在计算中,我们以各年每个省份的人口密度为变量,获得下面的变化规律:1949—2009全国人口变差系数11.11.21.31.41.51.61.71.81949195319571961196519691973197719811985198919931997200120052009变差系数从图中可以看出,从建国以来,不同发展阶段,人口地区差异的影响因素差异巨大,所以本文将以1964年和1980年为界限,分三个阶段进行分析。
第一阶段(1949-1964年),生产力恢复,生存条件良好的地区,人口集聚上升,各地区的人口密度差异拉大,CV 值高达1.54。
第二阶段(1965-1980年),在政策的影响下,生产能力遭到一定的破坏,同时,上山下乡等一系列原因致使各地区的人口密度差异缩小,CV 值最低达到了1.25。
第三阶段(1981-2009),在经济的带动下,东部人口密集区进一步人口集聚,人口的大规模迁移,使得地区的人口密度进一步拉大。
从上图可以看出,中国人口分布的总体趋势是朝不平衡方向发展的,在可以预见的将来,中国人口分布的不平衡性将进一步加剧。
偏态系数是说明随机系列分配不对称程度的统计参数,用Cs 表示它在这里的应用意义是反映大于人口密度均值区域与小于人口密度均值区域的对称关系(包括数量的对称关系和离散程度的对称关系。
这一个参数可以表现这两个因素共同作用的结果,但是不能区分这两个因素的影响)。
偏态系数绝对值越大,样本值分布偏斜越严重。
偏态系数以平均值与中位数之差对标准差之比率来衡量偏斜的程度,用SK 表示偏斜系数:偏态系数小于0,因为平均数在众数之左,是一种左偏的分布,又称为负偏。