全国各地区流动人口影响因素研究——基于因子分析和多元线性回归模型实证分析广东外语外贸大学陈金兰、林哓冰、夏丽华目录摘要 .............................................................................................. 错误!未定义书签。
1.引言 ............................................................................................. 错误!未定义书签。
2.研究现状及存在的问题 ............................................................. 错误!未定义书签。
3.基本思路及创新 ......................................................................... 错误!未定义书签。
4.模型构建前的准备 ..................................................................... 错误!未定义书签。
4.1模型假设 ........................................................................... 错误!未定义书签。
4.2数据来源 ........................................................................... 错误!未定义书签。
4.3指标的选择 ....................................................................... 错误!未定义书签。
4.3.1反映经济状况的指标 ........................................... 错误!未定义书签。
4.3.2反映地区居民生活的指标 ................................... 错误!未定义书签。
4.3.3反映公共服务的指标 ........................................... 错误!未定义书签。
4.4变量的预处理 ................................................................... 错误!未定义书签。
5.模型的建立 ................................................................................. 错误!未定义书签。
5.1因子分析模型 ................................................................... 错误!未定义书签。
5.1.1模型的选定 ........................................................... 错误!未定义书签。
5.1.2因子分析的数学模型 ........................................... 错误!未定义书签。
5.1.3因子分析 ............................................................... 错误!未定义书签。
5.2聚类分析模型 ................................................................... 错误!未定义书签。
5.3关联度分析 ....................................................................... 错误!未定义书签。
5.4多元回归模型 ................................................................... 错误!未定义书签。
5.4.1模型设定 ............................................................... 错误!未定义书签。
5.4.2参数估计 ............................................................... 错误!未定义书签。
5.4.3计量经济检验 ....................................................... 错误!未定义书签。
5.4.4模型改进 ............................................................... 错误!未定义书签。
6.结论与建议 ................................................................................. 错误!未定义书签。
7.模型的不足与改进 ..................................................................... 错误!未定义书签。
参考文献 ........................................................................................ 错误!未定义书签。
附录 ................................................................................................ 错误!未定义书签。
摘要:我国的流动人口一直处于增长趋势,到2009年,全国流动人口上升至2.11亿人。
政府高度重视流动人口工作,并出台了一系列政策措施。
本文运用因子分析、聚类分析等方法构建了流动人口影响因素的多元回归模型,对我国31个省市流动人口的影响因素进行了实证研究。
研究结果表明:地区的综合发展水平是人口流动的驱动因素,东部沿海城市是人口最为青睐的流向城市。
关键词:流动人口因子分析聚类分析关联度分析多元回归模型1.引言在中国,流动人口是在户籍制度条件下的一个概念,目前尚无明确、统一的定义。
一般是这样认为:流动人口是指离开户籍所在地的县、市或者直辖区,以工作、生活为目的的异地居住的成年育龄人员。
随着工业化,城镇化的快速发展,中国进入了人口流动的活跃时期,数据显示,我国正经历人类史上最大规模的人口流动。
1982年至2009年,中国流动人口数量由657万上升至2.11亿人【1】。
人口流动具有重大的意义。
人口流动能够为人口流入地区提供大量的劳动力,促进地区制造业,服务业等行业的发展,总体上来说,人口流动能够为国家的经济腾飞提供丰富的劳动力,为城市化、现代化顺利发展奠定了基础,调节劳动力的地区分配。
但是大量的人口流动相应地引起一些问题:据统计,2009年中国流动人口平均年龄为27.3岁,流动人口中78.7%为农业户口,以青壮年为主。
大部分流动人口的文化程度比较低。
而大量的流动人口流入地区,势必引起人口流入地区的交通,教育,环境等问题,在制度还不完善的情况下,流动人口的医疗,保险等社会保障严重缺乏。
即使近年来国家出台一系列加强流动人口服务管理的重大决策,但大规模的人口流动会给地方政府的管理带来严峻的挑战。
如果能够建立关于流动人口与地区发展状况的模型,利用模型来研究流动人口与地区发展的关系,并初步预测流动人口,将对国家对流动人口的有序引导,地区对流动人口的管理有重大的意义。
2.研究现状及存在问题现阶段关于流动人口的文献可分为两大方面,一方面是关于流动人口现状的分析报告,另一方面是关于流动人口预测的模型。
流动人口预测的模型是人口预测的一大难题,目前还没有一种可以用于不同地区的基本办法。
西方关于人口流动预测模型比较完善的是托达罗模型,但是由于模型只表明了决定迁移的因素和关系,并没有表达出被解释变量与各因素之间明确的函数关系,所以没有得到广泛应用[2]。
在国内,有学者曾经利用地区流动人口占常住人口的比例来建立流动人口预测模型,但是由于常住人口也是经常变动,数据获取难度大,也没有得到推广。
很多学者在流动人口预测方面做了大量的研究,但是,可以发现存在一个问题。
大多数文献都有提到,人口流动受到许多因素的影响和制约,多因素法是最理想的办法,若能建立流动人口与各社会因素之间的一种线性或非线性模型,便能在充分考虑各种影响因素的基础上预测流动人口规模的变化,但是难度很大。
纳入模型的影响因素的选择和影响因素数据的获取等各个方面的困难,使该方面的研究停滞不前。
3.基本思路及创新通过收集资料,确定流动人口的主要因素,即指标,对所选择的指标进行因子分析。
接着,利用因子分析提取的主要因子与流动人口进行关联度分析,计算其关联度,若关联度高,则用流动人口对主要因子进行回归分析,得到各个地区的发展状况与流动人口之间关系的模型。
在模型建立过程中,利用聚类辅助分析流动人口的地域差异。
指标的选取原则为:尽可能全面,简洁,可获性,科学性,系统性。
本文的创新之处在于,在研究人口流动与多因素之间的关系的时候,采用因子分析,聚类等方法对数据处理后建立线性或者非线性模型。
本着大胆假设,小心求证的精神,建立人口预测模型,定量分析流动人口。
4.模型构建前的准备4.1模型假设(1)流动人口的定义:由于流动人口至今都没有一个统一的统计口径,所以无法找到直接反映我国流动人口的数据。
本文将户口在外地,住在本地区半年以上的人员(包括户口待定的人员)作为流动人口。
(2)假定各个地区在短期内,发展状况稳定。
所以可选取2009年的数据来反映短期内地区的发展状况。
4.2数据来源本文的流动人口数据是根据2009年全国各地区分性别、户口登记状况的人口推算而得的。
推算方法是将住本乡、镇、街道,户口在外地半年以上人口加上住本乡、镇、户口待定人口,再除以0.873‰的抽样比。
所得2009年全国各地区流动人口数见附录。
4.3指标的选择4.3.1反映经济状况的指标地区间的经济状况差异会引起流动人口,由最近几年关于流动人口的新闻报道中可以看出,地区发展越好,该地区的流动人口越多。
本文选取地区GDP以反映地区的该地区的经济表现,选取地区的社会消费品零售总额以反映该地区购买能力的实现,选取地区的第一产业生产总值,第二产业生产总值,和第三产业生产总值分别占国民生产总值的比重以反映该地区的经济结构。