当前位置:文档之家› 基于关键词共现聚类的新型城镇化研究热点分析

基于关键词共现聚类的新型城镇化研究热点分析

基于关键词共现聚类的新型城镇化研究热点分析 (作者 虞昌亮) 摘要:以“新型城镇化”为关键词,选取2011-2015年的1085篇CSSCI期刊论文为样本,分析新型城镇化研究的新趋势。通过对文献的外部特征如发表年份、期刊分布、文献作者等进行统计分析,近五年新型城镇化已成为热点。通过关键词共现和聚类分析,研究聚焦于新型城镇化发展路径模式、城镇化公共服务保障机制、城镇化实证分析及顶层设计、人的城镇化与绿色协调发展、土地管理与金融创新、户籍改革与房地产业发展等六个领域。 关键词:新型城镇化;关键词共现;聚类分析;研究热点

20世纪80年代初期,在改革从农村向城市发展的背景下,城镇化一词在我国出现并进入了学者研究的领域,较早的学术论文是1979年《城市规划》上刊发的吴友仁教授《关于我国社会主义城市化问题》。多年来,城镇化的研究不断发展,成果累累,随着《国家新型城镇化规划(2014-2020年)》的发布,新型城镇化的关注将不断深入。 一、新型城镇化研究文献概况 通过对文献的外部特征如发表年份、期刊分布、文献作者等进行统计分析,了解2011- 2015年近5年来学者研究新型城镇化的基本概况。 (一)数据来源 通过CNKI期刊高级检索,以关键词“新型城镇化”为对象,时间跨度从2011年到2015年,来源类别选取CSSCI,检索日期为2016年1月12日,共检索到1085篇文献。 (二)发表年份 近五年新型城镇化研究公开发表的文献数见图1,如图所示,基本趋势是逐年上升,2015年有所下降。2013年数量有了量级的飞跃,是前一年的数10倍,主要原因是2012年党的十八大把新型城镇化列为重要发展战略,当年底中央首次召开了城镇化工作会议,学者研究急国家之所需,出现井喷之势。虽然2015年呈下降,但数量依然很大,整体上新型城镇化研究热度不减,未来可期。

626248454351

050100150200250300350

400

450500

20112012201320142015年份发表论文数量

图1 近五年新型城镇化研究文献数量 (三)期刊分布 新型城镇化相关的研究文献1085篇发表在276种期刊上,节选出刊发量较多的期刊见表1。其中刊文量最多的是《经济研究参考》,该刊定位于反映国家改革开放和经济发展的全局性问题和深层次问题,新型城镇化自然是近年来我国经济发展突出问题,另一方面该刊出版周期为周刊,发文总数量也较多。其次是《城市发展研究》和《宏观经济管理》,《城市发展研究》是中国城市科学研究会的会刊,服务于国家城镇化和城市科学发展;《宏观经济管理》是国家发改委的委刊,注重研究探讨国民经济运行中的重大问题。通过分析,期刊的发文量一方面与该刊的定位宗旨有很大的关系,另一方面近年来多种期刊在选题上也非常青睐新型城镇化方面的文献。 表1 期刊分布情况(部分) (四)文献作者 文献的作者可能是某个课题组或是多人,某个课题组在本文分析中视为一个文献作者,多个作者视为每个作者均独立发表了这篇文章。通过excel分列排序统计,发表两篇及以上文献的作者达到了209人,发表3篇及以上文献的作者有41人,充分说明对新型城镇化的研究百家争鸣,成果丰硕。发表4篇及以上文献的高产作者有16人,具体信息如图2所示。

9666555444444444

012345

678910

贾康倪鹏飞张鸿雁张占斌新型城镇化建设课题组徐盈之赵永平冯奎辜胜阻胡若痴黄亚平刘国斌沈和石忆邵薛翠翠张冰松

图2 高产作者 二、新型城镇化高频关键词共现分析 通过CNKI中国知网文献输出功能,自定义导出excel文件,对1085篇文献进行关键词提取,使用excel相关功能,形成新型城镇化高频关键词的共词矩阵,并进一步转化为相关矩阵、相异矩阵,再导入SPSS20.0,进行因子分析和聚类分析,做研究热点的归纳分析总结。 (一)关键词提取处理 对1085篇文献,使用excel对关键词列进行分列、排序、统计和数据透视图,共提取关键词2803个,节选部分高频词得到表2。根据Donohue的高频词低频词界分公式

)811(211In,I1是词频为1的关键词数量1,I1值为2211,得到n=65,高频词阀

值是65,即核心关键词只有新型城镇化、城镇化,显然无法进行深入研究。 关键词 词频 关键词 词频 关键词 词频 新型城镇化 923 经济增长 20 农民 13

期刊名称 发表文献数(篇) 占比(%) 经济研究参考 45 2.5 城市发展研究 38 2.1 宏观经济管理 37 2 中国发展观察 26 1.4 经济纵横 25 1.4 环境保护 21 1.2 城市规划 20 1.1 城镇化 78 农民工 18 可持续发展 12 城市群 38 农民工市民化 18 路径 12 转移人口 38 以人为本 17 民族地区 12 人口城镇化 32 城市规模 16 城镇化道路 11 中国城镇化 31 对策 15 基础设施 11 城乡一体化 29 土地财政 15 金融支持 11 市民化 27 中国特色 15 内涵 11 农业现代化 23 地区城镇化 14 生态环境 11 生态文明 22 城市发展 13 指标体系 11 表2高频词(部分) 接下来本文选取词频大于等于5 的关键词,数量达到了118个,见表3。本文对这118个关键词进行共现聚类分析发现,聚类程度低,科学性不强,无法有效归纳热点研究。 关键词 词频 关键词 词频 关键词 词频 城市化 10 产业发展 8 财经大学 6 城镇经济 10 产业结构 8 产业转型升级 6 „„ 10 „„ 8 „„ 6 城市经济 9 保障房 7 成本分担机制 5 发展路径 9 城乡规划 7 城市规划 5 „„ 9 „„ 7 „„ 5 表3关键词(部分) 通过分析,有些关键词对本文研究无实质意义,如“财经大学、河南省、学术委员会、亿人、征文活动启事”等,还有很多关键词虽不完全一致,但涵义基本相同,如“人口城镇化、人的城镇化”,“户籍制度、户籍制度改革”,“基本公共服务、公共服务”等”,这些因素干扰了分析统计。本文对118个词频大于等于5 的关键词,进行清洗归纳,去掉本文研究“新型城镇化”本身这个关键词、去掉无意义的关键词、并进行关键词的同义替换,因篇幅所限,节选部分关键词词映射表,见表4,把118个关键词替换成26个新关键词,本文接下来就基于这26个关键词开展分析。 原关键词 新关键词 原关键词 新关键词 基本公共服务 公共服务 户籍人口 户籍改革 公共服务 户籍制度 公共政策 户籍制度改革 城乡规划 城乡统筹 人口城镇化 人的城镇化 城乡统筹 人的城镇化 城乡二元结构 以人为本 城乡关系 生态环境

绿色协调 城乡一体化 可持续发展 转移人口 人口转移 生态文明 农业转移人口 协调发展 劳动力转移 绿色城市 人口转移 生态宜居 金融创新 金融创新 综合承载力 金融支持 发展路径 路径模式 融资 路径选择 代偿机制 路径 成本分担机制 模式 公共财政 发展模式 表4 关键词替换(部分) (二)高频关键词共词矩阵构建 关键词之间的共现频率越高,说明它们之间的关系越紧密。通过excel对26个关键词进行配对,构建共词矩阵,形成26*26的矩阵,见表5。

高频关键词 城市发展管理 城市规模 城乡统筹 城镇化过程 城镇化建设 房地产业 公共服务 城市发展管理 83 15 8 5 8 1 1 城市规模 15 181 9 14 16 4 0 城乡统筹 8 9 81 4 11 2 0 城镇化过程 5 14 4 79 5 1 0 城镇化建设 8 16 11 5 165 5 1 房地产业 1 4 2 1 5 28 0 公共服务 1 0 0 0 1 0 8 表5 新型城镇化高频关键词共词矩阵(部分) 共词矩阵是对称的,对角线上的数字是该关键词出现的频次,如“城市发展管理”出现频次为83次,它与“城市规模”共同出现的频次为15次;“城市规模”出现频次为181次,它与“城镇化建设”共同出现的频次为16次。 (三)标准相关相异矩阵转化 共词矩阵中,两两关键词共现频次受两个关键词出现频次的影响,难以真正的反映彼此关系程度。为消除影响,引入Ochiai系数,将共词矩阵转换成相关矩阵,反映高频关键词之间的实质性共现关系。

)(/Ochiai,jijinnn

在公式中,jin,表示关键词i和j共同出现的频次,ni,nj分别表示关键词i,j共同的频次2。通过计算得到共词相关矩阵,见表6。 Ochiai系数 城市发展管理 城市规模 城乡统筹 城镇化过程 城镇化建设 房地产业 公共

服务 城市发展管理 1 0.1224 0.0976 0.0617 0.0684 0.0207 0.0388 城市规模 0.1224 1 0.0743 0.1171 0.0926 0.0562 0 城乡统筹 0.0976 0.0743 1 0.05 0.0951 0.042 0 城镇化过程 0.0617 0.1171 0.05 1 0.0438 0.0213 0 城镇化建设 0.0684 0.0926 0.0951 0.0438 1 0.0736 0.0275 房地产业 0.0207 0.0562 0.042 0.0213 0.0736 1 0 公共服务 0.0388 0 0 0 0.0275 0 1 表6 共词相关矩阵(部分) 相关矩阵中的元素数值在0-1之间,数值越大越接近1表示这两个关键词的相似度越大;相反,数值越小表明两个关键词相似度越小。对角线上的数据表示该关键词自身的相关程度,均为1。通过计算得到的相关矩阵中0值过多,容易造成误差,为方便进一步分析,用1与相关矩阵中的各个数字相减,就得到了表示两个关键词相异程度的相异矩阵,在相异矩阵中,

相关主题