当前位置:
文档之家› 我国211大学论文发表量区域分布特征研究
我国211大学论文发表量区域分布特征研究
2 研究方法及技术路线
总体技术路线分为总体设计—数据采集—数 据整理—数据库构建—专题数据提取—专题地图 制作—区域分布分析—结论汇总等主要环节。 2. 1 技术路线 2. 1. 1 总体设计
本研究基 于 地 理 信 息 系 统 的 基 本 原 理 和 思
收稿日期:2014 - 10 - 31;修回日期:2014 - 12 - 20. 作者简介:回玉辉(1983 - ) ,男( 汉) ,河北省柏乡县人,曾就职于中国科学院遥感与数字地球研究所,从事航空遥感、地理信息系统
图 1 2005 年全国 211 高校论文发表量专题地图 Figure 1 The matic map of total papers published by 211 Universities in 2005
由图上可以明显看出,位于北京、上海、湖北 三省市的高校 2005 年论文发表量较大,位于第一 等级;而青海、海南、西藏三省市的高校 2005 年论 文发表量较小,位于最低等级。
(1. 中国传媒大学,北京 100123;2. 中国科学院科技政策与管理科学研究所,北京 100190)
摘要:本文以我国知识产出的区域分布特征为研究对象,以 CNKI 数据库为数据来源,选取全国 112 所“211”工 程高校在 2005 年至 2014 年间所发表的学术论文统计数据为主要研究数据,研究其发表总量、被引频次、典型学 科领域的发表量以及发表量在各地区的分布情况。研究基于地理信息系统的理论和方法,依据自动和人工相结 合方式获取的统计数据,制作论文发表专题地图,从宏观层面展示论文发表的区域分布状况。基于专题地图,创 新性地从地理空间思维的角度,分析全国论文发表情况的地区性差异,结合区域经济发展和人口分布数据,探讨 形成此分布状况的可能原因。通过展示和分析学术论文的区域分布,全面了解我国知识产出的宏观布局及区域 分布特征,为科研管理提供科学的数据支撑,有利于我国科研资源的优化配置,促进区域科教水平的均衡发展。 关键词:学术文献;专题地图;论文发表量;被引频次;区域分布
论文发表量数据按照发表年度整理为 10 个数据 表,表中的每行数据记录代表一所学校,每列数据代表 一个学科,即每个数据表中存储了当前年度 72 所高校 分别在 89 个学科领域所发表的论文数量[10,11]。 3. 3. 2 论文地域分布数据
论文的地域分布精确到省份,以高校所在省 份来分省统计。通过手工检索,整理全国“211 ” 工程高校所在省份. 统计发现,112 所“211”工程 高校分别坐落在 31 个省份。
北京地区入选“211”工程的高校共有 22 所,上海 有 10 所,江苏有 11 所,湖北有 7 所。然而,青海、 内蒙、西藏三省份均只有 1 所高校入选“211”工 程。这一高校分布特点充分解释了前面十张专题 地图中的论文总量区域分布状况。 4. 1. 2 各地区每校平均论文发表量分布
为了更加全面准确地反映论文发表情况的区 域分布特点,消除由于高校省域分布不均衡所带 来的统计口径上的影响,本研究进一步统计各地 区平均每个高校的论文发表量,并以此指标来制 作专题地图。
采用同样的分析方法,对 2006 年至 2014 年间 全国 211 高校论文发表总量的地理分布状况进行 分析,我们发现,十年间,论文发表的地理分布状况 保持高度的一致性和稳定性。北京、上海、湖北、江 苏等省份始终保持在总量排名的第一梯队,而青 海、内蒙、西藏等省份则一直处于最低的水平。
这种高度的区域分布稳定性可能反映了我国 “211 ”工 程 高 校 分 布 的 特 点。 经 简 单 统 计 2 2013 年 211 高校论文平均发表量专题地图 Figure 2 The matic map of average papers published by 211 Universities in 2013
由图可见,2013 年各地区每个高校的平均论 文发表量的分布情况与发表总量的分布情况发生 了明显的变化。北京、上海不再位于第一等级,取 而代之的是浙江、河南。这说明,就单个学校的论 文发表活跃度来讲,河南、浙江两省的高校并不一 定低于北京和上海。然而,内蒙、青海、西藏等省
份的平均论文发表量仍然处于低位。这从一定程 度上说明这两省的学术论文发表水平相对较弱。 4. 1. 3 发表总量与经济数据的对比分析
经济数据选取国家统计局发布的 2012 年的 各地区 GDP 统计数据为例,制作 2012 年全国各 地区 GDP 专题图。
图 3 2012 年全国各地区 GDP 专题图 Figure 3 The matic map of GDP of each province in 2012
第 36 卷 专刊 2015 年 1 月
科研管理 Science Research Management
文章编号:1000 - 2995(2015) ZK - 009 - 0431
Vol. 36,Supplement January, 2015
我国 211 大学论文发表量区域分布特征研究
回玉辉1 ,李 强2
专刊
回玉辉,李 强:我国 211 大学论文发表量区域分布特征研究
·435·
对比 GDP 专题图和各年度论文发表总量专题图, 不难发现,他们的区域分布整体上是比较相似的。就经 济发展区域分布而言,中部、东部沿海地区经济总量普遍 较高。相对应的是,这些地区的高校分布较多,学术论文 发表总量也相应较大。这说明,经济发展水平与学术论
将自动化检索和手工检索的数据,经结构化 整理后,录入数据库备用。本研究采用的数据库 软件平台为 MySQL。 2. 1. 4 专题数据提取
从数据库中提取各种专题数据,如 2013 年全 国各省份 211 高校论文发表总量或某学科领域的 发表总 量 等 数 据,用 于 制 作 专 题 地 图。可 以 用 MySQL 数据库中的视图功能,配合编写 SQL 数据 库查询语句来实现。 2. 1. 5 专题地图制作
3 研究数据来源及数据整理
3. 1 数据样本的选择 本研究 选 取 全 国 112 所“211 ”工 程 高 校 自
2005 年至 2014 年十年间公开发表的学术论文统 计数据为数据样本,数据源来自公开检索的 CNKI ( 中国知网) 数据库。 3. 2 数据获取
按照研究拟定的数据采集技术路线,通过自 动化数据收集工具软件和人工检索相结合的方 式,获取了 2005 年至 2014 年间全国“211”工程高 校 发 表 的 学 术 论 文 统 计 数 据 及 经 济、人 口 数 据。 其中,通过人工检索,获 取 了 全 国“211 ”工 程 高 校 名单及其地理位置,获取了 2010 年第六次全国人 口普查公布的相关数据,获取了 2005 至 2013 年 各省份的年度 GDP 数据等。通过自动化检索方 式,自主开发的爬虫系统共向 CNKI 服务器提交 了 64800 次查询请求,并成功返回结果,按照发表 年度分别存入了 10 个数据库表中[9]。 3. 3 数据分类整理 3. 3. 1 论文发表量数据
中图分类号: G311
文献标识码:A
1 引言
自建设创新型国家战略实施以来,提高自主 创新能力成为摆在我国有众多的科研、学术机构 面前的重要课题。高等学校、科研院所以及企业 研发机构等,每年都产出大量的科技文献。在当 前的科技评价与测度中,科技论文仍然是衡量创 新活动特别 是 基 础 研 究 活 动 的 主 要 指 标[1]。 因 此,有必要对各类数据库提供的论文统计信息进 一步深入分析,进行数据挖掘,发掘潜在联系,以 促进我国高影响、高质量科技论文的发表[2,3]。
文的发表量之间存在较强的正相关的关系。 4. 1. 4 发表总量与人口数据的对比分析
4 学术文献发表情况及其地理分布 分析
4. 1 论文发表总量及其地理分布分析 4. 1. 1 各地区论文发表总量分布
从数据库中提取 2005 至 2014 年间全国 211 工程高校历年论文发表总量数据,按照学校所在 省份进行汇总,根据每个省份行政区域内的所有 “211”工程高校发表论文量的总和,分成 8 个等 级,每个等级使用不用的颜色在地图上进行论文 总量的可视化表达。图上颜色越深的地区,代表 该地区的高校在当年度发表的论文越多,反之,地 区颜色越浅,则表明该地区的高校发表的论文数 量越少。以 2005 年为例,如下图所示:
专刊
回玉辉,李 强:我国 211 大学论文发表量区域分布特征研究
·433·
3. 3. 3 经济、人口与科研经费投入数据 人口数据选取国家统计局发布的 2010 年第
六次全国人口普查数据。经济数据选取国家统计 局网站发布的 2005 年至 2012 年间各省份 GDP 总量统计数据。科研经费投入数据选自国家统计 局、科学技术部、财政部每年发布的《全国科技经 费投入统计公报》。
区域分布分析基于专题地图完成。通过制作 并对比大量的专题地图,如全国 211 高校论文发 表总量专题地图、某学科论文发表量专题地图、基
于发表年度的学科发文量时态分布专题地图等, 结合人口分布数据和经济发展数据等,剖析科研 学术活动的区域性分布规律[8]。 2. 2 研究方法的适用性
地理信息系统的理论和方法基于科学的统计数 据,快速生成直观的专题地图,将数据背后的地理分 布特性进行可视化地有效表达,辅助于科研机构的 文献分析评估,是管理学与地理信息系统相结合的 一次探索和尝试,既是对管理学方法论的一种扩展, 也是对地理信息系统应用领域和范围的拓宽。
对于科技论文的统计分析,国内外目前的研究 现状,多是基于各大引文数据库,以统计各机构论 文发表量排名为目的,通过表格、图表等方式呈现 结果,难以全面、直观地体现众多的科研机构的学 术文献发表情况及它们之间的相互比较和地域特 性[4]。本文创新性地从地理空间分布的视角,利用
地理信息系统(Geographical Information System,简 称 GIS)的理论和方法,基于各学术机构的地理位 置,利用 GIS 在全国基础地图上展示和分析各区域 学术文献发表情况,既形象又直观,且便于分析各 学科分类的区域分布特性,展示论文发表的数量、 质量与地理位置的相关性,以讨论和发现目前我国 的科研资源配置是否达到了地理分布上的区域平 衡,为科研资源的有效配置提供科学的辅助决策 数据。