数学建模之学术期刊分类及重要性排名目录 一、摘要 ........................................................................................................................................ 二、问题重述 ............................................................................................................................... 三、模型的假设与符号说明 .................................................................................................... 基本假设 ........................................................................................................................ 符号和术语 .................................................................................................................... 四、问题分析 .............................................................................................................................. 五、模型的建立与求解,分为三步(先局部建模,再推广模型,再确立新的评价体系)........................................... 六、模型分析与结论................................................................................................................ 附录1:参考文献 ..................................................................................................................... 附录2:部分程序代码........................................................ 相关图表.....................................................................................
一、摘要 根据题目要求,我们尝试建立一个以论文引用情况为基础的数学模型作为评价期刊的工具。此次建模分为三个模块: 1. 建立相应的数学模型并提出求解方法(所要建立的模型分为两类,一个是学术期刊分类模型,另一个是学术期刊重要性评定模型)。 2. 根据引用网络(Citation Networks)的规模和模型,将会讨论我们所建立的模型是否是适合对该学科的所有期刊进行重要性排名; 3. 为了在实际中应用此套模型,我们将在引用网络(Citation Networks),分析建模的基础上再引入新的分析方法来完善我们的数学模型。 对于上述三个模块中的第一部分,我们首先仅仅是根据其中的引用情况先来对对种期刊进行排序;我们根据期刊中论文的被引用次数,将N种期刊粗分为N组。然后我们将定义一个常数和一个随机数,这两个数均与与期刊质量水平和影响力指数相关(根据引用的关系),最后使用层次分析法(AHP),决定不同部分所占的比重。 如果模型进一步泛化,推广到在这一领域的所有期刊,那么期刊的数量和引文网络结构将发生相应的变化。但是,仅仅是量的变化,而评价指标的本质没有改变,因此调整后的模型能够适用于此领域的所有期刊。 此模型仅仅考虑了期刊中论文被引用次数对期刊的水平进行建模并评价。但是在实际的应用中,期刊的水平通常包裹许多其它方面的影响因素。在上述第三部分中,我们将修改在涵盖了一些相关因素之后对现有的模型做出修改以使模型推导出的结果更加符合实际情况。 二、 问题重述 期刊的论文被其他期刊的论文引用是期刊水平高低的重要标志,通常高水平刊物的文章会被其他刊物的文章引用。因此,学校科技部门规定:将某刊物论文被引用情况作为该刊物水平高低的标准。例如,刊物A中的论文经常被刊物B中的文章引用,则记为A -> B,此时,认为刊物A优于刊物B。但在实际操作时发现,刊物中的文章有互相引用的情况,A <-> B;或者多家刊物中的文章循环相引用的情况。
三、 模型的假设与符号说明 1:基本假设 由于各学科影响力和贡献大小程度不尽相同,所以对一本期刊重要性的评定就要分类。 我们此次建模主要针对数学和计算机学科期刊的质量做出评估(其中也包含其它的分析方法和计算方法),从而使每种学科的质量和贡献都能得到一个较为客观公正、数量化的评价。
假设: 1. 为了避免造成因为语言的使用和普及情况造成的评价模型偏差,期刊采用不同官方语言来发表论文未在我们的考虑范围之内; 2. 每种学科刊物文章的数量和期刊每期发行的总量是相同的,这样我们就能避免因为不同数量的文章和不同印刷数量的期刊对于建立模型的影响; 3. 未考虑“自引用”和其它非常规的引用方法; 4. 对于一个科学领域中,我们很难确定一门学科及其子学科之间的边界,因此我们假定在模型中出现的学科是非常不同于其它的学科,不可能在其它学科的期刊中出现此学科的论文引用,并且此学科没有可以单独划分的子学科; 5. 引用关系的前提为:我们认为a期刊在一段时间内,被b期刊引用文章数占总文章数的比超过5%时,我们认定a期刊经常被b期刊引用。 6. 假设我们所得到的引用数据均是在近两年内,并且忽略其它时间因为对 建模的影响。 7. 允许一种期刊不必全部引用所有其它的期刊,也就是说一种期刊可以自由选择它所引其它期刊的种类和数量; 8. 每个期刊都趋向于引用比自身更加高级的期刊中; 9. 对于间接引用(如A->B->C),在计算过程中我们将不追溯到其“根”出 处,即一种期刊的所有引用都包含在其自身的计算当中而不回溯。
2) 符号和术语 : 待定 术语: 待定 四、问题分析 我们所得到题目中的图表缺乏很多相关的数据,很多数据也不是随机的。为了解决这一情况,我们运用随机数来代替计算所需要的数据。随机数会在一定程度上影响计算的结果,所以我们采用多次取随机数(调用c语言随机数程序即可)计算并求平均值的方法来减少随机数所带来的误差。数据越多,选取的样本越多,结果就会更精确并且更能反映实际情况。 五、模型建立 1、局部模型的建立(先分别对一定数量的数学学科和计算机学科的引用情况进行分析,以此为基础分析建模) 此处需要大量数据及表格作为基础建立出分析模型 2、推广模型(引用网络(Citation Networks)的规模和模型,将会讨论我们所建立的模型是否是适合对该学科的所有期刊进行重要性排名) 3、确立新的评价体系 (引用网络(Citation Networks)再引入新的分析方法完善评价体系) 六、 模型分析与结论 这个模型,我们把各方面的因素一起,并给予一个更全面的评估,该杂志的学术水平。 我们构建了一个模型来处理的第一个问题,为避免题目中期刊网络图的对称性,我们使用MATLAB产生基本的各期刊影响力初值(随机数)。实际上生活中,人们对各期刊的学术质量有一个大致的评价,我们通过数学的手段,以随机数的形式给各期刊赋予学术价值是合理的。 在第一个问题,除了第N个期刊引文网络的关系,我们有没有其他的定量数据,如总引用次数。随机数和Xi,两个经常被引期刊第十一也用在其他两个因素,Yi ,Zi,影响力指数,被引期刊的引用期刊的贡献可以使用Yi和Zi。 因为随机Xi和Zi的初始数据的组成部分,对同样的问题反复使用该模型将略微改变。一个完美的模型可以接受的重复性。同时,Yi依赖基本的学术数值,Xi和随机数,Xi是期刊的唯一影响因素,很小,所以缺乏完整性。 此外,N个期刊分为N个水平,使用的唯一标准:被引用次数。当然,在很大程度上期刊被引用的频率反映了该杂志的水平,但如果我们忽视影响因子(IF),H-Index,非自引率,总引用次数,被引用次数,平均作者数,扩展因素和引用半衰期等。结论是:划分等级的标准,应该更有说服力。 附录一 参考文献 附录二 代码
(2)期刊主办单位; (3)专家的审查:杂志是由专家评估对期刊质量的影响更大;(4)编委会成员,并在杂志上发表他们的文件; (5)发表次数; (6)有拨款的论文:有拨款的论文一般是指由国家和省,市和国家重大工程项目支持的研究论文; (7)引用杂志的循环利用; (8)引用是一个更客观的评价学术期刊的