当前位置:文档之家› 文献计量学

文献计量学

文献计量学一.科技文献的增长规律什么是科学指标科学指标(Scientific indicators)是指人类科研活动的数量研究首先应确定的定量对象。

科学指标的类型- 人员与机构的数量。

其中人员数量包括科学工作者、工程师、教师和学生的数量等。

机构数量是指各类科研院所、学会及高等学校的数量。

- 科研成果的数量。

其中主要有:重大理论问题突破的次数以及理论在实际应用中获得重要成果的次数等。

- 科研过程及成果记录载体的数量。

其中主要有:科技期刊及其刊载论文的数量;专利文献的数量;科技书籍的数量等。

- 科研资金投入的数量。

主要指直接投入于理论与应用研究的资金数量。

文献指标使用最为频繁,主要原因:- 绝大部分人类科研活动及其成果都是以文献方式记录和贮存。

其它三者都没有与科研活动和成果有如此直接密切的数量关系,单纯的成果数量不能详尽的反映人类取得成果的整个科研过程。

- 与其他指标相比,科技文献数量巨大、易于收集。

这对于主要依靠数学统计方法来揭示存在于科学发展过程中的数学规律的研究人员来说,无疑是一个极大的优点。

- 与其他指标相比,科技文献易于统计分类,可以对各类科研过程进行有选择的定量研究。

文献量度指标1)绝对值指标,是表示文献数量多少的指标。

2)相对值指标,是表示不同部分文献的数量比例的。

3)累计数指标,以文献累积数为依据,因为,各年出版的文献逐年相加而得到的文献累积数总是增加的,就有可能趋于某种、固定的规律,所得到的结果,往往是较为规则的曲线,能用一个较为准确的函数来描述,因而有利于进行文献的定量分析研究。

4)非累积数指标,即一年出版的文献数量,易于受到各种复杂的社会因素的影响,一般来说是波动的,很难确定它是否近似的趋于某种固定的规律,结果往往是一些非规则曲线,难以用某种函数来描述。

文献指数增长模型文献指数增长规律文献指数增长规律的局限性(1)科学文献并不总是按指数函数关系增长。

普赖斯指数增长模型与所研究的文献的学科和时间有关。

所研究的学科范围越广泛,符合指数规律的时间就越长。

(2)指数增长规律不能预测文献的未来增长趋势。

这就是说,随着时间的推移,科学文献的增量会趋向无穷大。

这显然是不符合客观规律的。

文献指数增长规律存在局限的原因:(1)对科学文献增长的机理研究不够,难以对影响文献增长的各种因素全面考虑、衡量,并给出恰当的分析和定量的描述。

(2)在确立科学文献的指数增长规律时,没有考虑到文献的日益老化因素。

(3)在统计某年的科学期刊累积总数时,没有排除已停刊的期刊。

(4)普赖斯的指数增长规律只是建立在科学期刊这种出版类型的文献和某些知识领域的文献在他所统计的时间范围内的增长特点的基础上的,不能代替全部。

文献逻辑曲线增长模型所谓的逻辑曲线是指广泛存在于自然界与人类社会中的一类增长模式,在生物学中即为有名的生长曲线。

另外在有限条件下的人口增长、经济发展等过程也属于此类。

与纯粹的指数型增长曲线相比,它被称为饱和的指数增长曲线。

文献逻辑曲线增长模型的局限性1)当科学发展到一定阶段时,科学文献的增长率趋于零,科学文献总量达到了它不可逾越的最大值.这就意味着某个年代后,再也没有新的科学文献产生,这显然又走向了另一个极端,科技文献数量增长速度的减慢,并不意味着科学发展的速度将会下降。

2)它揭示了科学随着时间的延续而经历着一个“前期缓慢发展,中前期加速发展,中后期减速发展,直至后期饱和发展”的过程。

这种所谓的“饱和发展”并不意味着科学发展的终结,而是指科学的发展达到一种系统的动态平衡。

显然,科学发展的这一过程与科学文献的逻辑增长过程是对应的、相辅相成的。

3)从科学史来看,整个科学领域中的每一门学科分别处于诞生、发展、相对成熟等不同历史阶段。

诞生和发展时期文献呈现指数增长,寿命很短。

相对成熟时期,科学文献的增长率变小,曲线变得平缓,文献寿命相对变长。

但是,文献增长率变小,绝不意味着科学发展的停滞,可能意味着该知识领域正面临着新的突破,将产生出更新的分支领域,而内容上更新的文献又将进入一个新的急剧增长时期,此后又会进入一个稳定时期,文献的增长往往会出现几个急剧增长时期和几个相对稳定时期,呈现出错综复杂的格局。

4)一般的说,对不同的学科,描述其文献增长的逻辑曲线中的常数也是不相同的指数和逻辑曲线存在局限性的原因:第一,指数增长模型存在一定的局限性;第二,利用上述两种曲线对科技文献增长所做的预测,依据的是预测学中的趋势外推法,但是科技文献作为科学交流这一复杂系统中的子系统,其增长规律受到许多方面的影响和制约,只有利用系统论的观点对其做系统分析,才可望获得比较合乎实际的结果。

这应该成为我们修正指数曲线和逻辑曲线、探求新的科学文献增长模型的出发点。

科技文献增长的其他模型1 线性增长模型F(t)=bt+a F(t)——t年的文献累积量b——文献的年增长率a——当t=0时的文献数量(理论值)线性增长的特点是:文献量的增长速度为一常数,与文献的初始量无关。

2 分级滑动指数模型模型雷舍指出①每篇科技文献的贡献大小是不一样(质量不一样);②质量不同的文献增长速度也不相同,质量越高的文学其数量增长的速度越慢。

不同质量的文献,其增长速度不同,越重要的文献增长速度越慢。

数量较少的高质量的论文总量是伴随着大量的一般性的论文而同时出现的。

网络信息增长规律新特点(与文献增长规律进行了比较)⏹在研究对象上,文献信息增长规律主要研究文献或图书信息,而网络信息增长的研究对象多种多样,如网络链接、网页/网站和网络文献等;⏹在研究方法上,文献信息增长规律研究采用科学文献计量和数学方法,而网络信息增长规律研究常采用链接分析法,还借助特殊的统计工具,如网络日志;⏹在应用上,文献信息增长规律用来判断和预测科学知识的增长状况;网络信息增长规律应用较广,如评估搜索引擎、控制网络信息等;⏹网络信息的数量变化规律更加复杂,速度更快,文献信息的复制相对来讲变化较慢。

网络信息增长的特点(1)信息在传递中的不守恒性(2)网络信息传递的全达性网络信息增长机制:(1)网络信息总量的增长模型网络信息总量Im由网络节点数n、网络节点的平均信息创新能力A和网络的信息转发轮次数(即时间)m共同决定,即:Im=n[(m-1)n+1]A也就是说,网络信息总量Im与网络节点的信息创新能力A和网络的信息转发轮次数(时间)m成线性函数关系,而与网络节点数n成二次函数关系。

(2)网上真实信息量的增长模型网络上的真实信息量(即非重复信息量,用Ir表示),有如下关系:Ir=mnA即网络上的真实信息数量与网络节点数n、网络节点的信息创新能力A和网络信息转发的轮次数m均呈线性关系.(3)网上泡沫信息量的增长规律网络信息总量中含有大量重复发布的信息(即转发信息量或泡沫信息量,用If表示)If =Im-Ir =n[(m-1)n+1]A-mnA=n(n-1)(m-1)A(4)网络信息的乘数扩张律网络节点数n就是网络信息扩张乘数,正式它把网络信息总量扩张和放大为真实信息量的n倍。

它就是操纵网络信息扩张、造成网上重复信息泛滥的“看不见的手”我们将包括网络信息乘数扩张律在内的上述几个网络信息增长模型统一称为“网络信息增长的乘数扩张模型”二.科技文献的老化规律布鲁克斯肯定老化与分散之间有一定的联系,而且老化与分散均可以由增长率来加以确定,增长速率越快,分散越弱而老化越快。

什么是文献老化科技文献的老化是科技文献随着其“年龄”的增长失去了作为科学情报的价值,以及因此越来越少被科学工作者和专家利用的过程。

文献老化的测度指标(1)半衰期文献老化的半衰期是指某学科(专业)现时尚在利用的全部文献中较新的一半是在多长时间内发表的,即在全部参考文献中50%的文章是在多长时间内发表的。

注意这一定义仅适用于对采用同时法所获得数据的处理。

严格的讲,应称为“中值引文年龄”(mediancitation age)。

半衰期或中值引文年龄短小,说明该学科被引用的近期文献众多,文献新陈代谢频繁,新的近期文献得到大量的应用。

(2)普赖斯指数即指在一个具体学科内,把对年限不超过5年的引文数量与引文总数之比当做一个指标,用以量度文献的老化速度与程度,普赖斯指数越大,文献老化越快。

Pi=近5年被引用的文献数量/被引用的文献总量*100%“普赖斯指数”和半衰期是既有联系又有区别的两个衡量文献老化的指标。

他们都是从文献被利用的角度出发,但以不同的方式来反映文献老化的情况。

普赖斯认为“有现时作用”的引文数量与“档案性”引文数量的比例,是比引文的“一半寿命”更为重要的特征。

文献的“半衰期”只能笼统的衡量某一学科领域全部文献的老化情况,而“普赖斯指数”既可用于某一领域的全部文献,也可用于评价某种期刊、某一机构、甚至某一作者和某篇文献的老化特点。

(3)期刊有益性系数1970年布鲁克斯提出期刊的有益性(Utility)的概念。

所谓一种科学期刊的有益性,是指可望在某种程度上被科学家或专家利用(在书目中被引用)的文章数。

即某一年份某一期刊被用户所利用的文章数。

文献老化的数学模型(1)负指数模型一般的说在一个指定的时期内,被引用的论文数与发表年度服从负指数规律。

(2)巴顿-开普勒老化方程(3)莫蒂列夫修正式(4)布鲁克斯的累积指数模型(5)阿弗拉米斯库方程什么是网络信息老化网络信息资源的老化是指网络信息资源中情报的有效价值随着时间的流逝逐渐衰减,利用率逐步降低直至存档甚至销毁。

网络信息资源老化主要原因:- 网络信息资源的增长- 网络信息的更新- 网络信息的消失- 网络信息的语用衰减- 替代性网络信息的出现- 网络信息的吸引力网络信息老化的特点-快速性- 非载体依赖性- 动态性- 复杂性网络信息老化的测度指标1)半衰期网络信息资源的基本构成元素有半数发生变化所需的时间。

(1)被引半衰期。

针对某个站点的被引用过程而言,可以定义为某一站点的全部信息在某一时间段内被引用或被链接的所有信息中较新的一般式在最近多长时间内发表的。

(2)引用半衰期。

针对某一站点上信息的引用行为而言,可以定义为某一站点的全部信息在某一时间段内引用或链接的所有信息中较新的一半是在最近多长时间内发表的。

(3)静态半衰期。

是指在不考虑增长的情况下,网络信息资源的基本构成元素有半数发生变化的时间。

(4)动态半衰期。

是在考虑增长的情况下,网络信息资源的基本构成元素中较新的一半产生于多长时间内。

(5)宏观网络信息资源半衰期。

指某主题领域网络信息资源所含链接的链宿所指资源中较新的一半是在多长时间内产生的。

(6)微观网络信息资源半衰期。

是指指向该网络信息资源的全部其他网络信息资源的二分之一是在其发布后的多长时间内出现的。

2)普赖斯指数3)生存期是指特定网络信息资源的URL存续时间。

相关主题