·图书馆与图书馆事业·信息社会的快速发展与大量智能终端的广泛应用,使得数据的产生、来源、类型变得简单而丰富,越来越多的非结构化数据、半结构化数据呈爆发式增长趋势,且其组成结构、类型格式、存在形态等都愈加复杂,整个社会发展进入到了一个大数据时代。大数据时代,数据将成为社会资源的一部分被加以重视,基于数据的处理、分析、挖掘等服务都将被信息服务机构所应用和开展,这对承载着知识存储、组织、开发与传播重任的图书馆及以文献信息分析为基础的图书馆咨询服务工作造成了强烈冲击。基于以上考虑,笔者从图书馆咨询服务发展的角度,论述了大数据为图书馆知识咨询带来的机遇,重点对大数据时代图书馆知识咨询的两大发展驱动因素即数据资源与人才建设进行了分析,以引起业界学者对相关问题的共同关注与探讨。1知识咨询是大数据时代图书馆咨询服务的新模式1.1知识咨询服务:有别于传统咨询服务的创新型服务知识咨询与参考咨询及信息咨询相比,在诸多方面均存在着差异:首先,从定义来看,知识咨询是针对用户在工作、学习、生活中的知识选择、吸收、利用需求,以图书馆员的图书馆学、情报学、信息学等专业知识为基础,利用先进的技术对相关信息进行提取、组织、优化,融入用户知识获取的全过程,为用户决策与创新提供丰富的知识、有效的答案;参考咨询是图书馆员根据用户需求而进行的文献搜集、检索、揭示、传递并提供知识产品的过程;信息咨询则是向用户提供有关数据、资料的服务过程[1]。其
次,从服务的专业化、知识化水平来看,参考咨询和信息咨询都只限于所能提供的数据或信息,而知识咨询更在意是否能提供解决用户问题的知识[2]。再次,从服务类型
来看,知识咨询服务的提供方式可以是参考咨询、信息咨询的服务提供方式,如将结构化(或标准化)文献信息、数据、线索提供给用户,或将进行了一定数据分析加工的知识产品提供给用户。但知识咨询服务更注重用户的专业化、知识化、个性化需求,提供解决用户实际问题的知识,以及与用户协同合作创造的知识服务和面向用户的知识管理等。
知识咨询:大数据时代图书馆的知识服务增长点王天泥(辽宁省图书馆辽宁沈阳110015)
摘要:随着社交网络、云计算、移动互联网的迅猛发展,数据产生的范围、方式、途径发生了翻天覆地的变化,全球进入
到了大数据时代。阐述了知识咨询是图书馆未来咨询服务的新模式,分析了大数据给图书馆知识咨询服务带来的机遇,重点探讨了大数据时代的数据资源与人才建设两大知识咨询服务发展驱动因素。关键词:大数据图书馆知识咨询
中图分类号:G252文献标识码:A文章编号:1003-6938(2013)02-0074-05
KnowledgeConsultation:theGrowthPointsofLibraries'KnowledgeServicesintheEraofBigData
AbstractBecauseoftherapiddevelopmentofsocialnetworking,cloudcomputingandmobileInternet,thereisbeinganearth-shakingchangesonthescope,wayandchannelofdatageneration.Itismeansthattheeraofbigdataiscoming.Thearticledescribestheknowledgeconsultationisanewmodelofthefuture’slibrariesconsultationservices,andanalyzestheopportunitiesofconsultationservicesintheeraofbigdata.Itisemphasisthedrivingfactorsofknowledgeconsultations,whichincludingdataresourcesandpersonneldevelopment,intheeraofbigdata.KeywordsBigdata;Library;Knowledgeconsultation
收稿日期:2013-03-20;责任编辑:魏志鹏
742013年第2期
1.2知识咨询服务:大数据时代图书馆知识服务的主要
方式与手段大数据时代,信息资源的竞争力已不再是其所占的数量、范围等因素,而是在于基于信息资源服务的信息化、知识化和信息数据的分析与组织程度,以及基于知识的创新力竞争,产品和服务的最大价值判断标准是其隐藏的信息与知识含量多少,提高产品的信息化、知识化,以寻求隐藏在事物表象背后的本质成为了市场竞争的主要手段。图书馆界已敏锐地看到了社会的发展及服务的转变需求,由原来的资源依赖型、劳动密集型服务向知识服务、信息服务转变。21世纪初,国内外图书馆界在知识服务方面就进行了积极探索,到目前已形成了较为完整的图书馆知识服务体系,产生了大量个性化、专业化、团队化的创新服务途径与模式,其中,基于内容分析,与知识服务完美融合的知识咨询服务,必将成为图书馆在大数据时代的咨询服务模式。
2大数据为图书馆知识咨询带来了发展机遇大数据时代的到来,意味着我们进入到了一个以密集型数据的相关挖掘、分析、处理来推动社会创新发展的时代[3],基于大数据分析等数据处理业务的盛行与成熟,
也将为图书馆知识咨询服务带来新的发展机遇。2.1大数据为知识咨询服务带来了更加丰富的数据资源
大数据时代的到来,意味着大量的非结构化数据、半结构化数据应用将进入人们的视野,据IDC的《数字宇宙》研究报告称,2011年全球被创建和复制的数据总量为1.8ZB,预测到2020年,全球将拥有35ZB的数据量。另一
则统计数据显示,世界结构化数据增长率大约是32%,而非结构化数据增长率则是63%,至2012年,非结构化数据占互联网整个数据量的比例已达到75%以上[4]。这些数据
无不说明大量的社交数据、信息行为数据等结构化数据、非结构化数据、半结构化数据将被记录、存储、分析与利用,不管是数据的类型、还是数据的数量都将得到极大的丰富。2.2大数据为知识咨询服务带来了更为专业的数据分
析技术信息时代大量信息数据的产生,使得方差分析、判别分析等数据分析理论得到了极大的应用与发展,同时被图书情报服务机构将其与信息技术如仿真模型、神经网络分析、Web挖掘等有机结合运用到了机构网站链接、学科优势分析、影响力评估、可视化图谱、科技发展态势监测、国家竞争力分析等领域,但具体分析这些技术和理
论,会发现它们都是基于大量、有序的结构化数据,并不能从真实发生、而又未被记录的数据中发现、挖掘更深、更多的隐含信息,进而得到更能揭示事物发展本质以及发展规律的知识。大数据时代的到来则为这一难题提供了解决方案,通过高速捕捉、发现和分析,从大容量、多类型的数据中获取价值的大数据技术架构将为数据分析业务带来更多的变化与支撑[5],如目前广泛关注和应用的分
布式系统基础架构Hadoop[6]、非关系型数据库技术
NoSQL[7]等大数据技术。
2.3大数据为知识咨询服务带来了新的解决问题思维方式
不管是传统的信息咨询、参考咨询还是知识咨询,一般的服务思维都是出现问题—逻辑分析—找出因果关系—提出解决方案,使用户的问题得以成功解决,可称之为逆向思维模式。但根据大数据战略,基于大数据的知识咨询流程是:收集数据—量化分析—找出相互关系—提出优化方案,使用户的问题解决方案从成功跃至卓越,可称之为正向思维模式。这种解决问题思维方式的变化将为图书馆的知识咨询服务带来发展机遇,也可引入其他服务。IBM与美国孟菲斯警察局合作的“利用数据历史减少犯罪”项目就是一个很好的例证。该项目通过大量的数据进行软件分析,发现强奸案和户外付费电话之间存在着较强的关联关系,因此,警方决定将付费电话转移至室内,这使得强奸案的发案率降低了30%[8]。
2.4大数据为知识咨询服务提供了广阔的合作视野
知识咨询服务与传统的信息咨询、参考咨询最大的区别就是知识咨询以用户需求为本,寻求解决用户疑问的知识服务。这种服务一方面需以专业的知识组织、知识发现等素养去完成,另一方面也需大量的相关信息、数据去支撑,而这些信息、数据的组成很可能是某一专业领域的,也可能是跨专业领域、多专业领域的;既可能是一个信息机构所拥有的,也可能是多个信息机构共同拥有的。这种特征在当前信息时代非常突出,而在大数据时代将更加显现,这就为图书馆带来了一个巨大的发展机会。因为从微观上看,图书馆的数据资源随着这种特征的突显而更具优势;从宏观上看,数据的更加开放、多学科的数据分析联系更为紧密,将为图书馆与专业性服务机构的多领域、高层次合作注入全新动力。
3数据资源与人才建设:图书馆知识咨询发展的两大驱动因素
IBM日前发布的基于全球95个国家、26个行业的
751144名业务人员和IT专业人士广泛调研形成的《分析:
大数据在现实世界中的应用》[9]白皮书认为实践大数据的五大驱动因素中,数据资源将会是大数据时代发展各个相关业务的主要驱动因素之一。同时,“2012年IDC亚太区大数据高峰论坛”及其与会者的最新调研成果《中国大数据技术与服务市场2012-2016年预测与分析》[10]认为“大数据相关人才的欠缺将成为影响大数据市场发展的一个重要因素”。笔者在此也认为,尽管大数据时代图书馆知识服务的发展驱动因素有很多,但数据资源和人才建设将是最主要和最重要的两大驱动因素。3.1数据资源建设大数据时代的到来,使得数据成为了企业、机构乃至政府所重视的资源。2012年1月,瑞士达沃斯论坛发布的《大数据,大影响》报告形象地将数据称为社会的“金矿”和“黄金”,此外,一些IT业发达的国家如美国、印度等近来出现了一批以数据的获取、聚合、加工为盈利手段的企业,由此可看出大数据的资源价值。图书馆知识咨询服务中的数据分析、数据处理和数据挖掘等大数据技术的实现也需要大量的大数据资源支持,而这些数据可能是已存在于图书馆数据库中的书目信息、电子图书等结构化数据,也可能是用户在图书馆的借阅行为、阅读习惯等非结构化数据,更可能是在其他社会场所如商业中心、社会服务中心、娱乐中心和工作空间等的信息行为数据。有权威机构2011年发布的统计数据显示,全球数据总量每两年就会增长一倍,预计到2020年人类拥有的数据总量将会达到惊人的35万亿GB。新增数据中,90%以上属于传统技术难以处理的非结构化数据,如音视频、图片、网页等[11]。因此,图书馆应认清数据在知识服务特别是知识咨询中的重要性,提高数据收集意识,并通过对现存数据进行分析、加工、重组,把大量随机的、分散的、无序的信息转换为规律的、集中的、有序的数据,以为将来的知识咨询等服务提供坚实的数据保障。鉴于目前图书馆的数据资源类型较为单一,特别是隐藏着巨大价值的非结构化数据收集几乎属于空白,笔者认为,图书馆在数据资源的建设中,需特别重视非结构化数据的收集与丰富,以满足用户个性化、多样化的知识需求。如美国国会图书馆的“美利坚记忆”[12],收集整理了照片、手稿、海报、乐谱、地图等记载美国历史文化特色的馆藏资源。又如馆内布局与藏书流通率的关系等,表面上看起来毫不相关的两件事,通过大数据分析,却能量化并预测用户的借阅行为。因此,只有将非结构化数据与结构化数据加以综合收集、分析,知识咨询服务才更能得到用户的认同,并创造出真正的价值。令人欣喜的是,国家图书馆正在进行一期维修改造,建成之后的数字图书馆的非结构化数据存储量将达到800TB左右[13],这说明我国