当前位置:
文档之家› 科学知识图谱方法及应用完整版本
科学知识图谱方法及应用完整版本
❖“Information Visualization”术语是由斯图尔特•卡 德、约克•麦金利和乔治•罗伯逊于1989年创造出 来的;
❖ 美藉华人陈超美1999年率先发表了该领域的第一 部专著《信息可视化》,创办了国际期刊《 Information visualization》。
10
1.知识可视化概述
❖ 改正字符错误,统一或增补 ❖ 分时段 ❖ 有代表性的抽取
31
3.3选择知识单元
❖ 知识单元是知识处理的基本单位:关键词、题名、 作者、机构、刊名、分类号、学科等等。目前也 扩展到摘要、参考文献和全文。多种结合。
32
3.4 构建知识单元关系
1、说明科学知 识和情报内容的 继承和利用 2、标志科学的 发展
GREEN BL, 1990, J APPL SOC PSYCHOL, V20, P1033 HANSON RF, 1995, J CONSULT CLIN PSYCH, V63, P987 HARVEY AG, 1999, J CONSULT CLIN PSYCH, V67, P985
author cocitation
20
2.知识图谱概述——基本概念
21
2.知识图谱概述——基本概念
❖ 上世纪50年代,加菲尔德创制 SCI,并以编年体形式手工绘制 引文网络图谱;随后 “文献耦 合”(Kessler,1963),“科 学引文网络”(Price,1965), “同被引”(Small,1973)、 “共词”(Callon,1983)、 “引文可视化”(White, 1998)相继提出
❖了解领域历史、现状热点、前沿趋势
❖ 选题,寻求切入点和突破点 ❖ 寻求新的研究方法和有力的论证依据 ❖ 避免重复劳动
❖网络环境,大数据。。。
4
如果说我比别人看得更远些,那是因为我站在 了巨人的肩膀上。
❖ 我不知道在别人看来,我是 什么样的人;但在我自己看 来,我不过就象是一个在海 滨玩耍的小孩,为不时发现 比寻常更为光滑的一块卵石 或比寻常更为美丽的一片贝 壳而沾沾自喜,而对于展现 在我面前的浩瀚的真理的海 洋,却全然没有发现 ——牛顿
2.知识图谱概述——发展历程
❖ PFNET算法根据经验性数据, 对不同概念或实体间联系的相 似性或差异程度做出评估,然 后引用图论中的基本概念或原 理生成特殊的网状模型
1990美国心理 学家斯克沃斯 兹恩巴克提出 “寻径网络图 谱”pathfinder network
scaling map,PFNET
journal cocitation
RUBONIS AV, 1991, PSYCHOL BULL, V109, P384
RUEF AM, 2000, CULTURAL DIVERSITY E, V6, P235
SHAH B, 1997, SUDAAN USERS MANUAL
❖ 知识可视化发展时间很短 ,正式起源于 2004年, M.J.Eppler 和 R.A.Burkhard 共 同 发 表 论 文 (knowledge Visualization -Towards a New Discipline and its Fields of Application)。
❖ Eppler 认为 : 知 识 可 视 化 主 要 研 究 视觉 表 征 的使 用,主要目的是改进两人或多人间知识的创造与 转移;知识可视化是指能用来构建和传递复杂观 点和内容的所有图形手段和方式。
第六 科学知识图谱方法及应用
杨思洛 信息管理学院
工欲善其事,必先利其器
❖课程考核:相关的课程论文,6月1号前交 信息管理学院336办公室。
❖包括学号、姓名、联系方式
2
引言
❖对学科(领域、主题)过去、现状、前沿、热 点、趋势的把握可通过什么方法手段?
3
引言的重要性! ❖文献是记录有知识的一切载体 ❖文献是科学交流的主要途径与手段
传播 创新
百闻不如一见、一图胜万言!
纽约大学心理学专家吉米·布洛诺(Jerome Bruner)在实验中发现,人们能记住10%听 到的东西,30%读到的东西,但是却可以记 住 80%看到的东西
8
9
1.知识可视化概述
❖科 学 计 算 可 视 化 (Visualization in Scientific; Computing)、数据可视化(Data visualization)、 信息可视化、知识可视化、知识域可视化。
国内数据库:CNKI、CSSCI、CSCD、万方等
网络数据源:Google Scholar、arXiv、CiteSeerX
30
3.2样本数据清洗
❖ 基于文献数据库进行知识可视化的质量、合理 性和可靠性很大程度上依赖于所用数据的精确 性和全面性,不准确或不全面的数据往往造成 不精确甚至错误的结果。即使目前最权威、公 认质量最高的WoS,也存在数据著录格式(如 人名和地名的不统一)和遗漏的问题。
*DEP HLTH HUMAN SE, 1999, MENT HLTH REP SURG G
*US BUR CENS, 2000, STF3A DEP COMM BUR C
BLAZER DG, 1994, AM J PSYCHIAT, V151, P979
EATON L, 2001, NY TIMES
❖ 基本原理是分析知识单元 (科学文献、科学家、关 键词等)的相似性及测度。 采用不同的方法和技术绘 制不同类型的图谱。
科学知识图谱
22
2.知识图谱概述——发展历程
❖ 传统的科学图谱以简单的二维、三 维图形(如:柱形图、线性图、点 布图、扇形图、平面图等)表示科 学统计结果
文献摘要或关键词纪录比例图
1116, A1
FOTHERGILL A, 1999, DISASTERS, V23, P156
FULLERTON CS, 1999, AVIAT SPACE ENVIR MD, V70, P902
GINEXI EM, 2000, AM J COMMUN PSYCHOL, V28, P495
GOENJIAN AK, 2001, AM J PSYCHIAT, V158, P788
将数据以及数据间关系表达 成一个图,图中节点表示数 据,线表示数据间关系
运用较小生成树法及复杂连 接删除算法,删除网络中大 部分连接,保留最重要连接 ,最大限度简化网络
25
2.知识图谱概述——发展历程
印第安纳大学Ketan K Mane 和泊尔纳提出“PNAS主题爆 炸图谱”,用以发现主要主 题和复杂趋势
18
2.知识图谱概述——基本概念
19
2.知识图谱概述——基本概念
❖ ①较形象、定量、客观、真实地显示学科结构、 热点、演化与趋势,是学科基础研究新视角。
❖ ②知识图谱可发现、描述、解释、预测和评价 科学知识。
❖ ③对图书情报学科具有更重要意义,也有助于 信息检索、信息分类与信息服务等。
耗时、 费力、 难以重复、 较主观 盲人摸象
默创立“三维构型图谱”three
dimensional configuration map
之后出现“多维尺度图谱”multi-
dimensional scaling map
卡尔提出“自组织映射图谱 ”self-organizing map
实
例
: 某 学 术 群
体 知 识 图
谱 24
实例:
某学科期刊高频关键词共词网络2个知识群
利用地理信息系统的可视化信息,地理地图的自然组织 框架,构建隐含大量信息的可视化主题地图
应用案例: 期刊文章的数量与 资助基金间的动态 关系图谱
27
2.知识图谱概述——发展趋势
❖ 随计算机处理能力日益提高、文献数字化,知识图谱工具在模拟人类信息分 析等方面,可帮助人类进行某些领域的判读、搜索、决策、预测……
KAWACHI I, 2001, J URBAN HEALTH, V78, P458
KESSLER RC, 1995, ARCH GEN PSYCHIAT, V52, P1048 KILPATRICK DG, 1987, CRIME DELINQUENCY, V33, P479 MADAKASIRA S, 1987, J NERV MENT DIS, V175, P286
POLE N, 2001, J NERV MENT DISK H, 1999, J ANXIETY DISORD, V13, P359 RESNICK HS, 1993, J CONSULT CLIN PSYCH, V61, P984 ROTHBAUM BO, 1992, J TRAUMA STRESS, V5, P455
11
1.知识可视化概述
可视化对象 可视化目的
可视化方式
交互类型
信息可视化
知识可视化
知识图谱
非空间数据
人类的知识
科学知识
从大量抽象数据中 促进群体的知识创新 展示学科,促进科学
发现新的信息
和传播
发展
计算机图形图像 绘制草图、知识图表、 多维图表、视觉隐喻 视觉隐喻
人-交互
人-交互
人-交互
12
1.知识可视化概述
33
耦合
34
知识单元 的共被引
关系
文献共被引分析是计量 文献之间关系的一种新 方法。即2篇文献共同 被1篇文献引用,这2篇 文献就构成共引关系。 共被引频率定义为这2 篇文献一起被引用频次
——马沙科娃、斯莫尔 (苏联、美国)
35
CR 2001, NY TIMES
1226, B2
*AM PSYCH ASS, 1994, DIAGN STAT MAN MENT
概念图
概设 教 念计 育 组制 应 成作 用
知识可视化 工具及其教 育学习应用