科学知识图谱方法及应用
❖“Information Visualization”术语是由斯图尔特•卡 德、约克•麦金利和乔治•罗伯逊于1989年创造出 来的;
❖ 美藉华人陈超美1999年率先发表了该领域的第一 部专著《信息可视化》,创办了国际期刊《 Information visualization》。
10
1.知识可视化概述
20
2.知识图谱概述——基本概念
21
2.知识图谱概述——基本概念
❖ 上世纪50年代,加菲尔德创制 SCI,并以编年体形式手工绘制 引文网络图谱;随后 “文献耦 合”(Kessler,1963),“科 学引文网络”(Price,1965), “同被引”(Small,1973)、 “共词”(Callon,1983)、 “引文可视化”(White, 1998)相继提出
18
2.知识图谱概述——基本概念
19
2.知识图谱概述——基本概念
❖ ①较形象、定量、客观、真实地显示学科结构、 热点、演化与趋势,是学科基础研究新视角。
❖ ②知识图谱可发现、描述、解释、预测和评价 科学知识。
❖ ③对图书情报学科具有更重要意义,也有助于 信息检索、信息分类与信息服务等。
耗时、 费力、 难以重复、 较主观 盲人摸象
默创立“三维构型图谱”three
dimensional configuration map
之后出现“多维尺度图谱”multi-
dimensional scaling map
卡尔提出“自组织映射图谱 ”self-organizing map
实
例
: 某 学 术 群
体 知 识 图
谱 24
实例:
某学科期刊高频关键词共词网络2个知识群
33
耦合
34
知识单元 的共被引
关系
文献共被引分析是计量 文献之间关系的一种新 方法。即2篇文献共同 被1篇文献引用,这2篇 文献就构成共引关系。 共被引频率定义为这2 篇文献一起被引用频次
——马沙科娃、斯莫尔 (苏联、美国)
35
CR 2001, NY TIMES
1226, B2
*AM PSYCH ASS, 1994, DIAGN STAT MAN MENT
❖了解领域历史、现状热点、前沿趋势
❖ 选题,寻求切入点和突破点 ❖ 寻求新的研究方法和有力的论证依据 ❖ 避免重复劳动
❖网络环境,大数据。。。
4
如果说我比别人看得更远些,那是因为我站在 了巨人的肩膀上。
❖ 我不知道在别人看来,我是 什么样的人;但在我自己看 来,我不过就象是一个在海 滨玩耍的小孩,为不时发现 比寻常更为光滑的一块卵石 或比寻常更为美丽的一片贝 壳而沾沾自喜,而对于展现 在我面前的浩瀚的真理的海 洋,却全然没有发现 ——牛顿
1116, A1
FOTHERGILL A, 1999, DISASTERS, V23, P156
FULLERTON CS, 1999, AVIAT SPACE ENVIR MD, V70, P902
GINEXI EM, 2000, AM J COMMUN PSYCHOL, V28, P495
GOENJIAN AK, 2001, AM J PSYCHIAT, V158, P788
document cocitation
Байду номын сангаас
MAZURE CM, 2000, AM J PSYCHIAT, V157, P896
NORTH CS, 1999, JAMA-J AM MED ASSOC, V282, P755
ORTEGA AN, 2000, AM J PSYCHIAT, V157, P615
概念图
概设 教 念计 育 组制 应 成作 用
知识可视化 工具及其教 育学习应用
思维导图
此外,在科研写作中也需要绘制图表,呈现知识
13
关于 “概念图”的概念图
14
思维导图:用于放射性思考
子题 1
子题 7
子题 思考主的題主题 子题
2
6
子题 3
子题 4
子题 5
15
❖阅读下面黑体的词汇,然后立刻闭上眼睛, 持续30秒,思考它。
*DEP HLTH HUMAN SE, 1999, MENT HLTH REP SURG G
*US BUR CENS, 2000, STF3A DEP COMM BUR C
BLAZER DG, 1994, AM J PSYCHIAT, V151, P979
EATON L, 2001, NY TIMES
❖ 用克林伯格跳变算法和共生词分析法和图示 技术,研制主要主题和复杂趋势的发现地图
• 网络中各节点代表高 频词和爆炸词 • 节点大小代表该词达 到最大爆炸水平 • 颜色代表词常用和达 到最大爆炸水平的年 代
26
2.知识图谱概述——发展历程
有维斯(J. Wise)等提出“信息 地图”information landscape
传播 创新
百闻不如一见、一图胜万言!
纽约大学心理学专家吉米·布洛诺(Jerome Bruner)在实验中发现,人们能记住10%听 到的东西,30%读到的东西,但是却可以记 住 80%看到的东西
8
9
1.知识可视化概述
❖科 学 计 算 可 视 化 (Visualization in Scientific; Computing)、数据可视化(Data visualization)、 信息可视化、知识可视化、知识域可视化。
❖ 基本原理是分析知识单元 (科学文献、科学家、关 键词等)的相似性及测度。 采用不同的方法和技术绘 制不同类型的图谱。
科学知识图谱
22
2.知识图谱概述——发展历程
❖ 传统的科学图谱以简单的二维、三 维图形(如:柱形图、线性图、点 布图、扇形图、平面图等)表示科 学统计结果
文献摘要或关键词纪录比例图
2.知识图谱概述——发展历程
❖ PFNET算法根据经验性数据, 对不同概念或实体间联系的相 似性或差异程度做出评估,然 后引用图论中的基本概念或原 理生成特殊的网状模型
1990美国心理 学家斯克沃斯 兹恩巴克提出 “寻径网络图 谱”pathfinder network
scaling map,PFNET
国内数据库:CNKI、CSSCI、CSCD、万方等
网络数据源:Google Scholar、arXiv、CiteSeerX
30
3.2样本数据清洗
❖ 基于文献数据库进行知识可视化的质量、合理 性和可靠性很大程度上依赖于所用数据的精确 性和全面性,不准确或不全面的数据往往造成 不精确甚至错误的结果。即使目前最权威、公 认质量最高的WoS,也存在数据著录格式(如 人名和地名的不统一)和遗漏的问题。
GREEN BL, 1990, J APPL SOC PSYCHOL, V20, P1033 HANSON RF, 1995, J CONSULT CLIN PSYCH, V63, P987 HARVEY AG, 1999, J CONSULT CLIN PSYCH, V67, P985
author cocitation
KAWACHI I, 2001, J URBAN HEALTH, V78, P458
KESSLER RC, 1995, ARCH GEN PSYCHIAT, V52, P1048 KILPATRICK DG, 1987, CRIME DELINQUENCY, V33, P479 MADAKASIRA S, 1987, J NERV MENT DIS, V175, P286
11
1.知识可视化概述
可视化对象 可视化目的
可视化方式
交互类型
信息可视化
知识可视化
知识图谱
非空间数据
人类的知识
科学知识
从大量抽象数据中 促进群体的知识创新 展示学科,促进科学
发现新的信息
和传播
发展
计算机图形图像 绘制草图、知识图表、 多维图表、视觉隐喻 视觉隐喻
人-交互
人-交互
人-交互
12
1.知识可视化概述
journal cocitation
RUBONIS AV, 1991, PSYCHOL BULL, V109, P384
RUEF AM, 2000, CULTURAL DIVERSITY E, V6, P235
SHAH B, 1997, SUDAAN USERS MANUAL
第六 科学知识图谱方法及应用
工欲善其事,必先利其器
❖课程考核:相关的课程论文,6月1号前交 信息管理学院336办公室。
❖包括学号、姓名、联系方式
2
引言
❖对学科(领域、主题)过去、现状、前沿、热 点、趋势的把握可通过什么方法手段?
3
引言的重要性! ❖文献是记录有知识的一切载体 ❖文献是科学交流的主要途径与手段
5
目录
1
知识可视化概述
2
知识图谱概述
3
知识图谱绘制方法
4
知识图谱绘制工具
5
CiteSpace简介与操作
6
知识图谱应用案例
6
1.知识可视化概述
语言
文字 知识 肢体
图像 其它
❖ 一图展春秋,一览无余;一图胜万言,一目了然
——大连理工大学教授刘则渊
7
1.知识可视知化识概可述视化实质
图解
知识
可视化 促进 形式
❖ 知识可视化发展时间很短 ,正式起源于 2004年, M.J.Eppler 和 R.A.Burkhard 共 同 发 表 论 文 (knowledge Visualization -Towards a New Discipline and its Fields of Application)。