当前位置:
文档之家› 知识构建社区知识图谱自动构建的关键问题研究
知识构建社区知识图谱自动构建的关键问题研究
(二)知识建构教学平台对知识的结构化处理及不足
知识建构教学平台是以发展社区知识为核心的知识论坛。[12]从哲学层面说,知识论坛是用于支持“世界3”的显性化表达;[13]KF也是以Applet的形式嵌入一些基于统计的评价工具,如Contribution Tool(贡献量分析工具)、Semantic Overlap Tool(语义重叠工具)、Social Network Tool(社会网络分析工具)、Vocabulary Growth Tool(词汇量增长评价工具)等。这些工具从社区成员活动关系、互动用语关键词等角度进行了量化统计,极大地支持了学生知识可视化表征与发展。[14][15]
知识图谱构建的关键技术,包括实体及关系抽取技术、知识融合技术、实体链接技术和知识推理技术;知识图谱构建包含从数据来源到应用等各个环节的相关技术:最初实体关系识别任务在1998年信息理解会议(Message Understanding Conference,MUC)中以MUC-7任务被引入,目的是通过填充关系模板槽的方式抽去文本中特定的关系;1998年后,在自动内容抽取(Automatic Content Extraction,ACE)中被定义为关系检测和识别的任务;2009年ACE并入文本分析会议(Text Analysis Conference,TAC),关系抽取被并入到KBP(Knowledge Base Population)领域的槽填充任务。[7]
知识构建社区知识图谱自动构建的关键问题研究
作者:张义兵徐朝军
来源:《数字教育》2019年第04期
摘要:知识建构理论(KB)及其技术环境知识论坛(KF)是当今国际学习科学界具有代表性的知识创新学习理论与技术,代表着21世纪“教与学”的变革方向。从理论研究与实践需求看,知识建构研究的一个瓶颈问题是在持续的知识建构过程中,社区成员在KF平台里形成了海量的“非结构化”“半结构化”数据碎片,KF平台目前只能做浅层次的可视化表达,而难以对其进行结构化的深度分析。本研究围绕知识建构学习社区知识图谱自动构建的关键问题,力图通过建构“人—活动—知识”之间的理论模型,提出借助自然语言处理、语义分析、实体关系发现等知识图谱技术,研发知识图谱构建引擎的方案,进而结合教学实践过程,展示实际应用的路径。
基于机器学习的命名实体发现方法,划分为四类:监督、半监督、无监督和混合方法。从实体关系发现任务看,可以分为限定领域(Close Domain)和开放领域(Open IE);从实体关系发现方法上看,经历了从流水线识别方法逐渐过渡到端到端的识别方法。[8]而在知识表示方面,典型的模型有距离模型、单层神经网络模型、双线性模型、神经张量模型、矩阵分解模型、翻译模型以及TranesH、TransR、TransD、TransG、KG2E等各种复杂关系模型和多原组合模型。在知识融合、知识推理等方面,同样也有非常丰富的研究和积淀值得参考和学习。[9][10][11]
二、已有研究述评
(一)知识图谱自动构建的相关研究
20世纪60年代末,奎廉(M. R. Quillian)和西蒙斯(R. F. Simmons)等提出语义网络,提出概念提取和概念之间关系的建模等。随着互联网的发展,网络中愈发丰富的超文本链接和应用链接将互联网上丰富的信息形成巨大的信息网络,给用户信息搜索带来了很大的障碍。[5]2012年,谷歌为增强搜索结果,建立了语义网知识库,并称之为知识图谱。随之,这一概念得到业内的迅速认可和应用。[6]
(1)能够自动挖掘人、活动与知识间的联系,以可视化方式向知识建构学习社区成员反馈结构化的知识,辅助教师与学生进行知识管理。
(2)能够通过构建多层次用户、多样化活动、多类型知识的知识图谱,支持知识建构学习社区的学习分析。
(3)能够通过基于时间线的、与知识建构过程同步的动态数据分析,预测知识建构社区知识的发展走向,辅助社区成员“教与学”的设计。
知识建构理论的独特之处是强调学生像科学家一样探究真实问题,形成以“观点”(Idea)为中心的多样化知识表征,并且可视化表达在KF平台上,但也由此形成了类型多样、交错复杂的“半结构化”“非结构化”的数据碎片。[3]目前,KF平台能够进行一般社会网络分析,但无法分析复杂互动行为(如反驳、批判、抗辩等);KF也能够做一般的词汇及其增量分析,但是不能分辨含糊的语义、概念的发展跟踪等;KF还能够统计社区成员的参与量、贡献量等基础数据,但不能诊断教学問题,预测教学走向,难以比较社区理论构建与学科课程目标之间的差异等,这些问题也一直极大地困扰着国际知识建构学术共同体。
关键词:知识建构学习社区;社区知识图谱;知识论坛;语义分析;实体关系发现
一、问题提出的背景
知识建构理论(Knowledge Building,KB)及其技术环境知识论坛(Knowledge Forum,KF)是国际学习科学(Learning Science)界极具代表性的知识创新学习理论与技术,代表着21世纪“教与学”的变革方向。该理论在欧美、东亚等区域的前瞻性研究中具有很大影响力,一直是学术研究最活跃的课题。在全面深化教育改革的大背景下,该理论也吸引了一些中国的学者开展初步的教学实验,但是总体上,中国的研究尚难以跟上国际发展前沿。[1][2]
针对KF中的“半结构化”“非结构化”数据碎片,近年日渐成熟的知识图谱(Knowledge Graph)技术是解决该பைடு நூலகம்题的最好选择之一。若应用好该技术,就能够理清知识建构学习社区中复杂的人、活动与知识之间的结构关系,能够跟踪与分析人、活动与知识的发展过程,把握个体、群组等的发展变化及差异等。[4]因此,基于KF平台构建知识建构学习社区知识图谱的意义在于:
知识建构学术共同体一直受到困扰的是KF平台上日益增多的人与人、人与知识、知识与知识、知识与活动等多对象间的复杂数据关系,研究者也在不断寻求更多、更好的技术方法对这些数据进行梳理、表征,以更好地支持社区知识的各个环节,促进学生对知识理解加深,缩短知识建构、达成共识的周期。[16]美国明尼苏达大学的陈伯栋通过基于设计的研究探索了有前景的观点工具(Promising Idea Tool),该工具的主要功能是学生自发选择,按照次数排名统计,判断有前景的观点,但是其无法对社区大规模的“观点”进行判断。[17]美国纽约大学张建伟团队开发了观点线程贴图(Idea Thread Mapper,ITM)工具,该工具通过帮助学生回顾那些以互动交流为主题的富有成果的探究性话题,并找出随着时间推移而产生的重要思想,以解决每一个焦点问题,[18]但也只是一般网络行为跟踪,并未涉及深度的语义的分析。日本欧希玛(Oshima)教授团队开发了KBDeX筛选关键词,但是该工具不能进行自动化的处理,需要研究者先手工抽取关键词,再进行数据转换后,利用第三方KBDex才能处理。