当前位置：文档之家› 知识图谱自动构建在线云平台-web protege汉语版

知识图谱自动构建在线云平台-web protege汉语版

知识图谱自动构建在线云平台-web protege汉语版
protege汉化版Protege软件是斯坦福大学医学院生物信息研究中心基于Java语言开发的本体编辑和知识获取软件。

这个软件主要用于语义网中本体的构建，是语义网中本体构建的核心开发工具。

相比与其他的本体构建工具而言，Protégé最大的好处在于支持中文，在插件上，用Graphviz 可实现中文关系的显示。

为了方便大家，在北理工张华平博士的带领下，对protege汉化后又对webprotege进行了汉化，并成功上线，使大家可以在线进行知识图谱语义本体的自动构建。

webprotege汉化版
知识图谱语义本体的构建流程图：知识图谱包括实体与关系
节点代表实体连边代表关系事实可以用三元组表示(head, relation, tail)
概念发现1．格式解析对PDF、Word、XML等主流文档，抽取出结构化的文本信息。

2．分词标注NLPIR-ICTCLAS 分词系统可以融合已有本体库，实现专业领域的分词标注。

3．概念发现(1).NLPIR-ICTCLAS新词发现可直接从原始语料中直接发现新词、新概念。

(2).采用基于规则与统计相结合的方法实现从新词中过滤筛选本体概念。

关联计算使用POS-CBOW模型对数据进行训练，然后对数据完成
关联关系分析。

POS-CBOW方法综合了词性、词的分布特点，采用word2vector改进模型，通过训练，自动提取出了语义关联关系。

如果训练文本为专业领域的生语料，该模型可以产生专业领域的本体关联关系。

依存句法分析
关系抽取实际上是实体与关系的抽取，一般是通过上面提到的三元组方法不断迭代实现。

例：1、通过“X是Y的首都”
模板抽取出(中国，首都，北京)、(美国，首都，华盛顿)等三元组实例；2、根据这些三元组中的实体对“中国-北京”和“美国-华盛顿”可以发现更多的匹配模板，如“Y的首都是X”、“X 是Y的政治中心”等等；新发现的模板抽取更多新的三元组
实例，通过反复迭代不断抽取新的实例与模板。

集成验证
构建工具---- Protégé1.OWL:W3C开发的一种网络本体语言，用于对本体进行语义描述。

类(Class)、个体(Individual)、属性(Property) 2. Protégé: 斯坦福大学基于Java语言开发的
本体编辑和知识获取软件，是语义网中本体构建的核心开发工具。

效果展示：
知识图谱自动构建在线云平台。

e商务文档

知识图谱自动构建在线云平台-web protege汉语版

相关文档推荐：