当前位置:
文档之家› 图数据库的设计原理及发展现状
图数据库的设计原理及发展现状
图计算发展情况如何?
3、从市场竞争角度,现在有很 多不同类型的图数据库产品,每 种产品的优势不同,随着图数据 库在各个垂直行业的企业和用例 中不断得到应用,了解其中的差 异非常重要。图数据库现状对比 如图所示。
图分析能力 成为得力助手
03
图分析能力成为得力助手
图数据库通过原生并行图打破了前几代的局限性,实现深度关联 分析。我们知道,原生图数据库直接以图模型格式(点和边)存 储数据,提供内置索引,可以加快数据加载速度以快速构建图。 相较之下,非原生图虽然能轻松支持多模态数据库,但牺牲了图 性能,如果数据集很大,非原生图通常难以处理 3 步以上的查 询。
知识图谱受到越来越多的重视,其中确定性的知识会以实际顶点和边的 形式存储在图数据库中,概率性知识一般需要依赖于图分析引擎,进行 知识推理。图神经网络和知识图谱将是未来引爆图计算的机会。
图计算值得关注的热点
但是,图要实现大规模应用,必须先攻破的技术难点 之一就是如何提升图分析能力。原生的图数据存储可 以跨越数据孤岛,进行有效的建模,探索和查询具有 复杂关系的数据,进而解决 SQL 在查询复杂数据问题 并不总是有效的问题。但问题是,图数据的存储和分 析对数据规整性要求高,一旦数据规整性差,就会影 响计算,且分析难度会随着分析维度的增加而增加。
图计算 值得关注的热点
01
图计算值得关注的热点
图计算重点包括两点:图数据库和图分析引擎,前者 重点关注 OLTP ,后者重点关注离线图计算,当然这 二者的界限有时候不那么清晰,比如有些图数据库内 置了图分析算法的实现,有些图分析引擎也实现了事 务和持久化。 图计算在近几年受到广泛的关注,主要有以下几个方 面的因素
图分析能力成为得力助手
可扩展性是大数据时代的一个重要特征。企业需要将他们的数据 库解决方案横向扩展到多台计算机,因为他们的数据可能增长得 过大,无法经济地存储在单个服务器上,图数据库支持纵向扩展 和横向扩展,能够将图数据自动划分到一个服务器集群中,在保 持实时速度的同时,提高加载和查询吞吐量。图数据库在执行每 项任务的同时,擅长并行处理,采用 MPP 设计架构,每个点和 关联都可以关联一个计算函数,并且每个点或关联可同时作为并 行的存储单元,存储紧凑,访问快速。图数据库采用一种分布式 计算模式,让所有服务器都参与查询,例如,当遍历路径从服务 器 A 跨入服务器 B 时,将向服务器 B 传递它需要知道的最少 量的信息,在服务器 B 已经得知整个查询请求后,便可以轻松 参与分工,这样就显著地提升遍历大部分图的分析查询性能。
图计算 发展情况如何?
02
图计算发展情况如何?
从图技术本身来看,整个图计算领域可进一步细分为查询分析、 计算引擎、存储管理、可视化等子方向。目前并没有一种涵盖所 有子方向的图引擎。例如图数据库Neo4j、Titan 等擅长于图数 据的事务性查询,但并不能高效地进行离线分析;分析引擎 Turi、GraphX 侧重图数据的离线分析和挖掘,却不能对属性图 进行管理,且不支持实时查询。图计算引擎多种多样。最出名的 是有内存的、单机的图计算引擎 Cassovary 和分布式的图计算 引擎 Pegasus 和 Giraph 。
总结
04
总结
图计算方兴未艾,在喧闹背后,我们应该冷静地看到它尚未攻破 的难点,比如前面提到的超级顶点问题、OLTP 和 OLAP 融合问 题、图划分、流式图数据处理等。而当下正处在风口浪尖上的知 识图谱和图神经网络,其背后值得思考的东西也很多。
总结
比如,图谱成为热点背后,我们更应该关注图谱的应用阶段,有 些阶段离不开人的参与,有些阶段应尽可能减少人的介入,二者 之间达成某种平衡。现在我们都在谈 5G ,那么 5G 跟图谱之间 是否也有关联?5G 催生了 AI 的新应用,未来,图谱从单模态 发展为多模态的想象空间还是非常大的。
演讲完毕,谢谢观看
数易轩图数据库技术小祖
Байду номын сангаас
图计算值得关注的热点
YOUR TITLE
适合以图表达的数据积累到一定程度了,对隐藏在图数据 中的知识挖掘的需求也随之越来越强烈。
图神经网络是深度学习的一个重大创新。深度学习发展遇到了瓶颈,不可解 释性是其固有的顽疾。而与深度学习相结合的图计算将端到端学习与归纳推 理相结合,有望解决深度学习无法处理的关系推理、可解释性等固有问题。
图数据库
设计原理及发展现状
数易轩图数据库技术小祖
图数据库的设计原理及发展现状
随着互联网急速发展,各行各业对于数据管理的需求与日俱增, 数据库产业竞争压力也越来也愈大。图数据库作为新型NoSQL数 据库的代表,图数据库产业的爆发也将计日可待。数易轩致力于 图数据库技术服务,为您介绍图数据库的发展与现状。
图计算发展情况如何?
1、在金融反欺诈、社交、营销、物流和 IoT 领域应用广泛,但是很少 有端到端的解决方案,用户使用门槛较高。另外,新技术的实操积累尚 不成熟。以知识图谱为例,前几年大家讨论的是应用实现,所以知识图 谱火了。但是,当项目要落地时碰到了很多技术上的障碍,比如在性能 上,数据加载就是一个瓶颈,这导致知识谱图不能实时及时更新,使很 多项目上不了线。目前,超级顶点问题、OLTP 与 OLAP 融合问题、图 划分、流式图数据处理,仍然是学术界和工业界研究的重点。
图计算发展情况如何?
2、从企业用户的角度,数据质量、应用方法不成熟,用户没有明确自 己要什么,导致图技术落地困难重重。图数据库的实施流程一般包括: 业务理解、图 Schema 设计、业务数据加工、业务验证和监控运维 5 个步骤。其中第一步就是业务理解,这一步需要用户明确自己要什么, 理解业务数据和业务问题,将业务问题映射成图问题,并确认数据来源、 存储介质、更新方式、容灾方案等,并匹配相应的软硬件资源。很多企 业用户还没有清楚地理解业务就开始设计,导致后面惨淡收场。所以, 当前应用图数据库的主要还是 BATJ、今日头条、华为等一线企业,以 及大中型金融机构、政府等。