NEWS AND INFORMATION
图数据库是基于图模型,以“实际”关系为主要存储对象的数据库系统。图中存储的主要数据是带属性的顶点和带属性的边,边是顶点间关系的描述,是一种自然关系的表达。
| 基本概念:
图(Graph):指关系图。比如:同学及朋友关系图、银行转账图等。
顶点(Vertex):一般指实体。比如:人、账户等。
边(Edge):一般指顶点之间的关系。比如:朋友关系、转账动作等。
属性(Property):顶点或边可以包含属性,比如:人的姓名、人的年龄、转账的时间等。
| 基本区别:
建模方式不同,图数据库基于现实世界的实体和关系建模,更为直接易懂;传统关系数据库建模需要的抽象层次更高,也更为复杂。
| 查询语言不同:
图数据都有配套的查询语言,以更为贴合自然语言的方式限定查询条件,易于表达查询需求;关系型数据库使用SQL查询语言,同样抽象层次较高,尤其对于多层关系的查询(需要join操作)时,语句非常复杂,且效率低下。
| 重要区别:
图数据库拥有复杂的关系查询能力,图数据库以实体和关系为基本单位,特别适合查询和分析多层次、多样的复杂关系;关系数据库则在复杂关系查询方面欠缺,尤其是涉及多表关联或者递归查询时不堪重负。
| 数据规模问题:
图数据库的实现可以基于KV存储,可以高效方便的存储亿或十亿级别的数据;关系型数据库在此规模下,必须进行复杂的分库分表设计,不然根本无法胜任。
在如今的大数据时代,人类社会的数据量呈爆发式增长。任何行业的数据都是快速增长的,这没有疑义,但更重要的是:数据与数据之间的关系数目将呈现平方级增长:3个点最多有6条有向边,4个点最多有12个有向边,N个节点最多有N *(N-1)个有向边。在传统的数据库中,随着关系的数量和深度的增加,关系查询的效率将急剧衰减,甚至崩溃。然而图形数据库的性能将几乎不变,即使数据每天都在增长这也是相较于传统数据库我们的一大优势所在。
总而言之,面对海量数据的存储和处理问题,传统的关系数据库已经无法满足大部分的日常数据储存的需求。图数据库技术可以将关系信息储存为实体、灵活拓展数据模型。由于提供了对关联数据最直接的表达,以及图模型对异构数据天然的包容力。未来,图数据库技术必将成为最为热点的技术之一,为企业存储和分析大规模图数据提供强有力的支持。