本文对知识图谱的存储进行了全面的介绍,内容包括:什么是知识图谱,知识图谱的适用场景,知识图谱数据存储的几种常见方式和最佳方案,知识图谱中的时态信息及其存储实现,结合实例说明如何利用图数据库进行数据存储。
本文对知识图谱的
存储进行了全面的介绍,内容包括:什么是知识图谱,知识图谱的适用场景,知识图谱数据存储的几种常见方式和最佳方案,知识图谱中的时态信息及其存储实现,结合实例说明如何利用图数据库进行数据存储。
1. 什么是知识图谱
我们的现实世界中有多种类型的事物:
事物之间有多种类型的链接:
而知识图谱即用来描述真实世界中存在的各种实体或概念,以及它们之间的关联关系。
其中:
每个实体或概念用一个全局唯一确定的ID来标识,称为标识符;
每个属性—值对用来刻画实体的内在特性,而关系用来连接两个实体,刻画它们之间的关联。
从抽象层面看,本体最抽象,其次是知识库,最后才是知识图谱,因此本体与知识图谱的区别在于以下三点:
知识图谱并不是本体的替代品,它是在本体的基础上进行了丰富和扩充,这种扩充主要体现在实体(Entity)层面;
本体中突出和强调的是概念以及概念之间的关联关系,而知识图谱则是在本体的基础上,增加了更加丰富的关于实体的信息;
本体描述了知识图谱的数据模式(schema),即为知识图谱构建数据模式相当于为其建立本体。
1.1 知识图谱的应用
知识图谱已经在人工和
商业智能方面有了一系列的应用,包括聊天
机器人,临床决策支持等。
同时为了应对大数据应用的不同挑战,借助知识图谱,实现不同的业务需求。
2. 知识图谱的适用场景
我们看到知识图谱有了如此多的应用,不过它最适合处理还是这些数据:
关系复杂的数据;
类型繁多的数据;
结构多变的数据。
作为数据融合与链接的纽带,知识图谱整合结构化、半结构化和非结构化数据,拥有如下的消费和数据场景。
但知识图谱不是银弹!需要我们依据不同的问题寻找合适的方法,不要为了用知识图谱而用知识图谱。
知识图谱的不适用场景如下:
不适用的数据场景:
通常的二进制数据
日志数据
流式数据
不适用的消费场景:
数据统计
数据计算
这些不适用场景都需要借助其它工具存储和处理,同时结合其它工具和方法使用,最终与知识图谱进行数据链接。
本文为授权转载文章,任何人未经原授权方同意,不得复制、转载、摘编等任何方式进行使用,e-works不承担由此而产生的任何法律责任! 如有异议请及时告之,以便进行及时处理。联系方式:editor@e-works.net.cn tel:027-87592219/20/21。