当你在百度搜索“孙悟空的师傅”时(参见图13-16),会直接展现出唐僧和菩提老祖的百度百科介绍。
图13-16 在百度搜索“孙悟空的师傅”
这是因为百度搜索通过知识图谱建立实体之间的属性与关系,让搜索引擎更懂用户的意图,直接解答用户的疑惑。
当你拿起手机搜索“全聚德”时,会自动展现你附近的全聚德店的位置,如图13-17所示。
图13-17 百度搜索“全聚德”
这是因为百度搜索借助于知识图谱,结合用户行为信息,为用户提供更符合当前场景的搜索结果。
当你在百度搜索“达芬奇”时,除了会展现达·芬奇相关的信息,同时也会自动展现关注达·芬奇的人同时也关注的其他人物以及作品,见图13-18。
这是因为百度搜索通过知识图谱建立事物之间的关联,扩展用户搜索结果,发现更多内容。
图13-18 百度搜索“达芬奇”
2012年,Google在其官方博客中宣称:为了让用户能够更快、更简单地发现新的信息和知识,Google搜索将发布“知识图谱”(Knowledge Graph)——可以将搜索结果进行知识系统化,任何一个关键词都能获得完整的知识体系。比如搜索“Amazon”(亚马逊河),一般的搜索结果会给出和Amazon最相关的信息。比如Amazon网站,因为网上关于它的信息最多,但Amazon并不仅仅是一个网站,它还是全球流量最大的Amazon河流。如果再追溯历史,它可能还是希腊女战士一族的代称。而这些结果未来都会在Google搜索的“知识图谱”中展现出来。Google的“知识图谱”不仅仅会从Freebase、维基百科或全球概览中获得专业的信息,同时还通过大规模的信息搜索分析来提高搜索结果的深度和广度。现在Google数据库中包含超过5亿个事物,不同事物之间的关系超过35亿条。同时人们搜索得越多,Google获得的信息也就越多越全面,整个“知识图谱”也就会达到更好的效果。
知识图谱本质上可以认为是图的一种具体应用,它大量集成了互联网上的各类数据,从而进一步挖掘出了数据的潜在联系与价值。在安全领域应用知识图谱,可以挖掘数据之间潜在的联系,结合这些潜在的联系可以大大扩展我们的数据分析思路。