GRAG: Graph Retrieval-Augmented Generation¶
作者:Yuntong Hu, Zhihan Lei, Zheng Zhang, Bo Pan, Chen Ling, Liang Zhao
【微软研究院】胡运通、雷志涵、张正、潘波、陈岭、赵亮
时间:2024-05-26
- 虽然检索增强生成(RAG)通过生成语言模型提高了响应的准确性和相关性,但它在文本和拓扑信息都很重要的基于图的上下文中存在不足。朴素的 RAG 方法本质上忽略了文本图的结构复杂性,导致生成过程中存在关键差距。为了应对这一挑战,我们引入了 Graph Retrieval-Augmented Generation (GRAG) ,它通过强调子图结构的重要性来显着增强检索和生成过程。与仅关注基于文本的实体检索的 RAG 方法不同,GRAG 保持对图拓扑的敏锐认识,这对于生成上下文和事实一致的响应至关重要。我们的 GRAG 方法由四个主要阶段组成:
k-hop 自我图的索引、
图检索、
软修剪以减轻不相关实体的影响,
生成修剪后的文本子图。
GRAG 的核心工作流程——检索文本子图,然后进行软剪枝——有效地识别相关子图结构,同时避免穷举子图搜索典型的计算不可行性,这是 NP 困难的。此外,我们提出了一种新颖的提示策略,可以实现从文本子图到分层文本描述的无损转换。图多跳推理基准的大量实验表明,在需要对文本图进行多跳推理的场景中,我们的 GRAG 方法显着优于当前最先进的 RAG 方法,同时有效减轻幻觉。