2405.16506_GRAG: Graph Retrieval-Augmented Generation¶

https://arxiv.org/abs/2405.16506
作者：Yuntong Hu, Zhihan Lei, Zheng Zhang, Bo Pan, Chen Ling, Liang Zhao
【微软研究院】胡运通、雷志涵、张正、潘波、陈岭、赵亮
时间：2024-05-26
虽然检索增强生成（RAG）通过生成语言模型提高了响应的准确性和相关性，但它在文本和拓扑信息都很重要的基于图的上下文中存在不足。朴素的 RAG 方法本质上忽略了文本图的结构复杂性，导致生成过程中存在关键差距。为了应对这一挑战，我们引入了 Graph Retrieval-Augmented Generation (GRAG) ，它通过强调子图结构的重要性来显着增强检索和生成过程。与仅关注基于文本的实体检索的 RAG 方法不同，GRAG 保持对图拓扑的敏锐认识，这对于生成上下文和事实一致的响应至关重要。我们的 GRAG 方法由四个主要阶段组成：
- k-hop 自我图的索引、
- 图检索、
- 软修剪以减轻不相关实体的影响，
- 生成修剪后的文本子图。
GRAG 的核心工作流程——检索文本子图，然后进行软剪枝——有效地识别相关子图结构，同时避免穷举子图搜索典型的计算不可行性，这是 NP 困难的。此外，我们提出了一种新颖的提示策略，可以实现从文本子图到分层文本描述的无损转换。图多跳推理基准的大量实验表明，在需要对文本图进行多跳推理的场景中，我们的 GRAG 方法显着优于当前最先进的 RAG 方法，同时有效减轻幻觉。

https://img.zhaoweiguo.com/uPic/2024/07/wWwY7j.png — GRAG 检索与查询相关的子图，而不是像 RAG 那样的离散文档，以减少语义相似但不相关的文档（红色）对生成的负面影响。¶

主页

索引

模块索引

搜索页面