10.2. RAG¶
10.2.1. RAGFlow¶
RAG engine based on deep document understanding.
10.2.2. Graph RAG¶
主要出发点:
回答涉及整个文档的问题,即query-focused summarization任务。
主要创新点:
利用图的模块度属性,使用社区检测算法将图划分为模块化社区,基于社区进行多层级摘要。
摘要:
涉及整个文档的问题是一种聚焦查询的摘要任务(QFS),之前的QFS方法无法在传统的RAG系统中扩展到大量的文本索引上。图RAG方法用来在私有文本语料库上回答QFS问题,该方法在用户问题的通用性和要索引的源文本的数量上具有高可扩展性。GraphRAG使用两阶段法基于LLM构建图的文本索引:第一步是从源文档抽取一个实体知识图谱,第二步是从高关联实体的组(社区)预生成社区摘要。给定一个问题,每个社区摘要都用于生成一部分答案,然后将部分答案再次摘要形成最终答案。