- 发布于
GraphRAG 为何是最好的 RAG 系统之一?
- 作者

- 姓名
- AbnAsia.org
- @steven_n_t
图数据库应该是检索增强生成(RAG)的更好选择!

RAG系统通常很难检索到正确的上下文!检索到的信息通常局限于原始文档,可能很难找到与用户查询相关的文档。这就是Microsoft GraphRAG可以提供解决方案的地方!
有两个重要的部分。首先,我们将创建不同文档的摘要,且在不同的尺度上。这样,我们就可以了解整体上原始文档包含的全局信息,以及较小文本块中包含的局部信息。其次,我们将文本信息转换为图形形式。假设文本中的信息可以表示为一组节点和边。这使我们可以将文本中的全部信息表示为一个知识库,并存储在图数据库中。
数据索引管道如下:
- 我们将原始文档分割成子文本。
- 我们使用LLM提取实体、它们的关系和描述,并以结构化格式表示。
- 我们解决跨不同文本块中发现的重复实体和关系。我们可以将不同的描述总结为更完整的描述。
- 我们构建实体及其关系的图形表示。
- 从图中,我们使用Leiden算法以分层方式对实体进行聚类。每个实体都属于多个聚类,具体取决于聚类的尺度。
- 对于每个社区,我们使用实体和关系描述来总结它。我们为每个实体提供多个总结,代表社区的不同尺度。
在检索时,我们可以将用户查询转换为关键词进行词汇搜索,以及向量表示进行语义搜索。从搜索中,我们可以得到实体,并从实体中得到相关的社区总结。这些总结在生成时用作提示的上下文,以回答用户查询。
只有当我们实现它们时,我们才真正理解它们。
请注意,中文版本是由 AI 辅助翻译的,因此可能存在细微错误。
作者
Ai Base Network (ABN), ABN ASIA由具有深厚学术背景的人员创立,他们在美国、荷兰、匈牙利、日本、韩国、新加坡和越南等国家有工作经验。ABN Asia是学术界和技术相遇的地方。凭借我们领先的解决方案和优秀的软件开发服务,我们帮助企业提升水平,走向全球舞台。我们的承诺:更快。更好。更可靠。在大多数情况下:也更便宜。
无论您需要IT服务、数字咨询、现成软件解决方案,还是想向我们发送招标要求(RFPs),都请随时与我们联系。您可以通过[email protected]与我们联系。我们随时准备为您提供所有技术需求的帮助。

© ABN ASIA