什么是检索增强生成（RAG）？

RAG 是一种优化大型语言模型（LLM）输出的过程，使其参考特定的知识库，该知识库可能在之前的训练数据中没有被包含，然后生成相应的响应。

换句话说，RAG帮助将大型语言模型（LLM）的强大功能扩展到特定领域或知识库中，而无需额外的训练。

以下是RAG的工作原理：

1 - 用户在LLM的用户界面中输入查询提示，该查询被传递到后端服务器，在那里它被转换为向量表示。

2 - 查询被发送到搜索系统。

3 - 该搜索系统可以参考各种知识来源，例如PDF、网页搜索、代码库、文档、数据库或API，以获取相关信息来回答查询。

4 - 检索到的信息被发送回RAG模型。

5 - 模型通过将检索到的信息添加到上下文中并将其发送到LLM端点来增强原始用户输入。各种LLM选项包括Open AI的GPT、Claude Sonnet、Google Gemini等。

6 - LLM根据增强的上下文生成答案，并将响应提供给用户。

请注意，中文版本是由 AI 辅助翻译的，因此可能存在细微错误。

作者

Ai Base Network (ABN), ABN ASIA由具有深厚学术背景的人员创立，他们在美国、荷兰、匈牙利、日本、韩国、新加坡和越南等国家有工作经验。ABN Asia是学术界和技术相遇的地方。凭借我们领先的解决方案和优秀的软件开发服务，我们帮助企业提升水平，走向全球舞台。我们的承诺：更快。更好。更可靠。在大多数情况下：也更便宜。

无论您需要IT服务、数字咨询、现成软件解决方案，还是想向我们发送招标要求（RFPs），都请随时与我们联系。您可以通过[email protected]与我们联系。我们随时准备为您提供所有技术需求的帮助。