发布于

什么是检索增强生成(RAG)?

作者

RAG 是一种优化大型语言模型(LLM)输出的过程,使其参考特定的知识库,该知识库可能在之前的训练数据中没有被包含,然后生成相应的响应。

Image

换句话说,RAG帮助将大型语言模型(LLM)的强大功能扩展到特定领域或知识库中,而无需额外的训练。

以下是RAG的工作原理:

1 - 用户在LLM的用户界面中输入查询提示,该查询被传递到后端服务器,在那里它被转换为向量表示。

2 - 查询被发送到搜索系统。

3 - 该搜索系统可以参考各种知识来源,例如PDF、网页搜索、代码库、文档、数据库或API,以获取相关信息来回答查询。

4 - 检索到的信息被发送回RAG模型。

5 - 模型通过将检索到的信息添加到上下文中并将其发送到LLM端点来增强原始用户输入。各种LLM选项包括Open AI的GPT、Claude Sonnet、Google Gemini等。

6 - LLM根据增强的上下文生成答案,并将响应提供给用户。

请注意,中文版本是由 AI 辅助翻译的,因此可能存在细微错误。

作者

Ai Base Network (ABN), ABN ASIA由具有深厚学术背景的人员创立,他们在美国、荷兰、匈牙利、日本、韩国、新加坡和越南等国家有工作经验。ABN Asia是学术界和技术相遇的地方。凭借我们领先的解决方案和优秀的软件开发服务,我们帮助企业提升水平,走向全球舞台。我们的承诺:更快。更好。更可靠。在大多数情况下:也更便宜。

无论您需要IT服务、数字咨询、现成软件解决方案,还是想向我们发送招标要求(RFPs),都请随时与我们联系。您可以通过[email protected]与我们联系。我们随时准备为您提供所有技术需求的帮助。

ABNAsia.org

© ABN ASIA