发布于

传统RAG与HyDE的视觉解释。

作者

传统的RAG系统存在一个关键问题,即问题与答案在语义上并不相似。

Image

如果你想找到一个与"What is ML?"类似的句子。

很可能"What is AI?"比"Machine learning is fun"更相似。

由于这种语义差异,在检索步骤中会检索到许多不相关的上下文。

HyDE 解决了这个问题。

以下视觉化展示了它与传统 RAG 的区别。

它的工作原理如下:

  • 使用大语言模型(LLM)生成一个假设答案 H 来回答查询 Q(这个答案不需要完全正确)。

  • 使用对比模型(contriever)对答案进行嵌入以获取嵌入 E(使用对比学习训练的双编码器在这里非常有名)。

  • 使用嵌入 E 查询向量数据库并检索相关上下文(C)。

  • 将假设答案 H + 检索到的上下文 C + 查询 Q 传递给 LLM 以生成答案。

完成!

当然,生成的假设答案可能包含虚假的细节。

但这并不会严重影响性能,因为对比模型可以嵌入——它使用对比学习训练,并且还可以作为一个近乎无损的压缩器,其任务是过滤掉假文档的虚假细节。

这生成了一个向量嵌入,预计它与实际文档的嵌入比问题与实际文档更相似。

多项研究表明,HyDE 比传统嵌入模型提高了检索性能。

但这会增加延迟和更多的 LLM 使用。

请注意,中文版本是由 AI 辅助翻译的,因此可能存在细微错误。

作者

Ai Base Network (ABN), ABN ASIA由具有深厚学术背景的人员创立,他们在美国、荷兰、匈牙利、日本、韩国、新加坡和越南等国家有工作经验。ABN Asia是学术界和技术相遇的地方。凭借我们领先的解决方案和优秀的软件开发服务,我们帮助企业提升水平,走向全球舞台。我们的承诺:更快。更好。更可靠。在大多数情况下:也更便宜。

无论您需要IT服务、数字咨询、现成软件解决方案,还是想向我们发送招标要求(RFPs),都请随时与我们联系。您可以通过[email protected]与我们联系。我们随时准备为您提供所有技术需求的帮助。

ABNAsia.org

© ABN ASIA