n8n 中的 RAG

什么是 RAG

检索增强生成 (RAG)是一种通过将语言模型与外部数据源相结合来改进 AI 响应的技术。RAG 系统并非仅仅依赖模型的内部训练数据，而是检索相关文档，以将响应与最新的、特定领域或专有的知识相结合。RAG 工作流程通常依赖于向量存储来高效地管理和搜索这些外部数据。

向量存储是一种特殊的数据库，用于存储和搜索高维向量：文本、图像或其他数据的数值表示。上传文档时，向量存储会将其拆分成多个块，并使用嵌入模型将每个块转换为一个向量。

您可以使用相似性搜索来查询这些向量，这种搜索基于语义而非关键字匹配来构建结果。这使得向量存储成为 RAG 和其他需要检索和推理大量知识的 AI 系统的强大基础。

从 RAG 模板开始

👉 使用RAG Starter Template在 n8n 中试用 RAG 。该模板包含两个现成的工作流程：一个用于上传文件，一个用于查询文件。

在您的代理可以访问自定义知识之前，您需要将该数据上传到向量存储：

您可以通过两种主要方式查询数据：使用代理或直接通过节点。

专业提示

要在开销较大的模型上节省令牌，您可以先使用“向量存储问答”工具检索相关数据，然后再将结果传递给代理。要查看此模板的实际效果，请查看。

正确的嵌入模型因情况而异。

一般来说，较小的模型（例如）速度更快、成本更低，因此非常适合处理简短的通用文档或轻量级 RAG 工作流程。较大的模型（例如）能够提供更好的语义理解。它们最适合处理长文档、复杂主题或准确性至关重要的情况。

这又很大程度上取决于您的数据：

使用正确的重叠大小对于 AI 理解块的上下文至关重要。这也是为什么使用 Markdown 或代码块拆分通常有助于优化块。

另一个好方法是添加更多上下文（例如，关于该块来自哪个文档）。如果你想了解更多，可以看看Anthropic 的这篇精彩文章。