Skip to content

RAG

Retrieval-Augmented Generation

把检索系统和生成模型结合起来:先从外部知识库取相关内容,再把检索结果放进上下文,让生成模型基于这些信息回答。

核心概念

  • 基本流水线是:切分文档 -> 建向量索引 -> 检索候选 -> rerank -> 拼接 prompt -> 生成答案。
  • retriever 强调召回,reranker 强调重排质量,generator 负责最终输出。
  • chunk sizeoverlapembedding modelquery rewritehybrid search 都会显著影响结果。
  • RAG 的价值不只是提升知识覆盖,还包括可更新性、可溯源性和减少幻觉。