RAG
Retrieval-Augmented Generation
把检索系统和生成模型结合起来:先从外部知识库取相关内容,再把检索结果放进上下文,让生成模型基于这些信息回答。
核心概念
- 基本流水线是:切分文档 -> 建向量索引 -> 检索候选 -> rerank -> 拼接 prompt -> 生成答案。
retriever强调召回,reranker强调重排质量,generator负责最终输出。chunk size、overlap、embedding model、query rewrite、hybrid search都会显著影响结果。- RAG 的价值不只是提升知识覆盖,还包括可更新性、可溯源性和减少幻觉。