一文读懂 RAG:检索增强生成技术全景
什么是 RAG?
检索增强生成(RAG) 是将信息检索系统与 LLM 生成能力结合的技术架构。它在生成回答前,先从知识库中检索相关文档片段。
核心流程
- 文档分块:将知识库文档切分为语义段落
- 向量嵌入:使用 Embedding 模型将文本转为向量
- 相似检索:查询时检索最相关的 Top-K 文档片段
- 增强生成:将检索结果作为 Context 注入 Prompt
实践建议
- 分块大小控制在 512-1024 tokens
- 检索数量 5-10 个片段效果最佳
- 必要时加入重排序(Re-rank)提升精度