1636 字
8 分钟
RAG进化史 (2020-2026):从玩具流水线到企业级智能体生态

如果你去翻阅过去几年的AI论文,会发现学术界至少提出了十七八种RAG(检索增强生成)的变体。但如果深入到真实的工业界和企业落地场景,你会发现大浪淘沙之后,真正被广泛采用的架构其实屈指可数。

技术从来不会为了复杂而复杂。每一代RAG架构的跃迁,本质上都是在为上一代的“工程缺陷”还债,是被算力成本和真实的业务痛点倒逼出来的。

今天,我们就沿着时间线,盘点那些真正跨越了实验室,成为2026年企业基础设施的RAG核心技术。

阶段一:创世纪——朴素RAG (Naive RAG, 2020-2022)#

核心命题:让大模型“开卷考试”

2020年,Meta(原Facebook)的研究人员首次提出了RAG的概念。这是RAG的“石器时代”,它的逻辑极其直线、粗暴:

  1. 切块(Chunking): 把企业的文档按固定字数切碎。
  2. 向量化(Embedding): 变成数学向量存进数据库。
  3. 匹配与生成: 用户提问时,通过计算余弦相似度找出最匹配的几段文本,塞给大模型,让它总结。

为什么它在工业界遭遇了滑铁卢? 在写个小Demo时,朴素RAG看起来很惊艳。但一进入企业真实环境,它就暴露了致命弱点:“答非所问”与“缝合怪幻觉”。由于切词太粗暴破坏了上下文,或者用户的提问太过简短缺乏关键词,检索系统经常召回一堆毫无关联的垃圾信息。大模型看着这些“垃圾情报”,只能一本正经地胡说八道。

阶段二:工程化补丁——进阶RAG (Advanced RAG, 2022-2023)#

核心命题:在检索的前后两端疯狂打补丁

为了解决朴素RAG“召回垃圾信息”的问题,工业界的工程师们开始在流水线上加装各种“过滤器”和“放大器”。这个阶段没有本质的架构革命,全是工程上的精雕细琢。

  • 检索前(Pre-retrieval)的“查询重写”: 用户如果只搜“财报”,系统找不到精准内容。于是让大模型先做一次翻译,把“财报”扩写成“2023年 Q3 腾讯 财务报告 营收”。
  • 检索后(Post-retrieval)的“重排序 (Reranking)”: 这是当时企业提效的杀手锏。向量检索找出来的Top 20往往排序混乱,这时候引入一个专门的Reranker模型,像考官一样把这20个片段根据与问题的相关性重新打分排序,只把最精华的Top 3喂给大模型。

阶段三:算力经济学——自适应与反思 (Adaptive & Self-RAG, 2023-2024)#

核心命题:从“无脑检索”到“精打细算”

到了2023年底,随着使用人数的暴增,企业发现了一个绝望的现实:API账单太贵了,而且太慢了。 无论用户问“你好”还是问“深度分析财报”,系统都要去庞大的向量库里捞一遍,既浪费算力又折损体验。

这时候,真正符合“第一性原理”的架构出现了——系统必须学会自我判断。

  • Adaptive RAG(自适应路由): 在最前端加了一个轻量级的“路由大脑”。它会判断问题难度。闲聊?直接大模型回答;常识?走本地缓存;复杂业务?才启动深度检索。
  • Self-RAG(自我评估): 大模型在回答时,学会了自我反思(Critique)。如果它发现检索来的资料不足以支撑结论,它会拒绝回答或要求重新搜索,极大地降低了企业级应用中最害怕的“幻觉事故”。

阶段四:全局视野与暗数据——GraphRAG & 多模态RAG (2024-2025)#

核心命题:跨越向量盲区与解析地狱

向量检索有一个死穴:它只能找“字面相似”的切片。如果你问:“总结这100份医疗报告里提到的所有关于某款新药的并发症”,向量检索会彻底瘫痪,因为它无法跨越文档建立宏观联系。同时,企业里大量的带有复杂表格的PDF扫描件(暗数据)也让传统RAG束手无策。

  • GraphRAG(图检索): 2024年中,由微软大力开源推向工业界。它在处理数据时,让大模型提取所有文档中的“实体”和“关系”,构建出一张庞大的知识图谱。面对宏观总结问题,系统顺着图谱的“边”进行社区级别的全局推理,彻底打破了信息孤岛。

  • 多模态RAG(Multimodal RAG): 随着视觉模型(如Qwen-VL、GPT-4o)的爆发,业界终于可以直接把工业图纸、带合并单元格的Excel截图转化为高维向量。文字与图像在同一个空间共舞,彻底终结了痛苦的PDF正则清洗流程。

阶段五:终局形态——Agentic RAG (智能体RAG, 2025-2026)#

核心命题:从流水线工人到“全自动探案”的侦探

截至2026年,企业界已经不再孤立地谈论RAG了。之前的Advanced RAG、GraphRAG,现在都变成了大模型手中的“工具箱”。这就是目前的终局范式:Agentic RAG

在这里,大模型不仅是生成器,更是总调度室(Orchestrator)。 面对一个极其复杂的业务问题,Agent会:

  1. Plan(拆解计划): 把大问题拆成三个小步骤。
  2. Tool Use(工具调度): 步骤一调用 GraphRAG 查人物关系,步骤二调用多模态 RAG 看历史图纸,发现矛盾了,再调用 SQL 工具查一下实时数据库。
  3. Multi-hop(多跳推理)与闭环: 在各个节点之间来回跳转比对,直到拼凑出完整的真相,才给用户输出最终报告。

结语#

从2020年的“生硬拼接”,到2026年能够自主规划、调用图谱和多模态视觉的“智能体生态”。这五年间被淘汰的RAG技术数不胜数,但最终沉淀下来的,全都是顺应了企业最核心诉求的技术:更准的精度(GraphRAG)、更低的成本(Adaptive)、更强的容错(多模态),以及更少的人工干预(Agentic)。

RAG进化史 (2020-2026):从玩具流水线到企业级智能体生态
https://jiqingjiang.github.io/posts/tech/rag/第二篇rag进化史/
作者
erode
发布于
2026-03-28
许可协议
CC BY-NC-SA 4.0