拆解RAG:从技术本质到企业级工程全局观
2026-03-28
抛开繁杂的框架与代码,从第一性原理出发,深度拆解检索增强生成(RAG)的本质、脆弱节点,以及企业级真实落地面临的深水区挑战。
3339 字
|
17 分钟
RAG进化史 (2020-2026):从玩具流水线到企业级智能体生态
2026-03-28
学术界曾提出过数十种RAG变体,但在真实的工业界,哪些技术真正活了下来?本文带你俯瞰RAG技术如何被业务痛点倒逼,一步步进化为2026年的企业级知识基础设施。
1636 字
|
8 分钟
大模型时代应用层演进的必然逻辑:从 RAG 到 Agent 的思考
2026-03-27
为什么火的是 RAG、Agent、MCP 和 LangChain?透过技术更迭的表象,探寻市场用脚投票背后的真实需求与演化铁律。
1858 字
|
9 分钟
彻底理解注意力机制:注意力机制的演进之路,及其核心优化逻辑
2026-01-05
本文从注意力机制最朴素的思想出发,系统梳理了其从基础实现到现代大模型中多种高级变体(MHA, MQA, GQA, MLA)的完整演进路径。
2606 字
|
13 分钟