彻底理解注意力机制:注意力机制的演进之路,及其核心优化逻辑
2026-01-05
本文从注意力机制最朴素的思想出发,系统梳理了其从基础实现到现代大模型中多种高级变体(MHA, MQA, GQA, MLA)的完整演进路径。
2606 字
|
13 分钟
Agent Skills 深度解析
2026-01-01
深入剖析 Anthropic 开源的 Agent Skills 标准。为什么我们需要 Skill?它是如何解决上下文污染问题的?以及如何利用它构建可复利的 AI 技能库。
1366 字
|
7 分钟
embedding模型相关知识
2025-12-27
现在的大模型,RAG等都需要把输入进行embedding,那embedding模型选型的标准是什么呢?以及embedding的原理,一般embedding是怎么实现的,以及如何评估embedding的效果好不好?
2383 字
|
12 分钟