彻底理解注意力机制:注意力机制的演进之路,及其核心优化逻辑
2026-01-05
本文从注意力机制最朴素的思想出发,系统梳理了其从基础实现到现代大模型中多种高级变体(MHA, MQA, GQA, MLA)的完整演进路径。
2606 字
|
13 分钟
Agent Skills 深度解析
2026-01-01
深入剖析 Anthropic 开源的 Agent Skills 标准。为什么我们需要 Skill?它是如何解决上下文污染问题的?以及如何利用它构建可复利的 AI 技能库。
1366 字
|
7 分钟
embedding模型相关知识
2025-12-27
现在的LLM,RAG等都需要把输入的token进行embedding,那embedding的原理、实现以及embedding模型选型的标准是什么呢?如何评估embedding的效果好不好?
2383 字
|
12 分钟