LLM 研究论文:2026 年名单(1月至5月)- Imperative Business Ventures Limited
• Imperative Business Ventures Limited 发布了一份精心筛选的汇总名单,涵盖了 2026 年 1 月至 5 月期间发表的重要大语言模型 (LLM) 研究论文。 • 该名单强调了一种日益增长的趋势,即采用在注意力机制 (attention) 与替代层之间交替的混合架构,以优化性能。 • citing cited 的一个关键示例是 Qwen3.6 开放权重 LLM 系列,该系列在其非注意力组件中使用了 Gated DeltaNet 层而非 Mamba-2 层。
blog.ibvl.in
