LLM 研究論文:2026 年名單(1 月至 5 月)- Imperative Business Ventures Limited
• Imperative Business Ventures Limited 發佈了一份精選彙編,收錄了 2026 年 1 月至 5 月期間發表的知名大型語言模型 (LLM) 研究論文。 • 該名單強調了一種日益增長的趨勢,即採用在 Attention 層與替代層之間交替的混合架構,以優化性能。 • cited 的一個關鍵範例是 Qwen3.6 開源權重 LLM 系列,其非 Attention 組件使用了 Gated DeltaNet 層而非 Mamba-2 層。
blog.ibvl.in
