美团发布完全基于中国芯片训练的新AI模型 —— The Information
• 中国外卖巨头美团推出了 LongCat-2.0,这是一个拥有 1.6 万亿参数的新开源大语言模型。 • 该公司声称,这是首个在规模上达到此量级且全过程(包括全量训练和推理)均完全使用中国国产芯片集群完成的模型。 • 这一进展意义重大,因为它证明了中国在面临高端半导体国际限制的情况下,依然具备构建大规模 AI 模型的能力。
theinformation.com探索中心
Comprehensive coverage and timeline for Model Trained. Aggregated from 3 sources with 3 articles.
3 篇文章 · 3 个来源 · 自 6/11/2026 起的报道
Model Trained 报道随时间的发展情况。
经常与 Model Trained 一起报道的话题。
• 中国外卖巨头美团推出了 LongCat-2.0,这是一个拥有 1.6 万亿参数的新开源大语言模型。 • 该公司声称,这是首个在规模上达到此量级且全过程(包括全量训练和推理)均完全使用中国国产芯片集群完成的模型。 • 这一进展意义重大,因为它证明了中国在面临高端半导体国际限制的情况下,依然具备构建大规模 AI 模型的能力。
theinformation.com
图片:CNA• 美团推出了 LongCat-2.0,这是一款新的大语言模型,该公司声称其性能与 Google 2 月份发布的 Gemini 3.1 Pro 相当。 • 该模型使用中国国产芯片训练,标志着中国在减少对美国硬件依赖方面的努力迈出了重要一步。 • 这一进展是对华盛顿基于安全理由限制向中国出口先进芯片的直接回应。
channelnewsasia.com• Sapient 的研究人员开发了一个名为 HRM-Text 的 10 亿参数推理模型,其从零开始的训练成本约为 1,500 美元。 • 该模型在 400 亿个 token 上进行了训练,并达到了与 20 亿至 70 亿参数量的大模型具有竞争力的性能水平。 • 这一突破表明,基础预训练不再是富裕机构的专属,小型组织也能以可承受的成本构建能力强大的推理模型。
venturebeat.com