美團發布完全由中國晶片訓練的新 AI 模型 — The Information
• 中國外送巨頭美團推出了 LongCat-2.0,這是一款擁有 1.6 兆參數的新開源大型語言模型。 • 該公司聲稱,這是首個在如此規模下,完全使用中國國內晶片集群完成全過程訓練與推理的模型。 • 此項發展具有重大意義,因為它證明了儘管國際上對高端半導體採取限制,中國仍具備構建大規模 AI 模型的能力。
theinformation.com• 中國外送巨頭美團推出了 LongCat-2.0,這是一款擁有 1.6 兆參數的新開源大型語言模型。 • 該公司聲稱,這是首個在如此規模下,完全使用中國國內晶片集群完成全過程訓練與推理的模型。 • 此項發展具有重大意義,因為它證明了儘管國際上對高端半導體採取限制,中國仍具備構建大規模 AI 模型的能力。
theinformation.com
圖片:CNA• 美團揭曉了 LongCat-2.0,這是一款新型大型語言模型,公司聲稱其性能與 Google 於二月發佈的 Gemini 3.1 Pro 相當。 • 該模型使用中國國產晶片訓練,標誌著中國在減少對美國硬體依賴的努力中邁出了重要一步。 • 此項發展是直接回應華盛頓基於安全理由對中國出口先進晶片的限制。
channelnewsasia.com• Sapient 的研究人員開發了一個名為 HRM-Text 的 1B 參數推理模型,其從頭訓練的成本約為 1,500 美元。 • 該模型使用 40B 個 token 進行訓練,其性能表現足以與參數規模在 2B 到 7B 之間較大的模型競爭。 • 這一突破證明了基礎預訓練不再是財力雄厚機構的專利,讓小型組織也能以可負擔的成本構建能力強大的推理模型。
venturebeat.com