研究人员称他们以约 1,500 美元的成本从零开始训练了一个基础模型
- Sapient 的研究人员开发了一个名为 HRM-Text 的 10 亿参数推理模型,其从零开始的训练成本约为 1,500 美元。
- 该模型在 400 亿个 token 上进行了训练,并达到了与 20 亿至 70 亿参数量的大模型具有竞争力的性能水平。
- 这一突破表明,基础预训练不再是富裕机构的专属,小型组织也能以可承受的成本构建能力强大的推理模型。
- 该方法专注于培养深层的逻辑和语言理解能力,而非死记硬背,使得模型能够与外部知识库相结合,应用于实际场景。
来源与引用
1 个来源更多故事
新一代技术先锋正在构建下一阶段 AI 的基础设施 - Northlines
• 6月10日,世界经济论坛公布了2026年度“技术先锋”(Technology Pioneers)名单,从23个不同国家中选出了100家初创企业。 • 该群体专注于开发旨在变革全球产业和社会的突破性技术,特别是为下一阶段的 AI 构建基础设施。
阅读原文 · thenorthlines.com
Northlines网络安全研究人员对 Anthropic 旗下 Fable 的防护机制表示不满
• 网络安全研究人员正在批评 Anthropic 的新 AI 模型 Fable,称其安全防护机制过于严格,无法满足实际的网络安全应用需求。 • 这些限制与此前为防止生物武器开发而对生物相关查询实施的限制类似。
阅读原文 · techcrunch.com
TechCrunchTechCrunch 与 VivaTech 合作,重点关注企业级 AI 初创公司
• TechCrunch 宣布与 VivaTech 2026 建立战略合作伙伴关系,旨在发掘并重点推介具有潜力的欧洲企业级 AI 初创公司。 • 此次合作旨在通过为选定的创始人提供展示创新成果的平台,来缩小巴黎与旧金山之间的差距。
阅读原文 · mezha.net
MezhaOpenAI 表示,一项涉嫌与中国相关的影响力行动试图影响关于美国数据中心的讨论
• OpenAI 发现了一项涉嫌与中国相关的影响力行动,该行动试图操纵有关美国数据中心建设的公众议论。 • 该活动旨在利用并放大社区中现有的焦虑,特别是关于能源价格上涨以及这些设施对当地环境或社会影响的担忧。
阅读原文 · businessinsider.comOpenAI 表示中国发起影响活动以塑造美国对 AI 数据中心的态度
• OpenAI 报告称,中国发起了一场协调一致的影响活动,旨在塑造美国公众对 AI 数据中心开发相关问题的态度。 • 该活动针对的是犹他州一个特定的规模化 AI 数据中心项目,在该项目 5 月宣布后,出现了一波虚假信息。
阅读原文 · politico.comIGIC 2026:印度必须押注于简约创新和垂直 AI,而非基础模型
• 由 Smadja & Smadja Strategic Advisory 组织的 IGIC 2026 峰会汇集了政策制定者、投资者和技术专家,旨在确定印度在人工智能领域的战略方向。 • 专家认为,印度应优先考虑“简约创新”(frugal innovation)和垂直 AI(针对特定行业的专业应用),而不是试图与庞大的通用基础模型竞争。
阅读原文 · news.webindia123.com网络安全公司称,北京正升级 AI 间谍活动以在技术上追赶美国
• 网络安全公司 CrowdStrike 报告称,在中国境内的实体对针对科技公司内 AI 资产的所有国家级网络攻击承担了超过一半的责任。 • 这些间谍活动旨在绕过美国对 AI 训练芯片的限制,以加速北京自身的技术开发并降低运营成本。
阅读原文 · cnbc.comAI 炒作成为网络犯罪的最新武器 - Digital Journal
• Microsoft 报告称,利用热门 AI 品牌炒作来欺骗用户的社会工程学攻击活动有所增加。 • 威胁者将恶意文件、链接和消息伪装成合法的 AI 工具更新或访问请求,以入侵系统。
阅读原文 · digitaljournal.com
Digital Journal定义 AI 将如何变革欧洲零售业的 10 个转变
• 预计在未来五年中,人工智能将为欧洲零售业创造 2400 亿至 3200 亿欧元的经济价值。 • 这一变革将由零售商在集成 AI 以优化运营和客户体验方面的十个关键转变所驱动。
阅读原文 · esmmagazine.com
ESM MagazineGDI 2026年欧洲会议 - 首批确认演讲嘉宾 - Global Dating Insights
• Global Dating Insights (GDI) 宣布了其 2026 年欧洲会议的首批确认演讲嘉宾,包括来自 Happn、Mattr、Inner Circle 和 InSparx 的代表。 • 该活动计划于 2026 年 9 月 16 日(星期三)举行,地点设在泰晤士河畔的五星级 Harbour Hotel Richmond。
阅读原文 · globaldatinginsights.com欧洲最大科技公司 ASML 首席执行官直言不讳地告知欧盟:既然你们自己都没有,为什么要干预?- The Times of India
• ASML 首席执行官 Christophe Fouquet 批评了欧盟对技术独立性的激进追求,质疑干预全球半导体供应链的逻辑。 • Fouquet 认为,欧盟缺乏支持这一立场的必要基础设施,为布鲁塞尔的决策者提供了一次“直率的现实审视”。
阅读原文 · timesofindia.indiatimes.com

