加州大学圣迭戈分校研究称先进 AI 可通过经典图灵测试

- 加州大学圣迭戈分校的研究人员表示,一个现代 AI 系统通过了一项严格的三方图灵测试,其中 GPT-4.5 在实时聊天中被判定为人类的概率为 73%。
- 研究发现,LLaMa-3.1-405B 被判定为人类的概率为 56%,而基准系统 ELIZA 和 GPT-4o 被选中的概率分别仅为 23% 和 21% 左右。
- 第一作者 Cameron Jones 表示,正确的“人格(persona)”提示词能让模型展现出“语气、直率、幽默感和易错性”,这引发了关于欺骗、信任以及人们如何在网上判断 AI 的问题。
- 研究人员指出,如果没有人格提示,AI 的表现会大幅下降,这使得该结果成为未来安全性、检测以及人机交互工作的重要基准。
来源与引用
1 个来源更多故事
美国政策研究中心发布关于确保 AI agent 安全以扩大采用的提案
• America First Policy Institute 发布了一个政策页面,主张美国政府应通过加强安全标准和发布更清晰的指南来加速 AI agent 的采用。 • 该备忘录指出,各机构应推广“安全设计”(secure-by-design)开发,以便在不增加运行风险的情况下更广泛地使用 AI agent。
阅读原文 · americafirstpolicy.comTech Buzz 通讯聚焦 AI 基础设施与文档解析工具
• Tech Buzz 通讯发布了一篇关于 AI 工具和文档工作流的文章,其中重点提及了作为智能体文档解析引擎的 LlamaParse。 • 文章指出,该产品旨在为 AI 应用和工作流可靠地提取复杂信息,反映了市场对于帮助模型处理企业级文档的基础设施的需求。
阅读原文 · techbuzz.aiAI时事通讯汇总聚焦监控摄像头、AI眼镜光学元件及内存供应压力
• The Tech Buzz 的最新时事通讯汇总重点介绍了几个与美国相关的 AI 进展,包括纽约州特洛伊市的 AI 车牌识别摄像头、AI 眼镜的光学升级以及 AI 内存供应短缺问题。 • 该摘要还提到 AI 用于转录急诊就诊记录、CFTC 利用 AI 帮助检测内幕交易,以及 arXiv 禁用“纯 AI”论文,这些都预示着更广泛的政策和工作流程转变。
阅读原文 · techbuzz.ai无法从提供的搜索结果中返回经过验证的技术类新闻文章
• 提供的搜索结果中没有包含足够且可验证的、过去24小时内来自美国的科技新闻文章,无法安全地汇总成一份前10名列表。 • 可用链接仅限于非主流或汇总风格的页面,且这些 URL 无法被独立验证为适用于此次请求的主要新闻文章页面。
阅读原文 · openai.comOpenAI 为关键防御者推出 Daybreak 网络安全平台
• 根据 2026 年 5 月 15 日发布的一份 AI 新闻汇总,OpenAI 推出了 Daybreak,这是一个基于 GPT-5.5 和 Codex Security 构建的新型网络安全平台。 • 该平台旨在帮助组织识别威胁、生成补丁并验证代码与系统的修复情况,目前访问权限仅限于“关键网络防御者”。
阅读原文 · ai2roi.substack.com
AI to ROISublime Security 入选 Notable Capital 的 2026 年“网络安全新星”名单
• 总部位于华盛顿的 Sublime Security 在 2026 年 5 月 15 日表示,公司入选了 Notable Capital 的 2026 年“网络安全新星”(Rising in Cyber 2026)名单,该名单每年评选 30 家最具有前景的私有网络安全初创公司。 • 该公司表示,根据 PitchBook 的数据,这一批入选公司累计融资超过 69 亿美元,凸显了投资者对安全初创公司的巨大兴趣。
阅读原文 · prnewswire.com中国机器人初创公司 Linkerbot 完成 B+ 轮融资,估值达 30 亿美元
• 根据路透社关于该公司在工业机器人领域扩张的报道,中国机器人初创公司 Linkerbot 已完成 B+ 轮融资,估值达到 30 亿美元。 • 本轮融资反映出投资者对亚洲先进机器人解决方案的浓厚兴趣,在该地区,制造自动化和工业 AI 应用正驱动大量风险资本的部署。
阅读原文 · reuters.comGoogle 在 Android 上推出 Gemini Intelligence,打造个性化且主动的设备体验
• Google 推出了 Gemini Intelligence,这是一种全新的 AI 驱动体验,旨在让 Android 设备变得更智能、更主动,并为用户提供深度个性化服务。 • 这一新功能将 Google 的先进 AI 模型直接集成到 Android 设备中,从而在整个操作系统中实现增强的上下文感知和预测功能。
阅读原文 · ai.economictimes.com2026年第一季度AI风险投资额达到2420亿美元,占据全球投资额的80%
• 2026年第一季度,全球风险投资额创下纪录,约6,000家初创公司共获得3,000亿美元投资,环比和同比均增长150%。 • AI融资占据主导地位,金额达2,420亿美元,占总风险投资额的80%(2025年第一季度为55%),资金集中在前沿模型构建者、企业软件、机器人、半导体和生命科学领域。
阅读原文 · blockchain-council.org
Blockchain Council面对更快速、更复杂的威胁,2026年网络安全格局加速演变
• 2026年的网络安全挑战已发生根本性转变,从孤立的漏洞入侵演变为一场持续的军备竞赛,组织必须跟上比以往任何时候都更快速且更复杂的威胁步伐。 • 近期进展包括 Microsoft Teams Canvas 的创新、CISA 指南的更新、Anthropic 用于网络漏洞测试的 Mythos AI 项目,以及旨在满足企业需求的新兴安全合作伙伴关系。
阅读原文 · hipther.com
HiptherAnthropic 启动 Project Glasswing,联手科技巨头测试 Mythos AI 的网络漏洞
• Anthropic PBC 周二宣布启动 Project Glasswing,允许 Amazon、Apple、Microsoft、Cisco 等公司访问其尚未发布的 Mythos AI 模型,以便在广泛发布前识别产品缺陷。 • 该计划旨在通过参与者与行业同行分享发现的结果,来减轻由先进 AI 系统引发的潜在网络攻击风险。
阅读原文 · moniquemalcolmhay.substack.com