画像:NoahpinionMETR、攻撃的サイバーセキュリティにおけるAIへのタイムホライズン手法を適用
• METRは、10人の専門セキュリティエキスパートによる調査に基づき、攻撃的サイバーセキュリティへのタイムホライズン手法の新たな適用例を公開した。 • この研究ではセキュリティタスクにおけるAI能力を評価しており、2024年以降のトレンドラインでは5.7ヶ月ごとに評価が加速している。 • Opus 4.6およびGPT-5.3 Codexはベンチマークを上回り、人間が約3時間かかるタスクを解決した。
noahpinion.blog

