이미지: NoahpinionMETR, 공격적 사이버 보안 AI에 타임 호라이즌 방법론 적용
• METR은 10명의 전문 보안 전문가와 함께 진행한 연구를 바탕으로, 공격적 사이버 보안 분야에 타임 호라이즌(time-horizon) 방법론을 적용한 새로운 결과를 발표했습니다. • 이번 연구는 보안 작업에서의 AI 역량을 평가하며, 2024년 이후 추세선 기준으로 5.7개월마다 평가 속도가 가속화되고 있음을 보여줍니다. • Opus 4.6 및 GPT-5.3 Codex는 벤치마크를 초과 달성하며, 인간이 해결하는 데 약 3시간이 소요되는 작업들을 해결했습니다.
noahpinion.blog

