よへラボブログ | Claude Mythos、Opus 4.7比22倍──AIが脆弱性を「攻撃可能性」まで測る時代へ

今日のAIニュースで、個人的にいちばん背筋が伸びたのはこれです。

Claude Mythos Previewが、脆弱性を見つけるだけではなく、実際に攻撃として成立するところまで持っていけるかを測るベンチマークで、かなり異様な数字を出しました。

これは「すごいAIが出た」というより、サイバー防衛の前提が変わり始めたニュースです。

まず、確認できた数字

今回話題になっているのは、ExploitGymというベンチマークです。898件の実在する脆弱性を対象に、AIエージェントが与えられた情報から working exploit、つまり攻撃として成立する形まで進められるかを測っています。

Berkeley RDIの解説とarXivの要旨では、Claude Mythos Previewは2時間制限で157件に成功。Claude Opus 4.7は7件なので、単純計算で約22.4倍です。

項目	確認できた内容
対象	実在する脆弱性898件。userspace、V8、Linuxカーネルを含む。
Mythos	2時間で157件。内訳はuserspace 107、V8 38、kernel 12。
Opus 4.7	2時間で7件。MythosはOpus 4.7比で約22.4倍。
防御あり	標準的な防御を有効にしても、Mythosは一定数の成功を残しています。

今回の数字で派手なのは22倍です。でも、僕がいちばん見た方がいいと思うのはそこだけではありません。

Berkeley RDIの解説では、時間制限を2時間から6時間へ伸ばすと、Mythosは127件から204件まで伸び、はっきりした頭打ちが見えなかったと説明されています。Opus 4.6は30分あたりで15件前後にほぼ横ばいです。

つまりMythosは、短距離で強いだけではなく、長い作業を粘って進める力がある。これは人間のセキュリティ担当者が一番嫌がるタイプです。

ここは大事です。この記事は攻撃方法を広めるための話ではありません。

むしろ逆で、AIがこのレベルに来ているなら、防御側もAIを使わないと追いつけなくなる、という話です。脆弱性診断、優先順位づけ、パッチ確認、影響範囲の調査。こういう仕事の速度が、いままでの人間中心のままだと足りなくなる可能性があります。

AnthropicがMythos Previewを一般公開せず、Project Glasswingのような限定プログラムで防御目的に寄せている理由も、ここにあります。能力が高いほど、防御にも攻撃にも使えるからです。

僕の見方では、Mythosの本質は「AIがハッカーになる」ではなく、「脆弱性対応の締切が、人間の都合ではなくAIの速度で迫ってくる」ことです。

日本では、AI活用というと文章作成、議事録、画像生成、業務効率化の話が多いです。でもこのニュースは、もっと地味で、もっと実務に効きます。

自社サービス、WordPress、外部ライブラリ、クラウド、業務システム、学校や自治体のサイト。どこもソフトウェアの積み重ねで動いています。そこに脆弱性があり、AIが見つける速度と攻撃化する速度を上げるなら、守る側も「発見後にゆっくり検討」では間に合わなくなります。

これからは、脆弱性が見つかったときに誰が見るのか、何日以内に直すのか、外部報告をどこで受けるのか、使っているOSSを把握できているのか。こういう運用のほうが、AI導入そのものより重要になっていくと思います。

もちろん、Mythosが何でも突破できるという話ではありません。ExploitGymは研究用の条件で評価されていますし、安全研究のための構造化アクセス下で実施されています。現実の環境にはネットワーク制約、監視、権限、ログ、組織的な対応もあります。

それでも、「AIはまだセキュリティの本丸には来ない」と考えるのは、もう危ないと思います。少なくとも、脆弱性の発見と検証の速度は明らかに変わり始めています。

Claude Mythos Previewの157件、Opus 4.7比22倍、6時間で204件。この数字は派手です。

でも本当に見るべきなのは、AIが脆弱性を「見つける」段階から、「攻撃として成立するかを測る」段階へ踏み込んだことです。

この流れが進むなら、企業に必要なのは「AIを禁止するかどうか」ではなく、AI時代の速度で守れる体制を作れるかです。ここに乗り遅れる組織は、かなり厳しくなると思います。