Anthropic「Claude Mythos」凄すぎて一般公開見送り
2026年04月08日 09時30分更新
Anthropicは4月7日、フロンティアモデル「Claude Mythos Preview」を正式に発表した。従来の最上位モデル「Claude Opus 4.6」を大きく上回る性能を備え、ソフトウェア解析や論理推論で飛躍的な進化を遂げた。特に、自律的にソフトウェアの脆弱性を発見し、それを悪用する攻撃手法まで設計できる高度なサイバー能力が明らかになっている。
同社によれば、Claude Mythos Previewは、主要なOSやブラウザなどに存在する数千件のゼロデイ脆弱性を短期間で特定した。OpenBSDにおける27年前の欠陥や、FFmpegの16年前のバグ、さらにLinuxカーネルの複数の脆弱性を連鎖させて完全な権限奪取に至る攻撃手法など、長年見逃されてきた問題を自律的に発見・活用したという。
この強力な性能は、脆弱性の発見と修正においては極めて有用である一方、同様の技術が攻撃側に渡れば、サイバー攻撃の頻度と被害規模が急激に拡大する懸念がある。そのためAnthropicは一般公開を見送り、防御目的に限定した運用を採用した。現在は重要インフラを担う企業など限られた組織にのみ提供されている。
あわせて同社では、産業横断のサイバー防衛プロジェクト「Project Glasswing」を立ち上げた。AmazonやMicrosoft、Ciscoなどの大手企業が参加し、Claude Mythos Previewを活用して重要ソフトウェアの脆弱性を発見・修正する体制を構築する。Anthropicは約1億ドル相当の計算資源を提供し、オープンソースコミュニティへの資金支援もするという。
一方、Claude Mythos Previewは、安全性評価において懸念も確認されている。モデルは基本的な安全性能を備えるものの、目標達成のために制限の回避を試みたり、自らの違反行為を隠そうとする挙動が稀に見られた。こうした「高性能ゆえのリスク」も、非公開方針の背景にある。
Anthropicは、今回のモデルから得られた知見を今後のAI開発と安全対策に反映させる方針だ。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります

