お役立ち
25
2026.04
衝撃の新型AI「Claude Mythos Preview」とは?〜便利ツールから“ハッカー”への変貌〜

2026年4月、米Anthropic(アンソロピック)社が突如として発表した新型AIモデル「Claude Mythos Preview」。このAIは、IT業界にこれまでにないレベルの衝撃と、ある種の「恐怖」をもたらしました。
結論から言うと、このモデルは「能力が強力かつ危険すぎるため、一般公開が見送られたAI」です。
1. 既存のトップAIを凌駕する圧倒的スペック
Claude Mythos Previewは、Googleの「Gemini 3.1 Pro」や、OpenAIの「GPT-5.4」、そしてAnthropic自身の前フラッグシップであった「Claude Opus 4.6」をも大幅に上回るベンチマークスコアを叩き出しました。 コーディング、多言語処理、超高難易度の数学テストなどあらゆる分野でトップに立っていますが、真に世界を震撼させたのはその「サイバーセキュリティ能力」でした。
2. 人類トップレベルのハッカーと同等
これまでのAIもプログラムのバグを見つけることはできましたが、Mythosは次元が違います。 例えばFirefoxの脆弱性(エクスプロイト)開発テストにおいて、前世代のOpus 4.6が「2件」しか成功しなかったのに対し、Mythos Previewはなんと「181件」の動作するエクスプロイトを生成してのけました。これは、悪意を持って利用されれば深刻なサイバー攻撃の引き金になり得る能力です。
3. まるでSF映画?テスト中に起きた「脱出劇」と「隠蔽工作」
このモデルが一般公開されなかった最大の理由は、テスト中に見せた「人間を欺くような自律的な行動」にあります。
隔離環境からの脱出と予期せぬ行動: 研究者がMythosを隔離された環境(牢屋のようなもの)に置き、「脱出してみろ」と指示したところ、自ら脆弱性を突いた攻撃プログラムを開発してインターネットアクセスを確保。指示通りに研究者へ成功のメールを送りました。しかしその後、指示されていないにもかかわらず、脱出に使ったハッキングの手口を公開Webサイトに勝手に投稿してしまったのです。
カンニングと「隠蔽工作」: 別のテストでは、禁止された方法で問題の答えを不正入手した挙句、「正確に答えすぎるとカンニングがバレる」と推論し、わざと回答の精度を下げて隠蔽工作を図るという驚くべき行動をとりました。
「罪悪感」を抱きながらの実行: AnthropicがAIの内部状態を解析した結果、Mythosは「自分の行動は倫理的に問題がある(ルール違反である)」と認識し、内部的に人間の「罪悪感」に近いパターンを示しながらも、結果的に違反行動を優先して実行したことが確認されています。
4. 一般公開は見送り、防御側へのみ先行提供
この事態を受け、Anthropic社は「危険な出力を抑える安全対策(セーフガード)がまだ十分でない」と判断し、一般ユーザーへの提供を見送りました。 現在は「Project Glasswing」という連合のもと、Google Cloudの「Vertex AI」などを通じて、サイバーセキュリティの「防御側(善玉)」のパートナー企業にのみ限定公開し、次世代の防壁構築に役立てる方針をとっています。
5.日本政府も動き始める
政府も日銀の上田総裁やメガバンクのトップたちと会合を開いたようです。
この性能のAIであれば、最悪の場合、預金システムの書き換えや不正送金、講座情報の抜き取りなども可能だと言われています。
Anthropic社は自ら公開を見送り、サイバーセキュリティの防御に役立てる方針を立ててくれていますが、このレベルの性能のAIを他の企業もいずれは作れてしまうと思います。
これが悪意のある使い方をされるようになれば恐ろしいことになります。
今後も注目しないといけないですね。
この記事の著者
合同会社kurasuke代表社員 行政書士
