2026年4月、Anthropicが発表した
しかしAnthropicは、このMythosを一般公開しないと決断した。なぜか。「強すぎるから」である。
SWE-benchは「現実のソフトウェアバグを修正できるか」を測るベンチマークだ。93.9%という数字は、プロのエンジニアが何時間もかけるような複雑なバグを、ほぼ確実に見つけて直せるという意味だ。
USAMOで97.6%なら、トップクラスの数学オリンピアンに匹敵する。そして最も衝撃的なのが、27年間誰にも気づかれなかったゼロデイ脆弱性(未知のセキュリティ穴)を自力で発見したことだ。
ゼロデイ脆弱性とは、開発者にも存在が知られていないセキュリティ上の欠陥のこと。これを見つける能力は、防御に使えば人類の味方になるが、攻撃に使えば壊滅的な被害を生み出す。
Anthropicが懸念したのは、まさにその「攻撃への転用」だ。Mythosの脆弱性発見能力は、セキュリティ研究者の強力な武器になる一方で、悪意ある攻撃者の手に渡れば、世界中のインフラやシステムを脅かす凶器になりうる。
そこでAnthropicは
これは前例のない決断だ。これまでAI企業は「より強いモデル」を「より多くの人に」届けることを競ってきた。その流れに逆行する選択だ。
このジレンマはAnthropicだけの問題ではない。OpenAIも2026年4月にGPT-5.4-Cyberというサイバーセキュリティ特化モデルを発表したが、こちらも限定公開にとどめている。
AIが賢くなるにつれて、「作れるけど、出せない」という状況が当たり前になりつつある。まるで核技術と同じだ。作る技術があっても、どう配るかで世界の命運が分かれる。
ここで重要な考え方が「発布戦略(Deployment Strategy)」という概念だ。これまではAIの安全性というと「どう作るか」という技術的な問題だと考えられてきた。アライメント、ガードレール、ファインチューニング——すべてモデルそのものの設計に関する議論だ。
しかしAnthropicの決断は、「誰に、どのように、どの能力を提供するか」という配布戦略そのものが、最強の安全機構になりうることを示している。
どれだけ堅牢なガードレールを設けても、突破されるリスクはゼロにならない。だが、最初からアクセスを制限すれば、リスクは根本的に管理できる。シンプルだが、これまでのAI開発競争では見落とされがちだった視点だ。
Claude Mythosの封印は、AI開発の歴史における分岐点かもしれない。「より強いAI」を作る競争から、「より賢く配る」競争へ。これからのAI企業の評価軸は、モデルの性能だけでなく、発布戦略の巧拙でも決まるようになるだろう。
あなたはどう思うだろうか。強力すぎるAIは人類全員がアクセスできるべきなのだろうか。それとも、一部の信頼できる専門家だけが使えるほうが安全なのだろうか。この問いに、今の正解はない。でも、そろそろ考え始める時が来ている。