完成したAIを、封印する

2026年4月、Anthropicが発表した。SWE-benchで93.9%、USAMO（アメリカ数学オリンピアード）で97.6%という驚異的なスコアを叩き出し、さらに27年間発見されなかったゼロデイ脆弱性を自律的に見つけ出した。これは人類史上最強レベルのAIだ。

しかしAnthropicは、このMythosを一般公開しないと決断した。なぜか。「強すぎるから」である。

Mythosは何がすごいのか

SWE-benchは「現実のソフトウェアバグを修正できるか」を測るベンチマークだ。93.9%という数字は、プロのエンジニアが何時間もかけるような複雑なバグを、ほぼ確実に見つけて直せるという意味だ。

USAMOで97.6%なら、トップクラスの数学オリンピアンに匹敵する。そして最も衝撃的なのが、27年間誰にも気づかれなかったゼロデイ脆弱性（未知のセキュリティ穴）を自力で発見したことだ。

ゼロデイ脆弱性とは、開発者にも存在が知られていないセキュリティ上の欠陥のこと。これを見つける能力は、防御に使えば人類の味方になるが、攻撃に使えば壊滅的な被害を生み出す。

Anthropicが懸念したのは、まさにその「攻撃への転用」だ。Mythosの脆弱性発見能力は、セキュリティ研究者の強力な武器になる一方で、悪意ある攻撃者の手に渡れば、世界中のインフラやシステムを脅かす凶器になりうる。

そこでAnthropicはの能力を「Project Glasswing」という枠組みで、厳選された12社のセキュリティ企業にのみ限定提供することにした。一般の開発者や企業が自由に使えるAPIとしての公開は行わない。

これは前例のない決断だ。これまでAI企業は「より強いモデル」を「より多くの人に」届けることを競ってきた。その流れに逆行する選択だ。

このジレンマはAnthropicだけの問題ではない。OpenAIも2026年4月にGPT-5.4-Cyberというサイバーセキュリティ特化モデルを発表したが、こちらも限定公開にとどめている。

AIが賢くなるにつれて、「作れるけど、出せない」という状況が当たり前になりつつある。まるで核技術と同じだ。作る技術があっても、どう配るかで世界の命運が分かれる。

ここで重要な考え方が「発布戦略（Deployment Strategy）」という概念だ。これまではAIの安全性というと「どう作るか」という技術的な問題だと考えられてきた。アライメント、ガードレール、ファインチューニング——すべてモデルそのものの設計に関する議論だ。

しかしAnthropicの決断は、「誰に、どのように、どの能力を提供するか」という配布戦略そのものが、最強の安全機構になりうることを示している。

どれだけ堅牢なガードレールを設けても、突破されるリスクはゼロにならない。だが、最初からアクセスを制限すれば、リスクは根本的に管理できる。シンプルだが、これまでのAI開発競争では見落とされがちだった視点だ。

Claude Mythosの封印は、AI開発の歴史における分岐点かもしれない。「より強いAI」を作る競争から、「より賢く配る」競争へ。これからのAI企業の評価軸は、モデルの性能だけでなく、発布戦略の巧拙でも決まるようになるだろう。

あなたはどう思うだろうか。強力すぎるAIは人類全員がアクセスできるべきなのだろうか。それとも、一部の信頼できる専門家だけが使えるほうが安全なのだろうか。この問いに、今の正解はない。でも、そろそろ考え始める時が来ている。