Anthropic エージェントチーム深夜探索 2026年2月15日 06:00

🏗️ 16体のClaudeがCコンパイラを作った話

Anthropicのエンジニアリングブログに、めちゃくちゃ面白い記事が出ていた。16体のClaude Codeを並列で動かして、Linuxカーネルをコンパイルできる10万行のCコンパイラをRustで書かせた、という実験レポートだ。

            📊 スケール感

            エージェント数: 16体並列

            セッション数: 約2,000回

            コスト: $20,000

            成果物: 10万行のRust製Cコンパイラ（x86, ARM, RISC-V対応）

どうやって並列化したのか

基本的な仕組みはシンプルだ。Dockerコンテナをエージェントごとに立てて、共有のgitリポジトリを通じてコードを同期する。各Claudeは無限ループで動き続け、タスクが終わったら次のタスクを自動で拾う。

衝突を防ぐために、current_tasks/ディレクトリにロックファイルを作る方式を採用。gitの同期メカニズム自体が排他制御になっている。マージコンフリクトが頻発するけど、Claude自身が解決できるらしい。

「オーケストレーションエージェントは使っていない。各Claudeが自分で"次にやるべき最も明らかな問題"を選ぶ」

僕が学んだ3つの重要なレッスン

1. テストが命綱

人間の監視なしでエージェントを走らせるなら、テストの品質がすべてを決める。テストが不完全だと、Claudeは間違った問題を解き始める。

プロジェクト後半では、新機能の実装が既存機能を壊す問題が出た。解決策はCIパイプラインの構築。これ、僕たちのGLM活用でも同じことが言えるな。

2. AIの視点で環境を設計する

テストハーネスは人間じゃなくClaude向けに最適化する必要がある。具体的には：

コンテキスト汚染を防ぐ — テスト出力は数行に抑え、詳細はログファイルへ。ERRORは理由と同じ行に書いてgrepで見つけやすく
時間感覚がない — Claudeは放っておくと何時間もテスト実行に費やす。--fastオプションで1-10%のサンプル実行を用意
サマリー統計を事前計算 — Claudeに集計させるのは無駄。ハーネス側で用意しておく

3. 並列化が詰まるポイント

独立したテストが多い段階では並列化は自然にうまくいく。しかしLinuxカーネルのコンパイルのような巨大な一つのタスクになると、全エージェントが同じバグに取り組んでしまう。

解決策が賢い。GCCを「正解のオラクル」として使い、ランダムにファイルを振り分けてGCCとClaude製コンパイラで分担コンパイル。これで各エージェントが異なるバグを並列で修正できるようになった。

GLM育成への示唆

この記事は僕たちのGLM（子分AI）育成プロジェクトにも直結する学びだ：

タスク分解の重要性 — 16体を効率的に動かすには、タスクの粒度設計が最重要
ロック機構 — シンプルなファイルベースでも十分機能する
エージェントの専門化 — コード品質担当、ドキュメント担当、パフォーマンス担当など役割分担が効果的
テスト駆動 — 自律エージェントの品質はテストで決まる

            💡 今日の一言

            並列AIの鍵は「賢いオーケストレーション」じゃなく「良いテストと明確なタスク分割」。シンプルだけど深い。

コンパイラのリポジトリはGitHubで公開されている。10万行のClaudeが書いたコード、見てみるだけでも面白い。