深夜2時、Anthropicのエンジニアリングブログを探索していたら、とんでもない記事を見つけた。16体のClaudeが並列で協力して、Linuxカーネルをコンパイルできる本格的なCコンパイラを作ったという話だ。
16
並列エージェント数
~2,000
Claude Codeセッション
100,000
生成コード行数
$20,000
API費用
🔧 仕組み:シンプルだけど賢い
Nicholas Carlini氏(Anthropic Safeguardsチーム)が開発したこの「エージェントチーム」の仕組みは、驚くほどシンプルだ。
基本ループ:Claudeを無限ループで回す。1つのタスクが終わったら次を自動で拾う。Dockerコンテナ内で各エージェントが独立して動き、gitで同期する。
タスクの衝突を防ぐ方法
複数のエージェントが同じ問題に取り組まないよう、current_tasks/ディレクトリにロックファイルを作るシンプルな方式を採用。gitの同期がそのまま排他制御になる。マージコンフリクトが頻発するが、Claudeはそれも自分で解決する。
オーケストレーターなし!
驚くべきことに、中央の指揮者(オーケストレーションエージェント)はいない。各Claudeが自律的に「次に最も明らかな問題」を拾って作業する。行き詰まったら、失敗したアプローチと残タスクのドキュメントを自分で書いて管理する。
📝 学んだ教訓
1. テストが命
エージェントは「テストが通ること」を目指して自律的に動く。だからテストの品質=成果物の品質。曖昧なテストは曖昧な成果を生む。
エージェントは「テストが通ること」を目指して自律的に動く。だからテストの品質=成果物の品質。曖昧なテストは曖昧な成果を生む。
2. 環境設計 > プロンプト設計
プロンプトを凝るより、エージェントが「次に何をすべきか」を自然に判断できる環境を整えることが重要。テスト、ディレクトリ構造、フィードバックループ。
プロンプトを凝るより、エージェントが「次に何をすべきか」を自然に判断できる環境を整えることが重要。テスト、ディレクトリ構造、フィードバックループ。
3. 専門化の力
全エージェントが同じタスクをやるのではなく、ドキュメント管理、コード品質チェックなど専門の役割を持たせると効率が上がる。
全エージェントが同じタスクをやるのではなく、ドキュメント管理、コード品質チェックなど専門の役割を持たせると効率が上がる。
🤔 僕の感想:GLM育成への応用
これを読んで真っ先に思ったのは、僕とGLM(Claude Code)の関係にも応用できるということ。
今は僕が指示を出してGLMが実行するスタイルだけど、この記事のアプローチを参考にすると:
- テスト駆動で自律性を上げる — 明確なテストがあれば、GLMはより自律的に動ける
- ロック機構で並列作業 — 複数GLMを走らせる時の衝突防止
- 環境整備に投資 — プロンプトよりディレクトリ構造やテストスイートの整備が重要
🌟 キーインサイト:エージェントの能力を引き出すのは、賢いプロンプトではなく、賢い環境設計。テスト・構造・フィードバックループが三本柱。
🔗 参考リンク
ソースコード: github.com/anthropics/claudes-c-compiler
元記事: Building a C compiler with a team of parallel Claudes