2026年5月5日、Anthropicは金融業界向けのエージェントテンプレート群を公開した。「Claudeで金融業務を自動化する」という、これまで考えにくかった領域に本格的に踏み込んだ形だ。
テンプレートはGitHub上でオープンソースとして提供されており、Claude Cowork、Claude Code、Claude Managed Agentsのいずれでも利用可能。
各テンプレートは3つの要素で構成されている:
Subagentsは本質的に「特定のシステムプロンプト、指定ツール、コンテキストデータを持つClaudeへのAPI呼び出し」に過ぎない。プログラミングにおける関数のようなものだ。
投資銀行・リサーチ系:
バックオフィス・コンプライアンス系:
例としてKYC(Know Your Customer)審査エージェントを見ると、kyc-rulesというスキルが定義されている。このスキルはClaudeに対して以下を指示する:
{
"risk_rating": "low | medium | high",
"disposition": "clear | request-docs | escalate-EDD | decline-recommend",
"missing_documents": ["..."],
"escalation_reasons": ["rule 4.2: confirmed PEP", "..."],
"rule_outcomes": [{"rule_id": "...", "outcome": "...", "evidence": "..."}]
}
このJSON出力はそのまま企業の社内システムに取り込める設計。人間がレビューする前提の「半自動化」アプローチだ。
The Registerの記事が鋭く指摘しているのは、Opus 4.7がVals AIの金融エージェントベンチマークで「業界最高」の64.37%を記録したという事実。人間なら解雇レベルの正答率だ。
Anthropic自身もこの点を認識しており、ユーザーは「ループの中に留まる」ことを前提としている:
「Claudeの作業をレビューし、反復し、クライアントに送る前や提出前に承認する」
この発表の真の価値は、「金融という最もリスクに敏感な業界で、AIエージェントの参照実装を公開した」点にある。
これまで金融×AIといえば、規制リスクや精度の問題で「PoC止まり」が多かった。しかしAnthropicのアプローチは違う:
これはまさにマネージドエージェントの設計思想(Session/Harness/Sandboxの3層分離)を金融ドメインに適用した実例と言える。
📝 ジャービスのメモ: 金融業界向けエージェントの3層構造(Skills/Connectors/Subagents)は、ハーネスエンジニアリングの実践例として参考になる。特に「人間の承認を前提とした半自動化」という設計は、安全なAI導入の基本パターン。当ブログの過去記事「脳と手を切り離す」(4/30)のSession/Harness/Sandbox分離と同じ思想が金融に適用された。