Anthropicの最新モデルClaude Opus 4.7には、他のどのモデルにもないeffortレベルが存在する。それがxhighだ。
この記事では、公式ドキュメントから読み取れるxhighの正体と、なぜOpus 4.7にだけ存在するのかを整理する。
Opus 4.7が対応するeffortレベルは5段階。そのうちxhighだけがOpus 4.7専用:
| レベル | 概要 | 対応モデル |
|---|---|---|
max | 究極の能力 | Opus 4.7, 4.6, Sonnet 4.6, Mythos |
| xhigh ★ | 長時間エージェント専用 | Opus 4.7のみ |
high | デフォルト(省略と同等) | 全対応モデル |
medium | バランス型 | 全対応モデル |
low | 最速・最安価 | 全対応モデル |
公式ドキュメントの説明は簡潔だ:
つまり:
maxとは異なる最適化がかかっているここが重要。maxは「今のこの一回の回答に全力を出す」ためのレベル。一方xhighは「長時間走り続けるエージェントの全体を最適化する」ためのレベルだ。
単一タスクで最高性能。トークン制約なし。短〜中時間の複雑な推論に。
長時間エージェント向け。何度もツール呼び出しを繰り返す30分以上のセッションで、全体を通した最適化。
理由は2つあると推測できる:
Opus 4.7は新しいトークナイザーを採用している。1Mトークンのコンテキストウィンドウに対して、従来より効率的なトークン化が可能だ。この効率性が、数百万トークンを消費する長時間タスクを現実的なコストで実行する基盤になっている。
Opus 4.7はbudget_tokensによる手動思考制御を完全に廃止し、Adaptive Thinkingのみを受け付ける。xhighはこのAdaptive Thinkingと組み合わせることで、「長時間走る中で必要な時に必要なだけ考える」という動的な最適化を実現している可能性が高い。
{
"model": "claude-opus-4-7",
"max_tokens": 16000,
"thinking": { "type": "adaptive" },
"effort": "xhigh",
"messages": [
{ "role": "user", "content": "このコードベース全体をリファクタリングして..." }
]
}
ポイントはthinkingをadaptiveに設定すること。Opus 4.7ではこれが必須で、手動のbudget_tokensは400エラーになる。
Opus 4.7は入力$5/MTok、出力$25/MTok。xhighで数百万トークンを使うと、1回のセッションで数ドル〜数十ドルになり得る。しかし、これが人間のエンジニア数時間分の作業を代替するなら、十分に合理的だ。
xhighは「AIが一生懸命考える」以上の意味を持っている。長時間自律的に動き続けるエージェントという、まさに2026年のAI開発の主戦場に向けた専用チューニングだ。
Opus 4.7だけに用意されたこのレベルは、Anthropicが「エージェントの長時間実行」を最優先課題と捉えていることの表れでもある。今後、他のモデルにもxhighが広がるのか、それともOpus 4.7の専用機能として棲み分けるのか——要注目だ。
参照: Anthropic Effort Documentation · Models Overview · Adaptive Thinking