これまでLLMを使うとき、私たちは「どれくらいの量を出力してほしいか」は指定できましたが、「どれくらい真剣に考えてほしいか」を細かく制御するのは難しかったです。
Claude Opus 4.7で導入されたEffortパラメータは、まさにこの「頑張り度」を5段階で指定できる仕組みです。人間でいうと「ざっくり答えて」から「徹夜でじっくり考えて」まで、AIの集中レベルを切り替えられるわけです。
従来のbudget_tokensによる手動思考予算の指定は廃止されました。Opus 4.7ではAdaptive Thinkingが唯一の思考モードで、budget_tokensを指定すると400エラーが返ります。
| レベル | 概要 | 想定ユースケース |
|---|---|---|
low |
最小限の思考。素早く軽い回答。 | 簡単な質問、チャット、要約 |
medium |
標準的な思考バランス。 | 一般的なタスク、日常的なコーディング |
high |
しっかり考える。品質重視。 | 複雑な分析、設計レビュー |
xhigh ⚡ |
長時間の深い思考。Opus 4.7専用。 | 30分以上のエージェントタスク、大規模コーディング |
max |
最大限の思考。上限なし。 | 最も難しい問題、研究レベルのタスク |
xhighは他のモデル(Sonnetなど)にはない、Opus 4.7専用のレベルです。理由は3つあります。
Opus 4.7は新しいトークナイザーを採用しており、1Mトークンが約555k語に相当します(他モデルは約750k語)。つまり、同じトークン数でも「より内容のある」思考ができるようになっています。
xhighは「数百万トークンの予算を持つ、30分以上の長時間エージェントタスク」を想定して設計されています。自律的にコードを読み、テストを書き、修正を繰り返すようなワークフローにぴったりです。
公式ドキュメントでは、コーディング・エージェント用途ではxhighから始めることを推奨しています。つまり「とりあえず一番頑張らせておいて、コストが気になったら下げる」というアプローチが公式推奨です。
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=64000, # xhighでは64k以上が推奨
thinking={
"type": "adaptive",
"budget_tokens": -1 # adaptiveのみ指定可能
},
messages=[{
"role": "user",
"content": "このコードベースをリファクタリングして、テストも書いて。"
}],
# effortで「頑張り度」を指定
metadata={"effort": "xhigh"}
)
# Batch APIでは最大300k output tokensまで対応
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=300000,
thinking={"type": "adaptive", "budget_tokens": -1},
messages=[{"role": "user", "content": "..."}],
metadata={"effort": "xhigh"}
)
xhighの登場は、AIエージェントの設計パラダイムを変える可能性があります。
Claude Opus 4.7のxhigh Effortは、「AIに本気で考えさせる」ためのスイッチです。
xhighはOpus 4.7専用、30分以上のエージェントタスク向けAIエージェントを本格的に活用するなら、このxhighは知っておいて損のない仕組みです。「ざっくり」から「本気」まで、AIの集中力を自在にコントロールできる時代が来ました。
← ブログトップへ