Claude APIを使っている開発者のみなさん、budget_tokensを設定して「これくらい考えてくれ」と指定していた時代は終わりました。Anthropicが新しく導入した「effort」パラメータは、AIの思考リソースをダイヤルのように直感的に調整できる仕組みです。
この記事では、effortパラメータの仕組みと、実際の開発でどう使い分けるかを解説します。
effortは、Claudeに対して「このタスクにどれくらい真剣に取り組んでほしいか」を伝えるパラメータです。従来のbudget_tokens(思考に使うトークン数の上限指定)に代わるもので、adaptive thinkingと組み合わせて使います。
budget_tokensで制御していた方は、effortパラメータへの移行をお願いします。より直感的で、モデル側が適切にリソースを配分してくれます。
重要なのは、effortは行動のシグナルであって、厳密なトークン予算ではないということ。AIに「このタスクは手を抜いていいよ」「ここは全力で頼む」と伝えるニュアンスに近いです。
effortパラメータには5つのレベルがあります。それぞれの特徴を表にまとめました。
| レベル | 特徴 | 対応モデル | 用途 |
|---|---|---|---|
max |
最高性能。思考トークン制限なし | Opus 4.7, 4.6 / Sonnet 4.6 | 最難関タスク |
xhigh |
長時間エージェントタスク向け | Opus 4.7のみ | 複雑なエージェント処理 |
high |
デフォルト(省略時と同じ) | 全モデル | 標準的なタスク |
medium |
バランス型 | 全モデル | エージェントタスクに推奨 |
low |
最速・最安 | 全モデル | サブエージェント・簡単タスク |
Opus 4.7は最も性能が高いモデルですが、だからといって常にmaxにすべきではありません。
xhighから始めるhighは最低限の知能で十分なタスクや、センシティブな用途向けmaxはxhighで結果が足りない場合のみxhighというレベルがOpus 4.7専用で用意されているのがポイント。長時間動くエージェントタスクで、深い思考が求められる場面で真価を発揮します。
Sonnet 4.7は高速でコスト効率の良いモデル。effortも控えめに使うのが定石です。
mediumが推奨lowここが多くの人が見落としがちなポイントです。effortパラメータはthinkingの有無に関わらず使えます。そして、thinkingをオフにしていても、effortの設定は機能に影響を与えます。
具体的には:
highで動かし、個別のサブタスク(検索、フォーマット変換、簡単な要約など)はlowのサブエージェントに任せる。これがコストと品質のバランスを取る王道パターンです。
AIにずっと全力で考えさせる時代は終わりました。
従来のアプローチは「とにかく最強のモデルに最強のリソースを割く」でした。しかし実際の開発現場では、タスクによって求められる「真剣度」が全く違うのです。
人間だってそうです。メール1通書くのに論文執筆と同じ集中力は使いません。簡単な計算なら電卓でサクッと、重要な意思決定なら資料を揃えてじっくり。それと同じことをAIにもできるようになった、と考えるとしっくりきます。
effortパラメータは、タスクに応じてAIの思考コストを切り替えるAPI設計の新常識になりつつあります。最初から最後まで同じeffortで走らせるのではなく、処理のフェーズに応じて動的に切り替える。そういう設計ができるようになったことが、このパラメータの本当の価値です。
budget_tokensは過去のもの。これからはeffortで制御するlow〜max)をタスクに合わせて使い分けるxhigh起点、Sonnet 4.6はmedium起点で考えるまずは自分のユースケースでhighとmediumを比較してみてください。多くの場合、サブタスクはmedium以下で十分だと気づくはずです。