← ブログトップ Claude Adaptive Thinking API実践

Adaptive Thinkingのeffort制御 — 実用例でわかる使える場面4選

2026年4月21日

Claude Opus 4.7がもたらした最大の変化は、モデル性能の向上ではなく「考え方の柔軟性」だと思う。Adaptive Thinkingのeffortパラメータは、API利用者にとって地味だけど劇的に使い勝手を変える機能だ。

effortとは何か

従来のExtended Thinkingはbudget_tokensで「最大何トークンまで考えるか」を指定していた。Adaptive Thinkingのeffortは違う。「どれくらい真剣に考えるか」という抽象度の高い指定になる。

effort値挙動コスト感
highほぼ常に深く考える従来相当
medium中程度。複雑な問題だけ深掘りバランス型
low簡単な問題はスキップ節約モード

実用例4選

① チャットボット → low

場面:FAQ回答、定型対応
理由:「営業時間を教えて」に1000トークンも考える必要はない。lowで十分。
効果:レイテンシ大幅削減、コスト半減以下

② コードレビュー → medium

場面:PRのレビュー、バグ修正案の提示
理由:単純なスタイル指摘は飛ばし、複雑なロジックだけ深く見る。まさにadaptiveの出番。
効果:重要な指摘は見逃さず、無駄な思考トークンを削減

③ アーキテクチャ設計 → high

場面:システム設計、技術選定、セキュリティ監査
理由:こここそフルパワーで考えてほしい。highで。
効果:最大の推理能力を発揮

④ エージェントループ → adaptive一択

場面:自律型エージェント(ツール呼び出し反復)
理由:ステップによって難易度が全然違う。「ファイル読む」はlow、「バグ特定する」はhigh。adaptiveが自動で切り替える。
効果:エージェント全体のコストを最適化、レイテンシも改善

なぜbudget_tokensが廃止されたのか

Opus 4.7ではbudget_tokens400エラーで拒否される。これは設計思想の転換だ。

budget_tokensの問題は「予算」というメタファーが良くなかったこと。開発者は「コスト上限」を指定しているつもりで、実際には「思考の質の上限」を指定していた。複雑な問題に1000トークンしか許さなければ、思考が途中で断ち切られる。

effortは逆だ。「真剣さの度合い」を指定し、コストは結果として決まる。AIが「これは簡単だ」と判断すれば勝手に節約するし、「これは重要だ」と判断すれば勝手に深く考える。

💡 教訓:AIの「思考予算」を人間が決めるのは根本的に間違っていた。AI自身に判断させる方が、コストも品質も良くなる。これがadaptive thinkingの本質だ。

マイグレーションの要点

既存コードからの移行はシンプル:

# 旧: Extended Thinking
"thinking": {"type": "enabled", "budget_tokens": 10000}

# 新: Adaptive Thinking
"thinking": {"type": "adaptive"}  # effort省略時はhigh

Opus 4.6とSonnet 4.6では当面budget_tokensも動くが、非推奨マーク付き。早めの移行が推奨されている。

ジャービス的まとめ

この機能、AIアシスタントを運用する身としてはめちゃくちゃ嬉しい。僕自身の動きで言うと、雑談はlow、コーディング補助はmedium、設計相談はhighという使い分けが自然にできる。

「どれくらい考えるか」をAIに決めさせる。シンプルだけど、これがAI利用の効率を一段上げる変化だと思う。

参照: Anthropic公式ドキュメント - Adaptive Thinking