AIに「じっくり考えて」と指示する時代が終わろうとしている。Anthropicが2026年初頭にリリースしたAdaptive Thinkingは、AI自身が「この問題は深く考えるべきか、サクッと答えるべきか」を自律的に判断する仕組みだ。
budget_tokens で思考量を手動指定これまでの「Extended Thinking」では、開発者が思考に使うトークン数の上限を budget_tokens で指定する必要があった。
// 従来の方法(非推奨に)
"thinking": {
"type": "enabled",
"budget_tokens": 10000
}
これは「全問10分で考えて」と指定するようなもの。簡単な質問にも10分使い、難しい問題も10分しか使えない。非効率だ。
Adaptive Thinkingではこうなる:
// 新しい方法
"thinking": {
"type": "adaptive"
}
たったこれだけ。あとはClaudeが勝手に判断してくれる。
完全に任せるだけでなく、大まかな「努力度」も指定できる。4段階ある:
これ、人間の働き方に似ている。「メール1通に全力を出す人はいないけど、大事な提案書には時間をかける」——それをAIが自然にやるようになった。
2026年4月現在、Adaptive Thinkingに対応しているのは:
Haiku 4.5は非対応。旧モデル(Opus 4.5、Sonnet 4.5以前)も非対応で、これらは引き続き budget_tokens を使う必要がある。
budget_tokens は非推奨になった。将来のモデルで削除される予定。
最大のメリットはコストと品質の両立だ。
従来は fixed budget なので、簡単な質問(「今日の天気は?」)にも同じ思考コストがかかっていた。Adaptive Thinkingなら、Claudeは「これは考えなくていいな」と判断して思考をスキップする。逆に複雑な推論問題にはたっぷり時間を使う。
特にエージェントワークフローとの相性が良い。ツールを何度も呼び出すような長いタスクで、Adaptive Thinkingは自動的に interleaved thinking(ツール呼び出しの合間に思考する機能)を有効にする。つまり「調べて→考えて→また調べて→また考えて」のサイクルが自然に回る。
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={"type": "adaptive"},
messages=[{
"role": "user",
"content": "このコードのバグを見つけて"
}],
)
for block in response.content:
if block.type == "thinking":
print(f"思考: {block.thinking[:200]}...")
elif block.type == "text":
print(f"回答: {block.text}")
Adaptive Thinkingは「AIの思考を自動運転にする」機能。開発者は細かい思考量の調整から解放され、AIは問題に応じて適切に考える。人間の認知の柔軟性に一段と近づいたと言える。
特にエージェント構築や複雑なワークフローで力を発揮する。まだOpus 4.6とSonnet 4.6限定だが、今後のモデル展開が楽しみだ。
公式ドキュメント:
Adaptive Thinking — Anthropic Docs
Introducing Claude Opus 4.6 — Anthropic Blog