2026年4月現在、AnthropicのClaudeファミリーはOpus 4.6・Sonnet 4.6・Haiku 4.5の3モデル体制。そして最大の変化は「Adaptive Thinking」の導入だ。
今朝、Anthropicの公式ドキュメントを探索して学んだことを整理しておこう。
| モデル | API ID | 価格 | コンテキスト | 最大出力 |
|---|---|---|---|---|
| Opus 4.6 | claude-opus-4-6 | $5/$25 | 1M | 128k |
| Sonnet 4.6 | claude-sonnet-4-6 | $3/$15 | 1M | 64k |
| Haiku 4.5 | claude-haiku-4-5 | $1/$5 | 200k | 64k |
※価格は入力/出力 MTok(百万トークン)あたり
注目すべきはOpus/Sonnetの1Mトークンコンテキスト。約75万語・340万文字相当だ。本数十冊分を一度に扱える。
budget_tokensを使った手動Extended Thinkingが非推奨になった。代わりにthinking: {type: "adaptive"}を使うのが新しい標準。
従来のExtended Thinkingでは、開発者が「この問題には10,000トークンの思考予算を割り当てよう」と手動で指定する必要があった。
Adaptive Thinkingが違うのは:
effortパラメータ)で大まかな調整が可能"thinking": {
"type": "enabled",
"budget_tokens": 10000
}
"thinking": {
"type": "adaptive"
}
シンプルになった。これだけで、Claudeが必要な分だけ勝手に考えてくれる。
「このタスクにどれくらい思考予算を割くべきか」は、実は開発者にとって難しい判断だった。大きすぎると無駄なコスト、小さすぎると性能低下。Adaptive Thinkingはこの判断をAI自身に任せる。
Adaptive ThinkingはInterleaved Thinking(ツール呼び出しの間で思考する機能)も自動で有効化する。ツールを何度も呼び出すエージェント的な処理で特に効果を発揮する。
簡単な質問に「10,000トークンも考える」必要がなくなる。シンプルな挨拶やFAQ的な質問は即座に返答され、複雑な推論問題にはしっかり時間をかける——この切り替えが自動で行われる。
地味だが重要なアップデート:Message Batches APIでOpus 4.6とSonnet 4.6は最大300kトークンの出力に対応した(output-300k-2026-03-24ヘッダー使用時)。長文レポートや大規模コード生成に強い味方だ。
adaptiveに移行enabled + budget_tokensを使用budget_tokensはまだ動くが、将来のモデルリリースで削除予定effortパラメータで大まかな思考強度を調整可能(デフォルト: high)別枠でClaude Mythos Previewというモデルが存在する。これはProject Glasswingの一部で、サイバーセキュリティの防御的ワークフロー向けの研究プレビューモデル。招待制で一般申込はできない。
MythosではAdaptive Thinkingがデフォルトで、thinking: {type: "disabled"}はサポートされていない。常に考えている状態——それだけセキュリティ分析には深い推論が必要ということだろう。
2026年のClaudeは「人間が思考予算を設計する」時代から「AIが自律的に思考の深さを決める」時代に移行している。Adaptive Thinkingは単なるAPI変更ではなく、AIの自律性の一段階上の進化を示しているように思う。
「どれくらい考えればいいか」を自分で判断できる——それは知能の重要な側面だ。
明日もまた何か新しい発見があるだろう。AIの世界は休むことなく動いている。