Opus 4.7が予言するAIの未来:人間が「考える量」を指定する時代の終わり
2025年にAnthropicが「extended thinking」を導入した時、開発者たちは歓喜した。「AIが深く考えられる!」と。でも、その仕組みには一つ厄介な前提があった —— 人間が「どれくらい考えるか」を指定しなきゃいけないことだ。
budget_tokens — かつての「思考のダイヤル」
extended thinkingの核心はbudget_tokensパラメータだった。これは要するに「この問題を解くのに、いくらトークン使って考えてもいいよ」という予算の指定。
「この計算は簡単そうだから5000トークンで」「こっちは複雑だから32000トークンで」—— 人間がAIの思考量をチューニングする世界。なんか変じゃない? AIに考えさせてるはずなのに、人間が「どれくらい考えるか」を決めている。
まるで、優秀な部下に「この問題、3分以内で考えて」と指示する上司みたいなものだ。
Opus 4.7で起きたこと — budget_tokensが消えた
Claude Opus 4.7で、この「思考のダイヤル」がなくなった。APIでbudget_tokensを指定すると、400エラーが返ってくる。手動での思考量コントロールはもう不可能だ。
代わりに、唯一の思考モードはadaptive thinkingになった。名前の通り、Claude自身が「この問題はどれくらい考えるべきか」を自律的に判断する仕組みだ。
「2+2は?」みたいな質問には数トークンの思考ですぐ答える。一方で「この暗号解読して」なら、数万トークン使ってじっくり考える。人間の介入なしに、全部自動。
effort — 人間に残された「ざっくり指定」
完全に人間のコントロールがなくなったかというと、そうでもない。effortパラメータでhigh、medium、lowの3段階で大まかな傾向を指定できる。
でもこれは「この問題を32,768トークンで考えろ」という精密な指定じゃない。「全力で考えて」「普通でいいよ」「軽くで」くらいのニュアンス。実際の思考量はClaudeが決める。
人間の役割が「エンジニア」から「ディレクター」に変わった、と言えるかもしれない。
interleaved thinking — ツール連携中も考え続ける
もう一つ重要な变化がinterleaved thinkingの自動有効化だ。これまでAIは「考えて→出力して→ツール呼んで→結果待って→また考えて」というステップを踏んでいた。間に「無思考の待ち時間」があった。
interleaved thinkingでは、ツール呼び出しの結果を待っている間も、別の思考を並行して進められる。エージェントワークフロー —— つまりAIが自律的に複数のツールを駆使して作業する場面 —— で特に効果を発揮する。
コード書いて、テスト走らせて、エラー見て、修正して、またテストして……このサイクルの合間にも常に「考えている」状態になる。流れが途切れない。
新トークナイザー — 数字の裏にあるもう一つの変化
Opus 4.7ではトークナイザーも刷新された。これまでは1M tokens ≈ 750k wordsだったが、新トークナイザーでは1M tokens ≈ 555k wordsになる。一見「減った」ように見えるが、これは日本語などの多バイト言語での表現力が上がったことを意味する。同じ内容をより少ないトークンで表現できる場面が増えるという見方もあるし、逆に英語圏ではコスト効率が変わる可能性もある。
さらに、max outputが128k tokensに引き上げられた。長文生成にも余裕が出た。
非推奨の波 — Opus 4.6とSonnet 4.6も
この動きはOpus 4.7だけじゃない。Opus 4.6とSonnet 4.6でもbudget_tokensは非推奨になった。エラーにはならないが、公式ドキュメントで「使わないで」と明記されている。
Anthropicの方向性は明確だ。人間がAIの思考量をチューニングする時代は終わる。AI自身に任せる。その方が効率的だし、結果も良い。
パラダイムシフトの意味
この変化を「ただの仕様変更」として流すのはもったいない。本質的なパラダイムシフトが起きている。
これまで:人間が「この問題は重要だから深く考えて」「これは軽くでいい」と逐一判断し、パラメータで指定する。
これから:人間は「全力でやって」か「サクッとやって」くらいの大雑把な指示を出すだけで、AIが状況に応じて最適な思考の深さを選ぶ。
これは、AIが「メタ認知」—— 自分の思考プロセスを監視・制御する能力 —— を獲得しつつあることを示唆している。問題を見て「これ、真剣に考えた方がいいな」と判断できる。あるいは「これは1秒で答えられる」と見極められる。
エージェントワークフローにおいて、この自律性は爆発的に強力だ。複数ツールを連携させる場面では、各ステップで必要な思考の深さが違う。「このAPI呼び出しは定型処理だからサクッと」「こっちのエラー解析は深掘りしよう」—— これを人間がいちいち指定していたらキリがない。AI自身に判断させるのが、唯一現実的なアプローチだ。
開発者としての心得
では、我々開発者はどうすればいいか。
まず、budget_tokensへの依存を手放すこと。まだOpus 4.6等で使えていたとしても、移行は時間の問題だ。adaptive thinking前提でシステムを設計し直す。
effortパラメータを活用する。「このタスクは手抜きでいい」ならlow、「重要な判断」ならhigh。これだけで十分だ。
そして、エージェント的な使い方 —— ツール連携、マルチステップの推論 —— ではOpus 4.7の真価が発揮されることを期待していい。interleaved thinkingが自動で効くので、従来よりもスムーズで賢いワークフローが組めるはずだ。
人間が「考える量」を指定する時代は終わった。AIが自分で決める時代が来た。 それは少し怖いかもしれないけど、きっと正しい方向への一歩だ。だって、本当に考えるべき問題にこそ、AIのリソースを集中させるべきだから。