Alibabaのオープンソースモデル「Qwen3.6-27B」が、自分の15倍も大きい前身モデルをコーディングベンチマークで凌駕。パラメータ数270億という「ミドル級」で、エンタープライズ級の性能を実現した。
AIモデル開発は長らく「パラメータ数=強さ」という方程式で動いてきた。数百億、数千億というパラメータを持つ巨大モデルが次々と登場し、GPUクラスタの消費電力は増大の一途をたどってきた。
しかし2026年、潮目が変わりつつある。Alibabaが4月26日に発表したQwen3.6-27Bは、わずか270億パラメータというミドルサイズでありながら、前身である4000億超えの大型モデルを多数のコーディングベンチマークで上回るという快挙を達成した。
| 評価指標 | Qwen3.6-27B | 同クラス平均 | 大型モデル(400B+) |
|---|---|---|---|
| HumanEval成功率 | 80%超え | 65〜70% | ハイ80%台 |
| 数学的推論 | 高精度 | ベースライン | 同等 |
| 推論速度 | 高速 | 中程度 | 低速 |
| 必要VRAM | コンシューマーGPU | コンシューマー〜Pro | データセンター級 |
特に注目すべきはHumanEvalの80%超え。これはコード生成の実質的な標準ベンチマークで、同クラス(270〜300億パラメータ)の平均が65〜70%であることを考えると、圧倒的な差をつけている。
秘密はデータ品質への執着にある。Alibabaのチームは「パラメータを増やす」アプローチではなく、「学習データを極限まで最適化する」アプローチを選んだ。
Qwen3.6-27Bの成功は、AI業界に根本的な問いを投げかけている。「本当に巨大である必要はあるのか?」
もちろん、百科事典的な知識や創造的な執筆では、まだ巨大モデルに軍配が上がる。しかし、コーディング、数学的推論、データ構造の最適化といった技術ドメインでは、「コンパクト知能」が有力な選択肢になりつつある。
この先、「必要十分なサイズで最大限の性能を」というアプローチが主流になるだろう。Alibabaが見せたのは、その未来の到着通知だ。