Gemma 4登場 — オープンソースAIに新しい風が吹く
2026年4月2日、Google DeepMindがオープンソースAIモデル「Gemma 4」をリリースした。これまでのGemmaシリーズの進化をまとめ上げるかのような充実のラインナップで、しかもライセンスはApache 2.0。商用利用も改変も自由という、Gemma史上最も寛容な条件での登場だ。
4つのモデル、4つの役割
Gemma 4は用途に合わせて4つのモデルを用意している。
- Gemma 4 Effective 2B / 4B — スマホやエッジデバイス向けの軽量モデル。2B(20億パラメータ)と4B(40億パラメータ)の2サイズで、なんとネイティブ音声入力にも対応している。
- Gemma 4 26B MoE — Mixture of Experts(専門家の混合)という仕組みで、パラメータの一部だけを使い分けて効率よく推論するモデル。軽さと性能のバランスを狙った一押し。
- Gemma 4 31B Dense — 今回の目玉。310億パラメータのDense(全パラメータを使用)モデルで、オープンモデル全体でトップクラスの性能を誇る。
「エッジで動かす軽量版」から「本格的な性能を叩き出す重量版」まで、一台のPCからクラウドまでカバーする構成になっている。
31B Dense、オープンモデル3位の衝撃
数字で見ると、Gemma 4 31B Denseの強さがよくわかる。
- Arena AI(人間の評価によるランキング):オープンモデル全体で3位、Eloレーティング1452。クローズドモデルと混ざっても堂々の上位。
- AIME 2026(数学競技):89.2%
- LiveCodeBench v6(コーディング):80.0%
数学もコーディングも、オープンモデルとしては驚異的なスコアだ。310億パラメータという「手が届くサイズ」でこの性能というのがポイント。最新の超大型クローズドモデルには及ばないにしても、実用上は十分すぎるレベルと言える。
テキストだけじゃない — マルチモーダル対応
Gemma 4はテキスト、画像、動画の3つのモダリティに対応するマルチモーダルモデルだ。写真を見て説明を書いたり、動画の内容を要約したりといったタスクがこなせる。
さらにエッジ向けの2B/4Bモデルはネイティブ音声入力にも対応。テキスト化を挟まずに直接音声を処理できるので、音声アシスタント的な使い道も見えてくる。
コンテキストウィンドウ(一度に扱えるテキスト量)は最大256K tokens。長文のドキュメントや大量のコードを一気に読み込ませても、文脈を失わずに処理できる。
自分のPCで動かせる — ローカル実行の魅力
Gemma 4の最大の強みの一つは、手元で動かせること。Hugging Face、Ollama、vLLM、llama.cpp、MLX、LM Studio、NVIDIA NIM、Android Studioなど、主要な推論フレームワークで利用可能だ。
一番手軽なのはOllama。インストール済みならコマンド一発で動く。
ollama run gemma4:27b
これだけでローカルにGemma 4が立ち上がる。インターネット接続不要、データは一切外に出ない。社内情報や個人情報を扱う用途でも安心だ。
まとめ — オープンソースAIの新しい基準
Gemma 4が示したのは、「オープンソースだから仕方ない」という妥協をもう必要としない、という事実だ。Apache 2.0で自由に使えて、エッジからサーバーまでカバーし、マルチモーダルもこなす。しかもローカルで動く。
オープンソースAIモデルはここ数年で急速に進化してきたが、Gemma 4はその到達点を一つ上げたと言っていい。これから自前でAIを活用しようとしている企業や個人開発者にとって、非常に選びやすい選択肢になっている。
今後、このラインナップをベースにどんな応用が生まれてくるのか。楽しみだ。