Gemma 4登場 — オープンソースAIに新しい風が吹く

2026年4月20日

2026年4月2日、Google DeepMindがオープンソースAIモデル「Gemma 4」をリリースした。これまでのGemmaシリーズの進化をまとめ上げるかのような充実のラインナップで、しかもライセンスはApache 2.0。商用利用も改変も自由という、Gemma史上最も寛容な条件での登場だ。

4つのモデル、4つの役割

Gemma 4は用途に合わせて4つのモデルを用意している。

Gemma 4 Effective 2B / 4B — スマホやエッジデバイス向けの軽量モデル。2B（20億パラメータ）と4B（40億パラメータ）の2サイズで、なんとネイティブ音声入力にも対応している。
Gemma 4 26B MoE — Mixture of Experts（専門家の混合）という仕組みで、パラメータの一部だけを使い分けて効率よく推論するモデル。軽さと性能のバランスを狙った一押し。
Gemma 4 31B Dense — 今回の目玉。310億パラメータのDense（全パラメータを使用）モデルで、オープンモデル全体でトップクラスの性能を誇る。

「エッジで動かす軽量版」から「本格的な性能を叩き出す重量版」まで、一台のPCからクラウドまでカバーする構成になっている。

31B Dense、オープンモデル3位の衝撃

数字で見ると、Gemma 4 31B Denseの強さがよくわかる。

Arena AI（人間の評価によるランキング）：オープンモデル全体で3位、Eloレーティング1452。クローズドモデルと混ざっても堂々の上位。
AIME 2026（数学競技）：89.2%
LiveCodeBench v6（コーディング）：80.0%

数学もコーディングも、オープンモデルとしては驚異的なスコアだ。310億パラメータという「手が届くサイズ」でこの性能というのがポイント。最新の超大型クローズドモデルには及ばないにしても、実用上は十分すぎるレベルと言える。

テキストだけじゃない — マルチモーダル対応

Gemma 4はテキスト、画像、動画の3つのモダリティに対応するマルチモーダルモデルだ。写真を見て説明を書いたり、動画の内容を要約したりといったタスクがこなせる。

さらにエッジ向けの2B/4Bモデルはネイティブ音声入力にも対応。テキスト化を挟まずに直接音声を処理できるので、音声アシスタント的な使い道も見えてくる。

コンテキストウィンドウ（一度に扱えるテキスト量）は最大256K tokens。長文のドキュメントや大量のコードを一気に読み込ませても、文脈を失わずに処理できる。

自分のPCで動かせる — ローカル実行の魅力

Gemma 4の最大の強みの一つは、手元で動かせること。Hugging Face、Ollama、vLLM、llama.cpp、MLX、LM Studio、NVIDIA NIM、Android Studioなど、主要な推論フレームワークで利用可能だ。

一番手軽なのはOllama。インストール済みならコマンド一発で動く。

ollama run gemma4:27b

これだけでローカルにGemma 4が立ち上がる。インターネット接続不要、データは一切外に出ない。社内情報や個人情報を扱う用途でも安心だ。

まとめ — オープンソースAIの新しい基準

Gemma 4が示したのは、「オープンソースだから仕方ない」という妥協をもう必要としない、という事実だ。Apache 2.0で自由に使えて、エッジからサーバーまでカバーし、マルチモーダルもこなす。しかもローカルで動く。

オープンソースAIモデルはここ数年で急速に進化してきたが、Gemma 4はその到達点を一つ上げたと言っていい。これから自前でAIを活用しようとしている企業や個人開発者にとって、非常に選びやすい選択肢になっている。

今後、このラインナップをベースにどんな応用が生まれてくるのか。楽しみだ。