Googleが2026年4月にリリースしたオープンモデル「Gemma 4」は、単なる小型LLMではなかった。エッジデバイスで自律的に動くAIエージェントという、これまでにないコンセプトを実現している。
スマホでも、Raspberry Piでも、完全オフラインで。クラウドへの通信なしで、エージェントが考え、ツールを使い、タスクを完遂する。これが現実になっている。
Gemma 4は4つのサイズ展開だ:
| モデル | パラメータ | コンテキスト | 特徴 |
|---|---|---|---|
| E2B | 2B | 128K | 超軽量・エッジ最前線 |
| E4B | 4B | 128K | エッジと性能のバランス |
| 27B | 26B (MoE, 3.8B活性化) | 256K | 高速推論のMixture of Experts |
| 31B | 31B (Dense) | 256K | Arena世界3位の高性能 |
特に注目は、Gemini 3と同じ技術基盤で訓練されている点。つまり、Googleの最先端LLMのノウハウがそのまま2B〜31Bのオープンモデルに詰め込まれている。31B Denseモデルは、LMSYS Arena AIオープンモデルランキングで世界3位にランクインしており、オープンモデルとしては異例の高さだ。
140以上の言語に対応し、関数呼び出し、構造化JSON出力、システム指示をネイティブでサポート。E2B/E4Bに至っては音声入力にも対応している。もう単なるテキスト生成モデルではない。
ここからが本当にすごいところだ。Googleはエッジ推論に最適化したエンジンLiteRT-LMを開発し、Gemma 4と組み合わせている。
Raspberry Pi 5は教育用のあの小さなボードコンピュータだ。GPUアクセラレーションなしで、CPUだけでこの速度が出る。7.6 tok/sであれば、体感として十分読める速度でテキストが生成される。
そして、QualcommのDragonwing IQ8(NPU搭載)で動かすと:
Prefillで3700 tok/s。これは最初のプロンプト処理が一瞬で終わるレベルだ。NPUの力を借りれば、エッジデバイスでのエージェント応答はほぼリアルタイムになる。
Gemma 4の最大の革新は「エージェントとしての動作」にある。Agent Skillsという機能で、モデル自体がツールを呼び出し、外部リソースと連携して自律的にタスクを実行できる。
具体例を挙げよう:
これらがすべてローカルで、オフラインで動く。「クラウドに送信して処理を待つ」のではなく、端末自身が思考し、ツールを使い、結果を出す。このパラダイムシフトの意味は大きい。
GoogleのAI Edge Galleryアプリを使えば、自分のスマホで今すぐAgent Skillsを体験できる。Android/iOS両対応で、Gemma 4モデルをダウンロードすれば、機内モードでもAIエージェントと対話できる。
Gemma 4のライセンスはApache 2.0。これは実質的に最も緩いオープンライセンスの一つだ。商用利用、改変、再配布が自由。企業が自社製品に組み込む際にも、ライセンスの縛りを気にする必要がない。
これが意味するのは、誰もがGemma 4をベースに自社のエッジAI製品を作れるということ。スタートアップから大企業まで、同じ土俵でエッジAIの活用を進められる。
ここで、私が特にワクワクする応用先を一つ。自動車のECU(Electronic Control Unit)だ。
現代の自動車には数十〜百以上のECUが搭載されており、それぞれが固有の制御タスクを担っている。しかし、これらのECUは基本的に「プログラムされた通りに動く」固定機能のデバイスだ。
もし、Gemma 4 E2BクラスのモデルがECUに組み込まれたら?
E2Bの2Bパラメータなら、オートモーティブグレードのプロセッサでも動作可能なサイズだ。しかもオフライン動作が前提なので、トンネル内や山間部など通信が途切れる環境でも安定して機能する。自動車においてクラウド依存はリスクだが、Gemma 4のエッジファーストな設計は、そのリスクを根本的に排除できる。
IoTデバイスでも同様だ。工場のセンサーノード、スマートホームのハブ、ドローンの自律飛行制御 — クラウドに頼らず、デバイス自身が判断を下せる世界が現実味を帯びている。
Gemma 4が提示している未来像は明確だ。エッジデバイスは、AIの消費者からAIの実行者になる。
スマホが自ら考え、Raspberry Piが自ら調べ、車のECUが自ら診断する。それぞれがクラウドに頼らず、ローカルで完結するエージェントとして振る舞う。Apache 2.0で誰でも使える。Gemini 3と同じ技術で、Arena世界3位の品質。
エッジAIはこれまで「推論をローカルでやる」という段階だった。Gemma 4はそれを「エージェントをローカルで動かす」という次の段階に引き上げた。この波は、自動車からIoTまで、組み込みシステムの世界を根本から変えていく可能性がある。
個人的に、Raspberry Pi 5でGemma 4 E2Bを動かしてエージェント遊びしてみたい。7.6 tok/sで自律的にWikipediaを検索して回答を出してくれるあの小さなボードを想像すると、未来のデータセンターよりもワクワクする。