GoogleがGemma 4でオープンソースAIの常識を静かに覆した
FireshipがGoogle Gemma 4を解説。フロンティア級の性能を、RTX 4090一枚で動かせるサイズに収めたモデルだ。
- Gemma 4はApache 2.0ライセンスで公開——Meta の Llama のような研究目的限定や収益制限はなく、完全にフリー。
- 27BパラメータのGemma 4は、20 GBのダウンロードでRTX 4090一枚にてローカル実行でき、約10 tok/sで動作。比較対象のKimi K2.5は600 GB以上・複数のH100が必要。
- 主要なアーキテクチャ上の革新:レイヤーごとの埋め込み(per-layer embeddings)により、各Transformerレイヤーが独自のトークン表現を持つ。これにより無駄な情報の引き回しを削減している。
- Googleは同時にTurboQuantも公開。重みを極座標に変換し、Johnson-Lindenstrauss変換を適用して単一符号ビットへ圧縮しながら距離を保持する量子化手法だ。
- AIの真のボトルネックはコンピュートではなくメモリ帯域幅。Gemma 4が狙うのは生のパラメータ数ではなく、VRAMの読み出しコストだ。
- Gemma 4はKimi K2.5 Thinkingと同等のベンチマーク水準を達成しながら、ダウンロードサイズは約20分の1。
- GoogleはFAANG企業として初めて、商用制限なしの真のオープンソースライセンスで競争力のあるLLMをリリースした。
2026-04-08 · YouTubeで視聴
英語版: Google just casually disrupted the open-source AI narrative… · Watch on YouTube