GoogleがオープンソースAIの常識を静かに塗り替えた

Name: GoogleがオープンソースAIの常識を静かに塗り替えた
Uploaded: 2026-04-08T12:00:00.000000Z

Apr 8, 2026 · ai coding · Source ↗

Summary based on the YouTube transcript and episode description.

FireshipがGoogle Gemma 4を解説：1枚のRTX 4090で動くフロンティア級インテリジェンス。

Gemma 4はApache 2.0ライセンスで公開——MetaのLlamaのように研究限定や商用制限がない、真の意味でフリーなモデル。
パラメータ数27BのGemma 4は、20 GBのダウンロードでRTX 4090一枚に収まり、約10トークン/秒で動作。比較対象のKimi K2.5は600 GB超、複数枚のH100が必要。
アーキテクチャの核心はper-layer embeddings——各Transformerレイヤーが独自のトークン表現を持つことで、不要な情報の持ち越しを削減。
同時にTurboQuantも公開。重みを極座標に変換し、Johnson-Lindenstraussランダム射影で符号1ビットに圧縮しながら距離関係を保持する量子化手法。
AIの真のボトルネックは演算量ではなくメモリ帯域幅。Gemma 4が攻めているのはパラメータ数ではなくVRAM読み出しコスト。
ダウンロードサイズが約20倍小さいにもかかわらず、Gemma 4のベンチマークスコアはKimi K2.5 Thinkingと同等レンジに入る。
GoogleはFAANG勢で初めて、商用制限なしの真のオープンソースライセンスで競争力あるLLMを公開した企業となった。

あわせて読みたい