GoogleがオープンソースAIの常識を静かに塗り替えた

· ai coding · Source ↗

Summary based on the YouTube transcript and episode description.

FireshipがGoogle Gemma 4を解説:1枚のRTX 4090で動くフロンティア級インテリジェンス。

  • Gemma 4はApache 2.0ライセンスで公開——MetaのLlamaのように研究限定や商用制限がない、真の意味でフリーなモデル。
  • パラメータ数27BのGemma 4は、20 GBのダウンロードでRTX 4090一枚に収まり、約10トークン/秒で動作。比較対象のKimi K2.5は600 GB超、複数枚のH100が必要。
  • アーキテクチャの核心はper-layer embeddings——各Transformerレイヤーが独自のトークン表現を持つことで、不要な情報の持ち越しを削減。
  • 同時にTurboQuantも公開。重みを極座標に変換し、Johnson-Lindenstraussランダム射影で符号1ビットに圧縮しながら距離関係を保持する量子化手法。
  • AIの真のボトルネックは演算量ではなくメモリ帯域幅。Gemma 4が攻めているのはパラメータ数ではなくVRAM読み出しコスト。
  • ダウンロードサイズが約20倍小さいにもかかわらず、Gemma 4のベンチマークスコアはKimi K2.5 Thinkingと同等レンジに入る。
  • GoogleはFAANG勢で初めて、商用制限なしの真のオープンソースライセンスで競争力あるLLMを公開した企業となった。

2026-04-08 · YouTubeで視聴


英語版: Google just casually disrupted the open-source AI narrative… · Watch on YouTube