第8世代TPU:エージェント時代に向けた2つのチップ

https://blog.google/innovation-and-ai/infrastructure-and-cloud/google-cloud/eighth-generation-tpu-agentic-era/

TL;DR

GoogleのTPU 8tスーパーポッドは121 ExaFLOPSを達成し、2PBの共有HBMを搭載——大規模モデル推論に特化した設計です。

Key Takeaways

  • TPU 8tポッド1台で、TOP500スーパーコンピュータ上位10台の合計を上回る演算性能(121 vs 11,487 PetaFLOPS)
  • 垂直統合による構造的コスト優位性は、Nvidia依存の競合他社には再現不可能
  • 学習用(8t)と推論用(8i)のチップを分離し、Googleが推論コストの最適化を本格的に進めていることを示す

Discussion

主なコメント:

  • [pmb]:データセンター全体を前提としたチップ設計は、Googleにとってスケールで再現不能な参入障壁になる
  • [mlmonkey]:1ポッドで121 ExaFLOPSというのはTOP500全体を矮小化する数字——スケール感を把握するのに重要な統計
  • [WarmWash]:GeminiはGPTやClaudeよりトークン消費が大幅に少ない——意図的な効率化なのか、それともコンピュート上の制約なのか?
  • [jjice]:GoogleのVertical Stack(自社設計チップからモデルまで一貫した垂直統合)はGemini 2.5まで弱点に見えていたが、今となっては勝ち筋に映る

HN(Hacker News:技術系ニュースコミュニティ)で議論を読む


原文(英語): Our eighth generation TPUs: two chips for the agentic era


Type Link
Added Apr 23, 2026
Modified Apr 23, 2026
comments 184
hn_id 47862497
score 377
target_url https://blog.google/innovation-and-ai/infrastructure-and-cloud/google-cloud/eighth-generation-tpu-agentic-era/