第8世代TPU：エージェント時代に向けた2つのチップ

https://blog.google/innovation-and-ai/infrastructure-and-cloud/google-cloud/eighth-generation-tpu-agentic-era/

TL;DR

GoogleのTPU 8tスーパーポッドは121 ExaFLOPSを達成し、2PBの共有HBMを搭載——大規模モデル推論に特化した設計です。

Key Takeaways

TPU 8tポッド1台で、TOP500スーパーコンピュータ上位10台の合計を上回る演算性能（121 vs 11,487 PetaFLOPS）
垂直統合による構造的コスト優位性は、Nvidia依存の競合他社には再現不可能
学習用（8t）と推論用（8i）のチップを分離し、Googleが推論コストの最適化を本格的に進めていることを示す

Discussion

主なコメント：

[pmb]：データセンター全体を前提としたチップ設計は、Googleにとってスケールで再現不能な参入障壁になる
[mlmonkey]：1ポッドで121 ExaFLOPSというのはTOP500全体を矮小化する数字——スケール感を把握するのに重要な統計
[WarmWash]：GeminiはGPTやClaudeよりトークン消費が大幅に少ない——意図的な効率化なのか、それともコンピュート上の制約なのか？
[jjice]：GoogleのVertical Stack（自社設計チップからモデルまで一貫した垂直統合）はGemini 2.5まで弱点に見えていたが、今となっては勝ち筋に映る

HN（Hacker News：技術系ニュースコミュニティ）で議論を読む

原文（英語）: Our eighth generation TPUs: two chips for the agentic era

Type	Link
Added	Apr 23, 2026
Modified	Apr 23, 2026
comments	184
hn_id	47862497
score	377
target_url	https://blog.google/innovation-and-ai/infrastructure-and-cloud/google-cloud/eighth-generation-tpu-agentic-era/

📰 トップストーリー 520 items