KV Cache圧縮比900,000倍超 — TurboQuantとShannon限界を超えると主張

https://arxiv.org/abs/2504.15356

記事

  • KV cache(推論時の中間状態キャッシュ)の圧縮率が、従来の最先端手法に比べて900,000倍を超えると主張
  • モデル自身を圧縮辞書として利用するアプローチを採用
  • ベクトル単位のShannon엔트로피限界(情報理論上の圧縮の理論的上限)をも上回ると謳う

ディスカッション

  • コメント欄では「興味深いが、論拠が追いにくい」という反応が多数
  • 注目された核心:「モデル自体を辞書にする」という新しい枠組みの提示
  • extraordinary claimに対して明確な証明がないとして懐疑的な声も

HNで議論を読む


原文(英語): KV Cache Compression 900000x Beyond TurboQuant and Per-Vector Shannon Limit


Type Link
Added Apr 21, 2026
Modified Apr 21, 2026