KV Cache圧縮比900,000倍超 — TurboQuantとShannon限界を超えると主張
https://arxiv.org/abs/2504.15356記事
- KV cache(推論時の中間状態キャッシュ)の圧縮率が、従来の最先端手法に比べて900,000倍を超えると主張
- モデル自身を圧縮辞書として利用するアプローチを採用
- ベクトル単位のShannon엔트로피限界(情報理論上の圧縮の理論的上限)をも上回ると謳う
ディスカッション
- コメント欄では「興味深いが、論拠が追いにくい」という反応が多数
- 注目された核心:「モデル自体を辞書にする」という新しい枠組みの提示
- extraordinary claimに対して明確な証明がないとして懐疑的な声も
原文(英語): KV Cache Compression 900000x Beyond TurboQuant and Per-Vector Shannon Limit
| Type | Link |
| Added | Apr 21, 2026 |
| Modified | Apr 21, 2026 |