KV Cache圧縮比900,000倍超 — TurboQuantとShannon限界を超えると主張

https://arxiv.org/abs/2504.15356

記事

KV cache（推論時の中間状態キャッシュ）の圧縮率が、従来の最先端手法に比べて900,000倍を超えると主張
モデル自身を圧縮辞書として利用するアプローチを採用
ベクトル単位のShannon엔트로피限界（情報理論上の圧縮の理論的上限）をも上回ると謳う

ディスカッション

コメント欄では「興味深いが、論拠が追いにくい」という反応が多数
注目された核心：「モデル自体を辞書にする」という新しい枠組みの提示
extraordinary claimに対して明確な証明がないとして懐疑的な声も

HNで議論を読む

原文（英語）: KV Cache Compression 900000x Beyond TurboQuant and Per-Vector Shannon Limit

Type	Link
Added	Apr 21, 2026
Modified	Apr 21, 2026

📰 トップストーリー 362 items