レビュー HiSparse:階層化メモリシステムによるスパースアテンションの加速 自己注意機構の計算およびメモリのコストが大規模言語モデル(LLMs)の拡張の主要なボトルネックとなっている中で、HiSparseは階層的なメモリシステムを用いてこの制約を克服し、スパースアテンションのスループットを向上させる。 LMSYS 稀疏注意力 HiSparse 层次化内存 2026年4月11日 277