レビュー AutoRoundとSGLangが連携:効率的な量子化モデル推論の新時代 SGLangとAutoRoundが正式に連携し、低ビット量子化による効率的なLLM推論をサポート。開発者はAutoRoundの符号勾配最適化技術でモデルを量子化し、SGLangの効率的なランタイムで直接デプロイできるようになりました。 LMSYS AutoRound SGLang 模型量化 2026年2月4日 713