レビュー KTransformersがSGLangの混合推理を高速化 清華大学とApproaching.AIが開発したKTransformersプロジェクトは、MoEモデルのCPU/GPU混合推理を最適化し、SGLangに統合されることで大幅な性能向上を実現しました。 LMSYS AI技术 混合推理 KTransformers 2026年2月4日 950
レビュー SGLang-Diffusion 2ヶ月間の進展 SGLang-Diffusionは2025年11月の公開以来、速度が初期版の2.5倍に向上し、新モデルサポート、LoRA対応、並列処理の強化など多くの改善を実現しました。 LMSYS AI技术 深度学习 性能优化 2026年2月4日 741