レビュー KTransformersがSGLangの混合推理を高速化 清華大学とApproaching.AIが開発したKTransformersプロジェクトは、MoEモデルのCPU/GPU混合推理を最適化し、SGLangに統合されることで大幅な性能向上を実現しました。 LMSYS AI技术 混合推理 KTransformers 2026年2月4日 948