レビュー SGLang最適化によるGLM4-MoEの本番環境デプロイ:TTFTが65%向上 Novita AIがSGLangを用いたGLM4-MoEモデルの本番環境向け最適化を開発し、Shared Experts FusionやSuffix Decodingの統合により、エージェントコーディングワークロードでTTFTを最大65%削 LMSYS GLM4-MoE SGLang 性能优化 2026年2月4日 689