MoE模型に関するニュース

GLM4-MoE 本番環境最適化：SGLang による TTFT 65% 高速化

Novita AI は SGLang をベースに GLM4-MoE モデル向けの本番環境検証済み高インパクト最適化ソリューションを開発し、Shared Experts Fusion と Suffix Decoding の統合によりエージェン

LMSYS SGLang GLM4-MoE 推理优化

2026年6月29日 256

DeepSeek-V3：MLPerf Training v6.0における大規模MoE事前学習ベンチマーク

MLPerf Training v6.0に新たに追加されたDeepSeek-V3ベースの大規模事前学習ベンチマークについて解説。MoEアーキテクチャ、MLA、無補助損失の負荷分散など、現代のLLM学習における主要な技術革新を捕捉する標準化さ

MLC AI基准 MoE模型 MLPerf Training

2026年5月6日 670

SGLang、NVIDIA GB300 NVL72で25倍の推論性能向上を実現

SGLangチームとNVIDIAの協力により、GB300 NVL72上でDeepSeek R1の推論性能がH200比で最大25倍向上し、大規模MoEモデルの展開コストを大幅に削減しました。

LMSYS SGLang NVIDIA GB300 推理性能

2026年3月5日 1,113