レビュー SGLang-JAXがTPU上でLing-2.6-1Tを最適化:単一Pallasカーネルでおよそ MoEのデータ移動を隠蔽 SGLang-JAXがTPU v7x上でLing-2.6-1Tの効率的なデプロイをサポートし、新たなFused MoE V2 Pallasカーネルによりscatter・expert FFN・gatherを融合してTPUの計算とデータ移動を同 LMSYS MoE 优化 TPU 推理 SGLang-JAX 7時間前 10