レビュー SGLangが決定論的推論と再現可能なRL訓練を実現 SGLangがThinking Machines Labのbatch-invariant演算子を基に完全な決定論的推論を実現し、slimeと協力して100%再現可能なRL訓練を可能にしました。CUDA graphs有効時で2.8倍の高速化を LMSYS SGLang 确定性推理 RL训练 2026年2月4日 718