可重现性に関するニュース

SGLangが決定論的推論と再現可能なRL訓練を実現

SGLangがThinking Machines Labのbatch-invariant演算子を基に完全な決定論的推論を実現し、slimeと協力して100%再現可能なRL訓練を可能にしました。CUDA graphs有効時で2.8倍の高速化を