レビュー テンソルを飛翔させる:R-Forkが大規模モデルの重み読み込みを加速 Tensor R-Forkは、高効率なノード間デバイス間インターコネクトを活用し、実行中のSGLangインスタンスから新しいインスタンスへゼロコピーでテンソルを読み込む新しい重み読み込み手法です。Deepseek-R1モデルの読み込み時間を LMSYS SGLang Tensor R-Fork GPU-Direct RDMA 2026年2月4日 574