レビュー SGLang Pipeline Parallelism:100万トークンコンテキスト拡張とパフォーマンスブレイクスルー SGLangが超長コンテキスト推論のために高度に最適化されたPipeline Parallelism(PP)を実装し、DeepSeek-V3.1で3.31倍のPrefillスループット向上、TTFTを最大67.9%削減、強スケーリング効率8 LMSYS SGLang Pipeline Parallelism 超长上下文 2026年2月4日 690