レビュー SGLangとの協業:H20-96GでDeepSeek-R1を効率的にデプロイするベストプラクティス H20 GPUの特性を活かしたハードウェア認識型の並列化戦略と、カーネルレベルの最適化によって、DeepSeek-R1の大規模MoEモデルを効率的にデプロイする手法を紹介。ノードあたり16.5k入力トークン/秒、5.7k出力トークン/秒のS LMSYS DeepSeek-R1 H20 GPU SGLang 2026年2月4日 732