レビュー 次世代投機的デコーディング:DFlashとSpec V2 Modal、Z Lab、SGLangチームが共同でDFlash投機的デコーディングモデルを発表し、SGLangの新デフォルトエンジンSpec V2と組み合わせることでLLM推論サービスの最適レイテンシを実現する。新たに公開されたQwen 3 LMSYS 推测解码 DFlash SGLang 7時間前 15