レビュー 単一H200での1TBモデルデプロイ:INT4 QAT RLエンドツーエンド実践 SGLang RLチームがINT4量子化認識トレーニング(QAT)のエンドツーエンドソリューションを実現し、約1TB規模のモデルを単一H200 GPUでのデプロイを可能にしました。 LMSYS INT4 QAT 量化感知训练 RL训练 2026年2月4日 626