レビュー INT4 QAT RL 実践:単一H200で1TBモデルをデプロイ SGLang RLチームがKimi K2に着想を得て、INT4 Quantization-Aware Training(QAT)のエンドツーエンドソリューションを実現。トレーニング段階のfake quantizationと推論段階のW4A1 LMSYS INT4 QAT SGLang RL 模型量化 7時間前 22