Nemotron に関するニュース

NVIDIA Nemotronデュアルタワー拡散モデル発表、推論速度2.42倍向上しながら高忠実度を維持

NVIDIAはNemotron-Labs-TwoTower拡散言語モデルを正式発表し、30Bパラメータのモデルをデュアルタワーアーキテクチャに分割することで推論速度を2.42倍に向上させつつ、品質保持率98.7%を実現した。