オリジナル NVIDIAがNemotron-Labs-Diffusionモデルを発表 並列生成で高速化も大規模応用には疑問残る NVIDIAが5月19日に発表したNemotron-Labs-Diffusionは、拡散方式による言語モデリングで多トークン並列生成と動的修正を実現し推論速度を向上させたが、14Bという規模上限や特定GPUエコシステムへの依存といった課題も NVIDIA 扩散语言模型 AI生成效率 8時間前 36