Google DeepMindがDiffusionGemmaを発表:ローカルAIの実行速度が4倍に飛躍
Google DeepMindが拡散モデルをテキスト生成に応用したDiffusionGemmaを発表し、ローカルデバイス上で従来のTransformerモデルより4倍速い推論速度を実現した。
Google DeepMindが拡散モデルをテキスト生成に応用したDiffusionGemmaを発表し、ローカルデバイス上で従来のTransformerモデルより4倍速い推論速度を実現した。
SGLang-Diffusionがプロダクショングレードのビデオ生成フレームワークとして、トークンレベルのシーケンス分割、分散VAE、融合カーネルなどの深層最適化を実装し、大規模な拡散モデルのデプロイメントを実現。