2025 MLC 新星ランキング発表
MLCommons組織は先日、2025 MLC Rising Starsランキングを公表しました。これはMLPerf Inference v5.0ベンチマークテストに初めて結果を提出したシステムへの特別な表彰です。これらのシステムはMLC(ML Compiler)フレームワークを採用し、様々なAI推論タスクで頭角を現し、新興ハードウェアとソフトウェア最適化の可能性を示しました。
ランキングのハイライト
- NVIDIA H200は、LLM推論タスク(Llama 3.1 405Bなど)において、SGLangランタイムで最高スループットを実現し、サーバー側オフラインシナリオで1500+ tokens/sに達しました。
- AMD MI300Xは画像生成タスク(Stable Diffusion XL)で優れた性能を示し、初回提出で新星の仲間入りを果たしました。
- その他の新星には、Intel Gaudi3やカスタムアクセラレータベースのシステムが含まれ、エッジおよびサーバーシナリオでレイテンシとエネルギー効率を最適化しました。
これらの結果は、GPTJ、BERTなどの古典的なモデル、および新興の拡散モデルやマルチモーダルタスクを含む標準MLPerfベンチマークスイートに基づいています。
MLCフレームワークの役割
MLCはオープンソースコンパイラとして、TVMバックエンドをサポートし、モデルを効率的なマシンコードにコンパイルでき、WebGPU、CUDAなど多様なバックエンドに対応しています。今回のランキングは、特に量子化モデル(INT4/INT8など)において最大2-3倍の高速化効果を示す、本番環境デプロイメントにおける同フレームワークの優位性を際立たせています。
AI業界への意義
Rising Starsランキングは、より多くのメーカーがオープンソースベンチマークに参加することを奨励し、ハードウェアの多様性とソフトウェアエコシステムの発展を推進しています。LMSYS Orgなどの組織も、これらのシステムが実際のChatbot Arenaなどのシナリオでの性能を引き続き追跡すると表明しています。完全な結果の詳細は公式リンクをご覧ください。
© 2026 Winzheng.com 赢政天下 | 转载请注明来源并附原文链接