MLPerf Inference v6.0にText-to-Videoを導入
MLCommonsは、急速に発展する動画生成AIの性能評価のため、MLPerf Inference v6.0にText-to-Videoベンチマークを初めて導入し、アリババのWan2.2モデルを採用した。
MLCommonsは、急速に発展する動画生成AIの性能評価のため、MLPerf Inference v6.0にText-to-Videoベンチマークを初めて導入し、アリババのWan2.2モデルを採用した。
DLRMv3は、MLPerf DLRM系列初のシーケンス推薦推論ベンチマークであり、HSTU アーキテクチャに基づく1TBモデルで、現代の推薦システムの計算パターンを反映している。
MLCommonsがクライアント推論性能に特化した初の標準化ベンチマークスイート「MLPerf Client v0.6」の結果を発表し、スマートフォン、ノートPC、エッジデバイスなどのシナリオに対応。
AI ベンチマークテストに取り組むグローバル非営利組織 MLCommons に、インド国家ソフトウェア・サービス企業協会(NASSCOM)が正式加盟し、メンバー数が 50 に到達した。
MLCommonsがAIモデル訓練性能評価の最新マイルストーンとなるMLPerf Training v5.0ベンチマーク結果を発表し、大規模AI訓練タスクの性能・効率・拡張性を評価。
MLCommons組織が2025 MLC Rising Starsランキングを発表し、MLPerf Inference v5.0ベンチマークテストに初めて参加したシステムを表彰しました。これらのシステムはMLCフレームワークを採用し、様々な
MLCommonsがMLPerf Mobile v4.0 for Androidの最新ベンチマーク結果を公開。7つのコアタスクでモバイルデバイスのAI性能を評価し、生成AIタスクを初めて導入。
MLCommonsがMLPerf Client v1.0ベンチマークテストの初回結果を発表。これはクライアントおよびエッジデバイス向けに設計された初のAI推論性能ベンチマークで、モバイルデバイス上の生成AIと従来型AIタスクの性能を評価する
MLCommonsがAIワークロード下でのストレージシステム性能を評価する標準化ベンチマークテストスイートMLPerf Storage v2.0の結果を発表し、NVIDIA DGX SuperPODとDDN EXAScalerの組み合わせが
MLCommonsがAutoML分野の権威あるベンチマークテスト「MLPerf Auto v0.5」の最新結果を発表し、大規模言語モデル(LLM)の自動化調整においてLMSYS Orgがトップの成績を収めた。
MLCommons組織が小型言語モデル(1-3Bパラメータ)に特化した最新の推論ベンチマーク「Small LLM Inference 5.1」を発表し、実際の推論シナリオにおけるSLMの性能評価を可能にした。
MLCommonsがMLPerf Inference v5.1ベンチマークテスト結果を正式公開し、生成AIモデルの推論性能評価に焦点を当て、より挑戦的なワークロードを導入した。
MLCommonsがAIモデル訓練性能評価の最新ベンチマーク「MLPerf Training v5.1」を発表、NVIDIAが多くの部門で記録を更新し、FP8量化訓練など新技術が導入された。
MLCommonsがクライアント推論シナリオ向けの最新ベンチマークテストスイート「MLPerf Client 1.5」を発表。モバイルデバイスやノートPC、エッジデバイスでのAI性能評価に焦点を当て、実際のアプリケーションに近い測定基準を提