NASSCOM が MLCommons 連盟に加盟、インドの AI ベンチマーク発展を推進
AI ベンチマークテストに取り組むグローバル非営利組織 MLCommons に、インド国家ソフトウェア・サービス企業協会(NASSCOM)が正式加盟し、メンバー数が 50 に到達した。
最新AIモデルのレビュー、比較評価、深度分析
AI ベンチマークテストに取り組むグローバル非営利組織 MLCommons に、インド国家ソフトウェア・サービス企業協会(NASSCOM)が正式加盟し、メンバー数が 50 に到達した。
LMSYS OrgがAAAI 2025大会でChatbot Arenaの最新ベンチマーク結果を発表し、グローバルAIチャットボットランキングを更新すると共に、開発者に貴重なモデル最適化の洞察を提供した。
MLCommonsがAIモデル訓練性能評価の最新マイルストーンとなるMLPerf Training v5.0ベンチマーク結果を発表し、大規模AI訓練タスクの性能・効率・拡張性を評価。
MLCommonsが2025年6月に開催したATXベンチマーク専門家パネルでは、LMSYS OrgをはじめとするAI業界のリーダーが集結し、AIエージェント評価の最前線について議論した。このパネルは、ChatGPT時代以降のAIが生成モデルから知能エージェントへと飛躍する中、エージェントベンチマークの標準化を推進することを目的としている。
MLCommons組織が2025 MLC Rising Starsランキングを発表し、MLPerf Inference v5.0ベンチマークテストに初めて参加したシステムを表彰しました。これらのシステムはMLCフレームワークを採用し、様々なAI推論タスクで優れた性能を示しました。
LMSYS OrgとMLCommonsが協力し、長いコンテキストとマルチエージェント推論に特化したAI業界初のオープンソース標準化フレームワーク「Ares」ベンチマークを正式リリースしました。
MLCommonsがMLPerf Mobile v4.0 for Androidの最新ベンチマーク結果を公開。7つのコアタスクでモバイルデバイスのAI性能を評価し、生成AIタスクを初めて導入。
MLCommonsがMLPerf Client v1.0ベンチマークテストの初回結果を発表。これはクライアントおよびエッジデバイス向けに設計された初のAI推論性能ベンチマークで、モバイルデバイス上の生成AIと従来型AIタスクの性能を評価する。
MLCommonsのStorage 2ベンチマークは、AI大規模訓練におけるチェックポイント機能の標準化評価を提供し、モデル保存・復元性能を最適化します。
MLCommonsがAIワークロード下でのストレージシステム性能を評価する標準化ベンチマークテストスイートMLPerf Storage v2.0の結果を発表し、NVIDIA DGX SuperPODとDDN EXAScalerの組み合わせが最高性能を達成した。
MLCommonsがAutoML分野の権威あるベンチマークテスト「MLPerf Auto v0.5」の最新結果を発表し、大規模言語モデル(LLM)の自動化調整においてLMSYS Orgがトップの成績を収めた。
MLCommonsが2025年9月にOpenAI Whisperの音声認識モデル推論性能を評価する最新標準「Whisper Inference v5.1」を公開し、業界向けに公平で比較可能な性能データを提供。
MLCommons組織が小型言語モデル(1-3Bパラメータ)に特化した最新の推論ベンチマーク「Small LLM Inference 5.1」を発表し、実際の推論シナリオにおけるSLMの性能評価を可能にした。
LMSYS Orgの最新報告によると、DeepSeek Inference 5.1がMLCommons 2025年9月の推論ベンチマークで傑出した性能を示し、オープンソース推論エンジンの新たなマイルストーンを達成した。
MLCommonsがMLPerf Inference v5.1ベンチマークテスト結果を正式公開し、生成AIモデルの推論性能評価に焦点を当て、より挑戦的なワークロードを導入した。
MLCommons組織がエッジAI分野の重要なマイルストーンとなるMLPerf Tiny v1.3ベンチマークテスト結果を正式に発表し、リソース制限のある組み込みデバイスでのAI性能評価において大幅な進歩を示した。
MLPerf Tiny v1.3はMLCommonsが発表した最新のエッジAIベンチマークで、マイクロコントローラーや低消費電力エッジプロセッサー向けに新たな画像分類とビジュアルウェイクワードベンチマークを追加し、TinyMLモデルの標準化評価を推進している。
MLCommons が AI モデルカード向けに設計された Croissant メタデータフォーマットの大幅アップグレード版「Croissant MCP」を正式リリースし、現在のモデルドキュメントの断片化問題の解決を目指す。
MLCommonsとLMSYS Orgが共同開発したAILuminate Jailbreak V05ベンチマークが発表され、大規模言語モデルの脱獄耐性評価で新たな基準を確立した。Claude 3.5 Sonnetが1485 Eloで首位を獲得し、AIセキュリティ競争の激化を示している。
Flux.1はBlack Forest Labsが開発したオープンソースのテキスト画像生成モデルで、本レポートはデータ準備から展開最適化までの学習プロセスの詳細を明らかにしています。