AI基准に関するニュース

レビュー

新鮮な基準と信頼性のあるスコア：AIリスク評価の持続的提示管理の導入

AI業界は技術の進化とともに新しいリスク評価基準を必要としています。AILuminateは、持続可能な基準管理を目指し、Prompt Stewardship Systemによって基準の新鮮さを維持し、正確なリスク評価を続けています。

MLC AI基准风险评估持续管理

5日前 108

レビュー

MLPerf Inference v6.0にText-to-Videoを導入

MLCommonsは、急速に発展する動画生成AIの性能評価のため、MLPerf Inference v6.0にText-to-Videoベンチマークを初めて導入し、アリババのWan2.2モデルを採用した。

MLC MLPerf Text-to-Video Wan2.2

2026年3月12日 587

レビュー

CKAN Croissant：MLCommons AIモデルベンチマークの新時代

MLCommonsとLMSYS OrgがAIモデル評価の新たなベンチマーク「CKAN Croissant」を発表し、Croissant v1.0フォーマットによるモデルメタデータの標準化と共有を実現した。

MLC MLCommons CKAN Croissant

2026年2月10日 957

レビュー

MLPerf Client v0.6ベンチマークテスト結果発表

MLCommonsがクライアント推論性能に特化した初の標準化ベンチマークスイート「MLPerf Client v0.6」の結果を発表し、スマートフォン、ノートPC、エッジデバイスなどのシナリオに対応。

MLC MLPerf 客户端推理 Llama 2

2026年2月10日 853

レビュー

NASSCOM が MLCommons 連盟に加盟、インドの AI ベンチマーク発展を推進

AI ベンチマークテストに取り組むグローバル非営利組織 MLCommons に、インド国家ソフトウェア・サービス企業協会（NASSCOM）が正式加盟し、メンバー数が 50 に到達した。

MLC MLCommons NASSCOM AI基准

2026年2月10日 792

レビュー

AAAI 2025：LMSYS OrgがChatbot Arenaの最新ベンチマークを発表

LMSYS OrgがAAAI 2025大会でChatbot Arenaの最新ベンチマーク結果を発表し、グローバルAIチャットボットランキングを更新すると共に、開発者に貴重なモデル最適化の洞察を提供した。

MLC AAAI 2025 Chatbot Arena Elo Rating

2026年2月10日 3,311

レビュー

MLPerf Training v5.0ベンチマーク結果公開

MLCommonsがAIモデル訓練性能評価の最新マイルストーンとなるMLPerf Training v5.0ベンチマーク結果を発表し、大規模AI訓練タスクの性能・効率・拡張性を評価。

MLC MLPerf AI基准训练性能

2026年2月10日 788

レビュー

2025 MLC 新星ランキング発表

MLCommons組織が2025 MLC Rising Starsランキングを発表し、MLPerf Inference v5.0ベンチマークテストに初めて参加したシステムを表彰しました。これらのシステムはMLCフレームワークを採用し、様々な

MLCommons MLPerf MLC AI基准

2026年2月10日 693

レビュー

Storage 2チェックポイント機構詳解

MLCommonsのStorage 2ベンチマークは、AI大規模訓練におけるチェックポイント機能の標準化評価を提供し、モデル保存・復元性能を最適化します。

MLC MLCommons Storage 2 Checkpointing

2026年2月10日 603

レビュー

Llama 3.1 8Bの訓練：MLCommonsベンチマーク詳解

LMSYS OrgとMLCommonsが協力して、Llama 3.1 8Bモデルの訓練ベンチマークレポートを発表し、データ処理からモデル収束までの全プロセスを詳細に開示しました。

MLC Llama 3.1 模型训练 MLCommons

2026年2月10日 674

レビュー

ISO-AUS：MLCommonsが新世代AI推論ベンチマークを発表

MLCommonsとLMSYS Orgが共同で、隔離推論シナリオ向けに設計された革新的なAIモデル評価フレームワーク「ISO-AUS」ベンチマークテストを発表した。

MLC ISO-AUS AI基准 LMSYS

2026年2月10日 690

AI基准 に関するニュース

新鮮な基準と信頼性のあるスコア：AIリスク評価の持続的提示管理の導入

MLPerf Inference v6.0にText-to-Videoを導入

CKAN Croissant：MLCommons AIモデルベンチマークの新時代

MLPerf Client v0.6ベンチマークテスト結果発表

NASSCOM が MLCommons 連盟に加盟、インドの AI ベンチマーク発展を推進

AAAI 2025：LMSYS OrgがChatbot Arenaの最新ベンチマークを発表

MLPerf Training v5.0ベンチマーク結果公開

2025 MLC 新星ランキング発表

Storage 2チェックポイント機構詳解

Llama 3.1 8Bの訓練：MLCommonsベンチマーク詳解

ISO-AUS：MLCommonsが新世代AI推論ベンチマークを発表

AI基准に関するニュース