MLCommons に関するニュース

Chakraの成熟へ：AI システムベンチマークテスト標準化エコシステム

MLCommonsのChakraワーキンググループがMLSys 2026産業フォーラムで画期的な論文を発表し、AI システムのベンチマークテストを標準化するオープンな実行トレースエコシステムの構築に向けた取り組みを示した。40社以上のメンバ

MLC AI基准测试 Chakra MLCommons

2026年6月29日 271

MLCommons、MLPerf Mobile v6.0をリリース——デバイス上でのLLMベンチマークを新たに追加

MLCommonsは本日、MLPerf Mobile v6.0を発表した。Androidデバイス上で大規模言語モデル（LLM）を実行するための生成AIベンチマークテストが新たに追加されている。

MLC MLPerf Mobile 设备端 LLM 基准测试

2026年6月29日 329

MLCommonsが2026 Rising Starsを発表：39名の機械学習システム新星が選出

MLCommonsは第4回Rising Starsとして175名超の応募者の中から39名の若手研究者を選出した。本選出はLLM、ML系統効率、ハードウェア・ソフトウェア協調設計など幅広い研究領域をカバーし、機械学習システム分野の次世代人材を

MLC MLCommons 机器学习系统 AI人才

2026年5月25日 625

AI信頼性マップ：ルールと環境

AIシステムの信頼性を高めることは、市場成長と社会保護において重要です。MLCommons AIリスクと信頼性ワーキンググループは、AI信頼性マップを作成し、これを基に信頼性の向上を目指しています。

MLC AI可靠性 MLCommons AI风险管理

2026年4月25日 779

新鮮な基準と信頼性のあるスコア：AIリスク評価の持続的提示管理の導入

AI業界は技術の進化とともに新しいリスク評価基準を必要としています。AILuminateは、持続可能な基準管理を目指し、Prompt Stewardship Systemによって基準の新鮮さを維持し、正確なリスク評価を続けています。

MLC AI基准风险评估持续管理

2026年4月22日 577

MLCommons、MLPerf Client v1.6を発表：性能最適化とユーザーエクスペリエンスの向上

MLCommonsは、個人用コンピュータのAI性能を評価するための最新バージョンであるMLPerf Client v1.6を発表しました。このバージョンでは、基準テストの体験を最適化し、重要なソフトウェアコンポーネントを更新し、利用性と性能

MLC MLPerf Client AI基准测试性能优化

2026年4月7日 784

グローバル基準、ローカルな現実：アジア太平洋多言語マルチモーダルAI安全性ベンチマーク試験運用

文化的な文脈を考慮したAI安全性評価の必要性から、アジア太平洋地域の多様な文化に対応したマルチモーダルベンチマークを開発中。2026年夏に初期ベンチマークを研究コミュニティに公開予定。

MLC AI安全性多模态基准文化风险

2026年3月14日 1,031

AI風险の新基準：AILuminate全球保障計画が信頼性を再定義

MLCommonsがAILuminate全球保障計画を発表し、AI システムの信頼性を検証するための構造化されたデータ駆動型評価メカニズムを確立。

MLC AI风险可靠性保障 AILuminate

2026年2月21日 926

MLCommonsが防御可能な脱獄ベンチマークテストの基礎を構築

MLCommonsは、大規模言語モデルの単一ターン脱獄攻撃に対する防御可能で再現可能な評価手法として、分類法に基づく新しいベンチマーク設計アプローチを発表した。

MLC MLCommons 越狱攻击基准测试

2026年2月18日 1,022

技術標準：AI大規模採用への架け橋

AI技術が企業サービスの汎用技術へと移行する中、信頼性の確保が重要な課題となっており、業界標準の策定と標準化された評価システムの構築が不可欠である。

MLC AI标准可靠性 MLCommons

2026年2月13日 1,443

CKAN Croissant：MLCommons AIモデルベンチマークの新時代

MLCommonsとLMSYS OrgがAIモデル評価の新たなベンチマーク「CKAN Croissant」を発表し、Croissant v1.0フォーマットによるモデルメタデータの標準化と共有を実現した。

MLC MLCommons CKAN Croissant

2026年2月10日 1,508

MLCommons、Ailuminate法語データセットを公開

MLCommonsがAiluminate French Datasetsを公開し、フランス語LLM評価の標準化ツールを提供。GPT-4oが翻訳精度92%でトップ、Llama 3.1 405Bが推論タスクで勝率78%を達成。

MLC Ailuminate 法语数据集 MLCommons

2026年2月10日 1,253

NASSCOM が MLCommons 連盟に加盟、インドの AI ベンチマーク発展を推進

AI ベンチマークテストに取り組むグローバル非営利組織 MLCommons に、インド国家ソフトウェア・サービス企業協会（NASSCOM）が正式加盟し、メンバー数が 50 に到達した。

MLC MLCommons NASSCOM AI基准

2026年2月10日 1,300

ATXベンチマーク専門家パネルの深層解析

MLCommonsが2025年6月に開催したATXベンチマーク専門家パネルでは、LMSYS OrgをはじめとするAI業界のリーダーが集結し、AIエージェント評価の最前線について議論した。このパネルは、ChatGPT時代以降のAIが生成モデル

MLC ATX基准 AI代理评估 Chatbot Arena

2026年2月10日 1,030

2025 MLC 新星ランキング発表

MLCommons組織が2025 MLC Rising Starsランキングを発表し、MLPerf Inference v5.0ベンチマークテストに初めて参加したシステムを表彰しました。これらのシステムはMLCフレームワークを採用し、様々な

MLCommons MLPerf MLC AI基准

2026年2月10日 1,035

Aresベンチマーク正式リリース

LMSYS OrgとMLCommonsが協力し、長いコンテキストとマルチエージェント推論に特化したAI業界初のオープンソース標準化フレームワーク「Ares」ベンチマークを正式リリースしました。

MLC Ares基准 LMSYS MLCommons

2026年2月10日 1,010

Storage 2チェックポイント機構詳解

MLCommonsのStorage 2ベンチマークは、AI大規模訓練におけるチェックポイント機能の標準化評価を提供し、モデル保存・復元性能を最適化します。

MLC MLCommons Storage 2 Checkpointing

2026年2月10日 868

MLCommons Whisper推論ベンチマーク v5.1 リリース

MLCommonsが2025年9月にOpenAI Whisperの音声認識モデル推論性能を評価する最新標準「Whisper Inference v5.1」を公開し、業界向けに公平で比較可能な性能データを提供。

MLC Whisper MLCommons 推理基准

2026年2月10日 1,002

MLCommons 小型LLM推論ベンチマーク5.1リリース

MLCommons組織が小型言語モデル（1-3Bパラメータ）に特化した最新の推論ベンチマーク「Small LLM Inference 5.1」を発表し、実際の推論シナリオにおけるSLMの性能評価を可能にした。

MLC MLCommons 小型LLM 推理基准

2026年2月10日 855

Croissant MCP：MLCommons の新世代モデルメタデータ標準

MLCommons が AI モデルカード向けに設計された Croissant メタデータフォーマットの大幅アップグレード版「Croissant MCP」を正式リリースし、現在のモデルドキュメントの断片化問題の解決を目指す。

MLC MLCommons Croissant MCP 模型卡片

2026年2月10日 848