MLC に関するニュース

MLPerf Tiny：超低消費電力AIの重要なベンチマーク

MLPerf Tinyは、マイクロコントローラーなどの超低消費電力デバイス上での機械学習性能を公平に比較するためのベンチマークスイートであり、精度・レイテンシ・推論あたりエネルギー消費量を統一された条件で評価する。TinyMLの普及に伴い、

MLC MLPerf Tiny TinyML 边缘AI

MLPerf InferenceがAIエージェント時代へ：マルチターンAgentic Inferenceベンチマークを新規追加

MLPerf Inferenceベンチマークスイートが、LLMの実運用における最も急成長する利用形態であるマルチターンAgentic Inferenceに対応するため、新たなベンチマークを追加した。コーディングエージェントとワークフローエー

MLC MLPerf 智能体推理大模型基准

MLPerf v6.1、エッジ向けAgentic推論ベンチマークの結果を募集

MLCommonsのEdge LLM Taskforceは、MLPerf Inference v6.1においてEdge Agentic Inferenceベンチマークを新たに導入すると発表した。提出締め切りは2026年7月31日で、ハードウ

MLC MLPerf 边缘AI Agentic AI

MedPerfがGoogle Cloudの機密コンピューティングに対応：脳腫瘍AI評価を暗号化で保護

MLCommonsのMedPerfがGoogle Cloud Confidential Computingと統合し、患者データとモデルの知的財産を保護しながら脳腫瘍分割AIの評価を安全に実施できる仕組みを実証した。この統合により、データを移

MLC 医療AI 机密计算 MedPerf

AI評価が露わにする困境：従来のパッチモデルはなぜ機能しないのか

AIシステムの特性により、30年間にわたりセキュリティコミュニティが依拠してきた協調的脆弱性開示（CVD）モデルが通用しなくなっている。MLCommonsはこの課題に対処すべく、ISO標準化の推進と新たな開示ポリシーの策定に取り組んでいる。

MLC AI安全性模型评估负责任披露

2026年6月29日 299

Chakraの成熟へ：AI システムベンチマークテスト標準化エコシステム

MLCommonsのChakraワーキンググループがMLSys 2026産業フォーラムで画期的な論文を発表し、AI システムのベンチマークテストを標準化するオープンな実行トレースエコシステムの構築に向けた取り組みを示した。40社以上のメンバ

MLC AI基准测试 Chakra MLCommons

2026年6月29日 271

MLCommons、MLPerf Mobile v6.0をリリース——デバイス上でのLLMベンチマークを新たに追加

MLCommonsは本日、MLPerf Mobile v6.0を発表した。Androidデバイス上で大規模言語モデル（LLM）を実行するための生成AIベンチマークテストが新たに追加されている。

MLC MLPerf Mobile 设备端 LLM 基准测试

2026年6月29日 330

MLPerf Training v6.0ベンチマーク結果発表：MoEスパース計算に焦点

MLCommonsがMLPerf Training v6.0ベンチマークの最新結果を発表した。今回はMixture-of-Expertsアーキテクチャを採用した2つの新ベンチマークが追加され、AIエコシステムの急速な変革を示している。

MLC MLPerf 基准测试 MoE

2026年6月29日 291

MLCommonsが2026 Rising Starsを発表：39名の機械学習システム新星が選出

MLCommonsは第4回Rising Starsとして175名超の応募者の中から39名の若手研究者を選出した。本選出はLLM、ML系統効率、ハードウェア・ソフトウェア協調設計など幅広い研究領域をカバーし、機械学習システム分野の次世代人材を

MLC MLCommons 机器学习系统 AI人才

2026年5月25日 625

GPT-OSS 20B：MLPerf Training v6.0 におけるスパース MoE 事前学習の新ベンチマーク

MLPerf Training Working Group は、MoE アーキテクチャを評価する新たな事前学習ベンチマーク GPT-OSS 20B を導入。単一の 8-GPU ノードでも実行可能で、統計分散を抑える工夫により公平性と再現性を

MLC MLPerf Training GPT-OSS 20B MoE

2026年5月14日 693

DeepSeek-V3：MLPerf Training v6.0における大規模MoE事前学習ベンチマーク

MLPerf Training v6.0に新たに追加されたDeepSeek-V3ベースの大規模事前学習ベンチマークについて解説。MoEアーキテクチャ、MLA、無補助損失の負荷分散など、現代のLLM学習における主要な技術革新を捕捉する標準化さ

MLC AI基准 MoE模型 MLPerf Training

2026年5月6日 670

AI信頼性マップ：ルールと環境

AIシステムの信頼性を高めることは、市場成長と社会保護において重要です。MLCommons AIリスクと信頼性ワーキンググループは、AI信頼性マップを作成し、これを基に信頼性の向上を目指しています。

MLC AI可靠性 MLCommons AI风险管理

2026年4月25日 785

新鮮な基準と信頼性のあるスコア：AIリスク評価の持続的提示管理の導入

AI業界は技術の進化とともに新しいリスク評価基準を必要としています。AILuminateは、持続可能な基準管理を目指し、Prompt Stewardship Systemによって基準の新鮮さを維持し、正確なリスク評価を続けています。

MLC AI基准风险评估持续管理

2026年4月22日 579

MLCommons、MLPerf Client v1.6を発表：性能最適化とユーザーエクスペリエンスの向上

MLCommonsは、個人用コンピュータのAI性能を評価するための最新バージョンであるMLPerf Client v1.6を発表しました。このバージョンでは、基準テストの体験を最適化し、重要なソフトウェアコンポーネントを更新し、利用性と性能

MLC MLPerf Client AI基准测试性能优化

2026年4月7日 785

MLCommonsがMLPerf Inference v6.0ベンチマークテストの最新結果を発表

MLCommons®が業界標準のMLPerf® Inference v6.0ベンチマークテスト結果を発表し、現在のAI展開の実際のシナリオをカバーする複数の重要なアップデートを導入しました。

MLC MLPerf Inference AI基准测试 LLM

2026年4月2日 1,255

MLPerf Inference v6.0、GPT-OSS 120B ベンチマークとDeepSeek-R1低遅延インタラクション最適化を新規追加

MLPerf Inference v6.0は、GPT-OSS 120Bベンチマークと、DeepSeek-R1の低遅延インタラクションシナリオ（初の標準化されたspeculative decoding）を導入し、オープンソースLLMベンチマー

MLC MLPerf Inference GPT-OSS 120B DeepSeek-R1

2026年3月25日 998

生成式AI サービス評価の標準化：API志向ベンチマークテストの新パラダイム

MLCommonsが生成式AIの急速な進化に対応するため、API中心のベンチマークテスト「MLPerf Endpoints」を発表。従来の半年周期から四半期ごとの継続的な結果提出モデルに転換し、実運用環境を反映した性能評価を実現する。

MLC MLPerf Endpoints 生成式AI基准 API测试

2026年3月20日 944

グローバル基準、ローカルな現実：アジア太平洋多言語マルチモーダルAI安全性ベンチマーク試験運用

文化的な文脈を考慮したAI安全性評価の必要性から、アジア太平洋地域の多様な文化に対応したマルチモーダルベンチマークを開発中。2026年夏に初期ベンチマークを研究コミュニティに公開予定。

MLC AI安全性多模态基准文化风险

2026年3月14日 1,034

MLPerf Inference v6.0 EdgeスイートがYOLO11にアップグレード

MLPerf Inference Edgeスイートが従来のRetinaNetベンチマークから最新のUltralytics YOLO11へアップグレードされ、より現代的で高性能な物体検出モデルによる評価が可能になりました。

MLC MLPerf Inference YOLO11 目标检测

2026年3月13日 1,066

MLPerf Inference v6.0にText-to-Videoを導入

MLCommonsは、急速に発展する動画生成AIの性能評価のため、MLPerf Inference v6.0にText-to-Videoベンチマークを初めて導入し、アリババのWan2.2モデルを採用した。

MLC MLPerf Text-to-Video Wan2.2

2026年3月12日 1,009