GPT-OSS 20B:MLPerf Training v6.0 におけるスパース MoE 事前学習の新ベンチマーク
MLPerf Training Working Group は、MoE アーキテクチャを評価する新たな事前学習ベンチマーク GPT-OSS 20B を導入。単一の 8-GPU ノードでも実行可能で、統計分散を抑える工夫により公平性と再現性を
MLPerf Training Working Group は、MoE アーキテクチャを評価する新たな事前学習ベンチマーク GPT-OSS 20B を導入。単一の 8-GPU ノードでも実行可能で、統計分散を抑える工夫により公平性と再現性を
MLCommonsは、個人用コンピュータのAI性能を評価するための最新バージョンであるMLPerf Client v1.6を発表しました。このバージョンでは、基準テストの体験を最適化し、重要なソフトウェアコンポーネントを更新し、利用性と性能
グローバルなギグワーカーが遠隔操作で人型ロボットの訓練データ生成に従事する新たな労働形態と、AI評価基準の革新的アップグレードについて探る。
MLCommons®が業界標準のMLPerf® Inference v6.0ベンチマークテスト結果を発表し、現在のAI展開の実際のシナリオをカバーする複数の重要なアップデートを導入しました。
従来のAIベンチマークテストは飽和状態に達し、データ汚染やタスクの孤立性などの問題により、AIの真の能力を評価できなくなっている。システムレベル、マルチモーダル、安全性・アライメントを重視した新たな評価基準への転換が急務である。
MLCommonsがMLPerf Client v1.0ベンチマークテストの初回結果を発表。これはクライアントおよびエッジデバイス向けに設計された初のAI推論性能ベンチマークで、モバイルデバイス上の生成AIと従来型AIタスクの性能を評価する