AIレビュー・評価

最新AIモデルのレビュー、比較評価、深度分析

ATXベンチマーク専門家パネルの深層解析

MLCommonsが2025年6月に開催したATXベンチマーク専門家パネルでは、LMSYS OrgをはじめとするAI業界のリーダーが集結し、AIエージェント評価の最前線について議論した。このパネルは、ChatGPT時代以降のAIが生成モデルから知能エージェントへと飛躍する中、エージェントベンチマークの標準化を推進することを目的としている。

MLC ATX基准 AI代理评估
700