GPT-4o

変動分析 · 2026-03-24-同日比較

GPT-4o 2026-03-24-同日比較 引用検証次元が 12.5 点下落

スコア比較

59.8 57.4 -2.4
次元 前回 今回 変動
コード実行 86.5 88.4 +1.9
知識総合 45.8 45.1 -0.7
引用検証 63.7 51.2 -12.5
コストパフォーマンス 31 29 -2
安定性 30.6 28.7 -1.9
可用性 94.9 90.9 -4

全一致問題のスコアに変動がないか、前回の評価の問題とマッチングできませんでした。

変動ランキングに戻る