GPT-4o

変動分析 · 2026年 第14週

GPT-4o 2026年 第14週 コード実行次元が 23.7 点下落

スコア比較

59.8 49.3 -10.5
次元 前回 今回 変動
コード実行 86.5 62.8 -23.7
知識総合 45.8 47.2 +1.4
引用検証 63.7 49.1 -14.6
コストパフォーマンス 31 24.9 -6.1
安定性 30.6 27.8 -2.8
可用性 94.9 79 -15.9

全一致問題のスコアに変動がないか、前回の評価の問題とマッチングできませんでした。

変動ランキングに戻る