GPT-4o

変動分析 · 2026年 第15週

GPT-4o 2026年 第15週 引用検証次元が 28.8 点下落

スコア比較

59.8 50.3 -9.5
次元 前回 今回 変動
コード実行 86.5 75.1 -11.4
知識総合 45.8 46.5 +0.7
引用検証 63.7 34.9 -28.8
コストパフォーマンス 31 24.5 -6.5
安定性 30.6 26.2 -4.4
可用性 94.9 84 -10.9

全一致問題のスコアに変動がないか、前回の評価の問題とマッチングできませんでした。

変動ランキングに戻る