GPT-o3

変動分析 · 2026年 第14週

GPT-o3 2026年 第14週 コード実行次元が 15.3 点下落

スコア比較

55.0 50.6 -4.4
次元 前回 今回 変動
コード実行 84.7 69.4 -15.3
知識総合 47.2 51.2 +4
引用検証 56.9 53.2 -3.7
コストパフォーマンス 7.7 6.9 -0.8
安定性 29 31.7 +2.7
可用性 93.9 83 -10.9

全一致問題のスコアに変動がないか、前回の評価の問題とマッチングできませんでした。

変動ランキングに戻る