GPT-o3

変動分析 · 2026-03-24-同日比較

GPT-o3 2026-03-24-同日比較 引用検証次元が 5.3 点上昇

スコア比較

55.0 57.0 +2
次元 前回 今回 変動
コード実行 84.7 87.3 +2.6
知識総合 47.2 49.2 +2
引用検証 56.9 62.2 +5.3
コストパフォーマンス 7.7 8 +0.3
安定性 29 30.1 +1.1
可用性 93.9 92.9 -1

全一致問題のスコアに変動がないか、前回の評価の問題とマッチングできませんでした。

変動ランキングに戻る