Strict問題ゼロ化 重大度 8/10 2026-W20

GPT-o3 総合 Strict問題ゼロ化

GPT-o3 Run #112

スコア比較

次元 前期 今期 変動
メイン (v5) 60.4 60.1 -0.3
コード実行 82.9 80.5 -2.4
知識総合 55.2 55.2 +0
引用検証 72.1 75.2 +3.1
コストパフォーマンス 8.5 8.4 -0.1
安定性 37.4 35.9 -1.5
可用性 100.0 100.0 +0

影響次元

execution

失点問題 Top 1

#1 Debug:矩阵旋转 100 0
Run #112 · 公式 v7 · 判分 v6 · 题库 v6 · 2026-05-11 04:21 SGT
GPT-o3 のプロフィールを見る