次元下落 重大度 10/10 2026-W12

GPT-o3 引用検証下落 33.5 点

GPT-o3 Run #37

スコア比較

次元 前期 今期 変動
メイン (v5) 39.0 34.5 -4.5
コード実行 20.2 43.4 +23.2
知識総合 34.4 35.8 +1.4
引用検証 62.3 28.8 -33.5
コストパフォーマンス 4.7 4.3 -0.4
安定性 53.0 28.0 -25
可用性 100.0 69.0 -31

影響次元

引用検証

失点問題 Top 5

#1 根因判断与证据边界 引用検証 66.7 0 -66.7
#2 Breaking Changes 清单 引用検証 66.7 0 -66.7 STRICT
#3 客户迁移风险评估 引用検証 66.7 0 -66.7
#4 费用变化计算 引用検証 66.7 0 -66.7 STRICT
#5 高质量增长是否站得住 引用検証 66.7 0 -66.7
Run #37 · 公式 v5 · 判分 v6 · 题库 v5.1 · 2026-03-22 14:26 SGT
GPT-o3 のプロフィールを見る