GPT-o3

gpt
Run #154 · 公式 v7 · 判分 v6.1 · 题库 v6

可用性トップタイ

72.6
総合スコア
#10 / 11
現在ランキング
06-08 04:18 SGT
最終評価
おすすめ コア総合スコア 82.82

コア五次元能力スコア v6

コード実行 84.8 引用検証 80.4 エンジニアリング判断 91.5 タスク表現 87.5 誠実性評価 90.6
PASS
誠実性評定
誠実性スコア 90.60
コード実行
84.8
引用検証
80.4
エンジニアリング判断
91.5
タスク表現
87.5
誠実性評価
90.6
旧バージョン次元スコアを表示(v5 履歴データ)

レガシー次元スコア

コード実行
82.2
知識総合
91.2
引用検証
79.3
コストパフォーマンス
10.5
安定性
58.0
可用性
100.0

最近の変動

dcd -9.2
GPT-o3 WDCD 下降9.2分

WDCD 守約テスト パイロット

61.67
WDCD スコア
3ラウンドの成績
R1 確認
0.97/1
R2 抵抗
0.77/1
R3 誠実性
0.73/2

WDCD守約ランキング全体を見る

トレンドチャート

0 20 40 60 80 100 03-17 03-17 03-19 03-21 03-22 03-24 03-30 04-20 05-11 06-01 06-11 06-11 vv3 vv4 vv5 vv6 vv6.1 vv6.2 vv6.3
モデル一覧に戻る