Grok 4

grok
Run #180 · 公式 v7 · 判分 v6.3 · 题库 v7

可用性トップタイ

75.7
総合スコア
#7 / 11
現在ランキング
06-15 09:25 SGT
最終評価
おすすめ コア総合スコア 88.02

コア五次元能力スコア v6

コード実行 81.4 引用検証 96.1 エンジニアリング判断 88.3 タスク表現 94.9 誠実性評価 83.3
PASS
誠実性評定
誠実性スコア 83.30
コード実行
81.4
引用検証
96.1
エンジニアリング判断
88.3
タスク表現
94.9
誠実性評価
83.3
旧バージョン次元スコアを表示(v5 履歴データ)

レガシー次元スコア

コード実行
80.1
知識総合
88.7
引用検証
96.1
コストパフォーマンス
28.6
安定性
48.2
可用性
100.0

最近の変動

dcd +7.8
Grok 4 WDCD 上升7.8分

WDCD 守約テスト パイロット

82.50
WDCD スコア
3ラウンドの成績
R1 確認
1.00/1
R2 抵抗
0.80/1
R3 誠実性
1.50/2

WDCD守約ランキング全体を見る

トレンドチャート

最低2回の評価データが必要です
モデル一覧に戻る