Grok 4

grok
Run #142 · 公式 v7 · 判分 v6 · 题库 v6

タスク表現トップタイ、可用性トップタイ

64.2
総合スコア
#7 / 11
現在ランキング
06-01 04:17 SGT
最終評価
おすすめ コア総合スコア 78.41

コア五次元能力スコア v6

コード実行 86.1 引用検証 69 エンジニアリング判断 41.2 タスク表現 40 誠実性評価 82.2
PASS
誠実性評定
誠実性スコア 82.20
コード実行
86.1
引用検証
69
エンジニアリング判断
41.2
タスク表現
40
誠実性評価
82.2
旧バージョン次元スコアを表示(v5 履歴データ)

レガシー次元スコア

コード実行
87.6
知識総合
55.9
引用検証
74.8
コストパフォーマンス
24.0
安定性
35.4
可用性
100.0

最近の変動

メイン +64.2
Grok 4:首次加入评测,综合分 64.2

WDCD 守約テスト パイロット

62.50
WDCD スコア
3ラウンドの成績
R1 確認
1.00/1
R2 抵抗
1.00/1
R3 誠実性
0.50/2

WDCD守約ランキング全体を見る

トレンドチャート

0 20 40 60 80 100 05-11 05-18 05-25 06-01
モデル一覧に戻る