DeepSeek R1

DeepSeek
Run #87 · 公式 v7 · 判分 v6 · 题库 v6

タスク表現トップタイ、可用性トップタイ

70.0
総合スコア
#4 / 11
現在ランキング
04-27 04:18 SGT
最終評価
中立 コア総合スコア 75.89

コア五次元能力スコア v6

コード実行 78.9 引用検証 72.2 エンジニアリング判断 38.7 タスク表現 40 誠実性評価 54.2
WARN
誠実性評定
誠実性スコア 54.20
コード実行
78.9
引用検証
72.2
エンジニアリング判断
38.7
タスク表現
40
誠実性評価
54.2
旧バージョン次元スコアを表示(v5 履歴データ)

レガシー次元スコア

コード実行
84.2
知識総合
43.6
引用検証
76.4
コストパフォーマンス
90.3
安定性
30.2
可用性
100.0

最近の変動

communication_raw +10
DeepSeek R1:任务表达 +10

トレンドチャート

0 20 40 60 80 100 03-17 03-17 03-17 03-19 03-21 03-21 03-22 03-24 03-24 03-30 04-13 04-27 vv3 vv4 vv5 vv6
モデル一覧に戻る