DeepSeek V3
DeepSeek
Run #87 · 公式 v7 · 判分 v6 · 题库 v6
タスク表現トップタイ、コストパフォーマンス最優、可用性トップタイ
74.8
総合スコア
#2 / 11
現在ランキング
04-27 04:18 SGT
最終評価
中立
コア総合スコア 80.77
コア五次元能力スコア v6
WARN
誠実性評定
誠実性スコア 59.20
コード実行
83.2
引用検証
77.8
エンジニアリング判断
44.3
タスク表現
40
誠実性評価
59.2
旧バージョン次元スコアを表示(v5 履歴データ)
レガシー次元スコア
コード実行
89.1
知識総合
47.2
引用検証
83.1
コストパフォーマンス
99.7
安定性
32.8
可用性
100.0
最近の変動
communication_raw
+10
DeepSeek V3:任务表达 +10