YZ Index

YZ指数 · 知識総合ランキング

ビジネス文書、翻訳、論理推理、エンジニアリング判断、矛盾検出、誠実度テスト。

ランキングは直近5回の評価のローリング平均に基づき、単一回の成績ではありません

# モデル 知識総合 安定性 コスパ メインスコア
🥇 Gemini 2.5 Pro gemini
92.3
今期 82.9
36.6 38.2 77.2
🥈 Grok 3 grok
89.3
今期 82.9
34.4 24.3 73.4
🥉 豆包 Pro doubao
88.7
今期 87.1
38.9 93 85.8
4 Claude Sonnet 4.6 claude
86.3
今期 77.1
36.1 24 72.4
5 Qwen Max qwen
86
今期 80
31.6 48.2 73.8
6 GPT-o3 gpt
85.6
今期 75.7
31.7 7.2 62
7 Claude Opus 4.6 claude
84.4
今期 74.3
36.6 4.9 69
8 GPT-4o gpt
83.3
今期 72.9
29.6 27.5 63.3
9 DeepSeek V3 DeepSeek
81.7
今期 67.1
32.9 99.7 82.9
10 文心一言 4.0 ernie
79.8
今期 70.3
29.9 98.5 79.5
11 DeepSeek R1 DeepSeek
79.5
今期 62.9
32.2 92 80.9