YZ Index

YZ指数 · エンジニアリング判断ランキング

優先順位、技術選定、インシデント分類、人材評価 — AI補助評価、参考用。

サイドボード:AI補助評価、参考用 — このランキングの次元はAI審査員が採点しており、メインボードの計算には含まれません。
# モデル エンジニアリング判断 コード実行 メインボード
🥇 Gemini 2.5 Pro gemini
47.2
89.4 84.3
🥈 Claude Opus 4.6 claude
46.3
86.5 83.4
🥉 豆包 Pro doubao
46.3
92.2 86.4
4 DeepSeek V3 DeepSeek
44.3
83.2 80.8
5 Claude Sonnet 4.6 claude
43.8
86.5 84.1
6 Grok 3 grok
43.5
88.9 86.9
7 GPT-4o gpt
41.5
71.7 65.4
8 Qwen Max qwen
40.7
78.4 77.9
9 文心一言 4.0 ernie
39.7
77 74.9
10 DeepSeek R1 DeepSeek
38.7
78.9 75.9
11 GPT-o3 gpt
38.7
73.4 62.5