YZ Index
YZ指数 · エンジニアリング判断ランキング
優先順位、技術選定、インシデント分類、人材評価 — AI補助評価、参考用。
サイドボード:AI補助評価、参考用 — このランキングの次元はAI審査員が採点しており、メインボードの計算には含まれません。
| # | モデル | エンジニアリング判断 | コード実行 | メインボード |
|---|---|---|---|---|
| 🥇 | Gemini 2.5 Pro gemini | 89.4 | 84.3 | |
| 🥈 | Claude Opus 4.6 claude | 86.5 | 83.4 | |
| 🥉 | 豆包 Pro doubao | 92.2 | 86.4 | |
| 4 | DeepSeek V3 DeepSeek | 83.2 | 80.8 | |
| 5 | Claude Sonnet 4.6 claude | 86.5 | 84.1 | |
| 6 | Grok 3 grok | 88.9 | 86.9 | |
| 7 | GPT-4o gpt | 71.7 | 65.4 | |
| 8 | Qwen Max qwen | 78.4 | 77.9 | |
| 9 | 文心一言 4.0 ernie | 77 | 74.9 | |
| 10 | DeepSeek R1 DeepSeek | 78.9 | 75.9 | |
| 11 | GPT-o3 gpt | 73.4 | 62.5 |