YZ Index
YZ指数 · エンジニアリング判断ランキング
優先順位、技術選定、インシデント分類、人材評価 — AI補助評価、参考用。
サイドボード:AI補助評価、参考用 — このランキングの次元はAI審査員が採点しており、メインボードの計算には含まれません。
| # | モデル | エンジニアリング判断 | コード実行 | メインボード |
|---|---|---|---|---|
| 🥇 | Claude Sonnet 4.6 claude | 86.6 | 83.5 | |
| 🥈 | Claude Opus 4.7 claude | 83.5 | 81.1 | |
| 🥉 | 豆包 Pro doubao | 88.3 | 82.6 | |
| 4 | GPT-o3 gpt | 77.8 | 75.7 | |
| 5 | GPT-5.5 gpt | 75 | 73.2 | |
| 6 | DeepSeek V4 Pro DeepSeek | 85.6 | 77.7 | |
| 7 | Gemini 3.1 Pro gemini | 84.5 | 79.2 | |
| 8 | 文心一言 4.5 ernie | 81.5 | 78.2 | |
| 9 | Qwen3 Max qwen | 80 | 77.2 | |
| 10 | Gemini 2.5 Pro gemini | 79.8 | 78.5 | |
| 11 | Grok 4 grok | 53.7 | 49.2 |