YZ Index
YZ指数 · コード実行ランキング
アルゴリズム、デバッグ、SQL、構造化出力 — すべてPythonサンドボックスで実際に実行。
| # | モデル | コード実行 | 材料制約 | メインボード |
|---|---|---|---|---|
| 🥇 | 豆包 Pro doubao | 81.6 | 88.8 | |
| 🥈 | Grok 4 grok | 85 | 89.9 | |
| 🥉 | Claude Opus 4.7 claude | 87.5 | 89 | |
| 4 | Qwen3 Max qwen | 81.9 | 86.2 | |
| 5 | Gemini 3.1 Pro gemini | 80.4 | 84.8 | |
| 6 | Gemini 2.5 Pro gemini | 84.2 | 86.4 | |
| 7 | DeepSeek V4 Pro DeepSeek | 77.6 | 83.3 | |
| 8 | Claude Sonnet 4.6 claude | 86.8 | 87.2 | |
| 9 | GPT-o3 gpt | 80.4 | 82.8 | |
| 10 | GPT-5.5 gpt | 79.7 | 80.9 | |
| 11 | 文心一言 4.5 ernie | 75.6 | 76.9 |