YZ Index
YZ指数 · コード実行ランキング
アルゴリズム、デバッグ、SQL、構造化出力 — すべてPythonサンドボックスで実際に実行。
| # | モデル | コード実行 | 材料制約 | メインボード |
|---|---|---|---|---|
| 🥇 | 豆包 Pro doubao | 79.4 | 86.4 | |
| 🥈 | Gemini 2.5 Pro gemini | 78.1 | 84.3 | |
| 🥉 | Grok 3 grok | 84.4 | 86.9 | |
| 4 | Claude Opus 4.6 claude | 79.7 | 83.4 | |
| 5 | Claude Sonnet 4.6 claude | 81.1 | 84.1 | |
| 6 | DeepSeek V3 DeepSeek | 77.8 | 80.8 | |
| 7 | DeepSeek R1 DeepSeek | 72.2 | 75.9 | |
| 8 | Qwen Max qwen | 77.3 | 77.9 | |
| 9 | 文心一言 4.0 ernie | 72.3 | 74.9 | |
| 10 | GPT-o3 gpt | 49.2 | 62.5 | |
| 11 | GPT-4o gpt | 57.6 | 65.4 |