YZ Index

YZ指数 · コード実行ランキング

アルゴリズム、デバッグ、SQL、構造化出力 — すべてPythonサンドボックスで実際に実行。

# モデル コード実行 材料制約 メインボード
🥇 豆包 Pro doubao
94.6
81.6 88.8
🥈 Grok 4 grok
93.9
85 89.9
🥉 Claude Opus 4.7 claude
90.3
87.5 89
4 Qwen3 Max qwen
89.7
81.9 86.2
5 Gemini 3.1 Pro gemini
88.4
80.4 84.8
6 Gemini 2.5 Pro gemini
88.1
84.2 86.4
7 DeepSeek V4 Pro DeepSeek
87.9
77.6 83.3
8 Claude Sonnet 4.6 claude
87.6
86.8 87.2
9 GPT-o3 gpt
84.8
80.4 82.8
10 GPT-5.5 gpt
81.9
79.7 80.9
11 文心一言 4.5 ernie
78
75.6 76.9