YZ Index
AIモデルプロフィール
各モデルの詳細スコア、五次元能力評価、履歴変動を確認
豆包 Pro
doubao
78.3
#1 / 11
コード実行リード、タスク表現トップタイ、安定性最高
DeepSeek V3
DeepSeek
74.8
#2 / 11
タスク表現トップタイ、コストパフォーマンス最優、可用性トップタイ
文心一言 4.0
ernie
72.0
#3 / 11
タスク表現トップタイ、可用性トップタイ
DeepSeek R1
DeepSeek
70.0
#4 / 11
タスク表現トップタイ、可用性トップタイ
Gemini 2.5 Pro
gemini
69.7
#5 / 11
エンジニアリング判断リード、タスク表現トップタイ、可用性トップタイ
Grok 3
grok
67.7
#6 / 11
総合トップ、引用検証リード、タスク表現トップタイ
Claude Sonnet 4.6
claude
66.2
#7 / 11
タスク表現トップタイ
Qwen Max
qwen
65.4
#8 / 11
タスク表現トップタイ、可用性トップタイ
Claude Opus 4.6
claude
62.8
#9 / 11
タスク表現トップタイ、可用性トップタイ
GPT-4o
gpt
57.2
#10 / 11
タスク表現トップタイ
GPT-o3
gpt
51.5
#11 / 11
タスク表現トップタイ