YZ Index

AIモデルプロフィール

各モデルの詳細スコア、五次元能力評価、履歴変動を確認

豆包 Pro

doubao
78.3 #1 / 11
コード実行リード、タスク表現トップタイ、安定性最高

DeepSeek V3

DeepSeek
74.8 #2 / 11
タスク表現トップタイ、コストパフォーマンス最優、可用性トップタイ

文心一言 4.0

ernie
72.0 #3 / 11
タスク表現トップタイ、可用性トップタイ

DeepSeek R1

DeepSeek
70.0 #4 / 11
タスク表現トップタイ、可用性トップタイ

Gemini 2.5 Pro

gemini
69.7 #5 / 11
エンジニアリング判断リード、タスク表現トップタイ、可用性トップタイ

Grok 3

grok
67.7 #6 / 11
総合トップ、引用検証リード、タスク表現トップタイ

Claude Sonnet 4.6

claude
66.2 #7 / 11
タスク表現トップタイ

Qwen Max

qwen
65.4 #8 / 11
タスク表現トップタイ、可用性トップタイ

Claude Opus 4.6

claude
62.8 #9 / 11
タスク表現トップタイ、可用性トップタイ

GPT-4o

gpt
57.2 #10 / 11
タスク表現トップタイ

GPT-o3

gpt
51.5 #11 / 11
タスク表現トップタイ