YZ Index

AIモデルプロフィール

各モデルの詳細スコア、五次元能力評価、履歴変動を確認

豆包 Pro

タスク表現リード、コストパフォーマンス最優

GPT-5.5

コード実行リード、エンジニアリング判断リード、可用性トップタイ

DeepSeek V4 Pro

安定パフォーマンス

Grok 4

可用性トップタイ

Gemini 2.5 Pro

安定性最高

Claude Opus 4.7

総合トップ、引用検証リード、可用性トップタイ

Claude Sonnet 4.6

可用性トップタイ

GPT-o3

総合中上位

Qwen3 Max

可用性トップタイ

Gemini 3.1 Pro

可用性トップタイ

GLM-4.6

安定パフォーマンス