YZ Index

AIモデル週間変動ランキング

自動スコアリング · 自動変動計算 · 毎週自動更新

2026年第31週 2026年第30週 2026年第29週 2026年第27週 2026年第26週 2026-31 2026-30 2026-29 2026-28 2026-27 2026-26 2026-24 2026-23 2026-22 2026-21 2026-20 2026-19 2026-18 2026-06-15-同日比較

基準: Run #239 · 公式 v7 · 判分 v6.4 · 题库 v7 · 2026-07-20 04:53 SGT 最新: Run #249 · 公式 v7 · 判分 v6.4 · 题库 v7 · 2026-07-27 05:03 SGT

メイン変動総合力 core_overall

GLM-4.6 +10.3

53.2 → 63.5

DeepSeek V4 Pro +5.1

74.5 → 79.6

GPT-o3 +3.6

77.3 → 80.9

Gemini 3.1 Pro +3.5

65.9 → 69.4

Claude Sonnet 4.6 +1.4

75.9 → 77.4

豆包 Pro -7.7

80.0 → 72.3

Grok 4 -4.4

82.2 → 77.8

Claude Opus 4.7 -4.0

83.0 → 79.0

GPT-5.5 -3.5

80.5 → 77.1

Qwen3 Max -3.0

74.1 → 71.1

1 モデルは安定

Gemini 2.5 Pro (74.0)

サイドランキング変動エンジニアリング判断 / タスク表現

Claude Opus 4.7 +9.6

タスク表現: 62.8 → 72.4

DeepSeek V4 Pro +9.0

タスク表現: 86.4 → 95.4

Claude Sonnet 4.6 +7.1

タスク表現: 77.9 → 85.0

GLM-4.6 +3.6

エンジニアリング判断: 25.0 → 28.6

Grok 4 +3.3

エンジニアリング判断: 73.6 → 76.9

Gemini 2.5 Pro +2.5

タスク表現: 80.8 → 83.3

Claude Opus 4.7 +2.2

エンジニアリング判断: 81.7 → 83.9

Qwen3 Max +1.7

エンジニアリング判断: 40.6 → 42.3

豆包 Pro +0.7

エンジニアリング判断: 86.0 → 86.7

GPT-o3 -12.5

タスク表現: 90.8 → 78.3

GLM-4.6 -12.5

タスク表現: 37.5 → 25.0

Qwen3 Max -8.0

タスク表現: 55.8 → 47.8

Gemini 2.5 Pro -7.8

エンジニアリング判断: 79.9 → 72.1

豆包 Pro -7.5

タスク表現: 93.3 → 85.8

Gemini 3.1 Pro -4.1

エンジニアリング判断: 81.9 → 77.8

DeepSeek V4 Pro -3.9

エンジニアリング判断: 88.4 → 84.5

Claude Sonnet 4.6 -2.8

エンジニアリング判断: 86.0 → 83.2

Gemini 3.1 Pro -2.5

タスク表現: 78.3 → 75.8

GPT-o3 -1.1

エンジニアリング判断: 87.4 → 86.3

運用信号変動安定性 / 可用性 / コストパフォーマンス

GLM-4.6 +8.6

コストパフォーマンス: 28.0 → 36.6

GLM-4.6 +5.7

可用性: 55.1 → 60.8

GPT-o3 +4.8

安定性: 35.1 → 39.9

GLM-4.6 +3.8

安定性: 32.6 → 36.4

DeepSeek V4 Pro +2.8

安定性: 41.5 → 44.3

Gemini 2.5 Pro +1.2

可用性: 90.8 → 92.0

DeepSeek V4 Pro +1.1

可用性: 95.9 → 97.0

DeepSeek V4 Pro +1.1

コストパフォーマンス: 43.8 → 44.9

Claude Sonnet 4.6 +0.9

安定性: 30.6 → 31.5

Claude Opus 4.7 -6.8

安定性: 39.1 → 32.3

GPT-5.5 -5.6

安定性: 40.4 → 34.8

豆包 Pro -5.4

安定性: 39.4 → 34.0

Gemini 2.5 Pro -4.6

安定性: 43.6 → 39.0

豆包 Pro -2.3

コストパフォーマンス: 94.5 → 92.2

Qwen3 Max -2.3

コストパフォーマンス: 48.2 → 45.9

豆包 Pro -2.0

可用性: 99.0 → 97.0

GPT-o3 -2.0

可用性: 99.0 → 97.0

Grok 4 -1.4

コストパフォーマンス: 26.5 → 25.1

Gemini 2.5 Pro -1.3

コストパフォーマンス: 39.4 → 38.1

GPT-5.5 -1.0

コストパフォーマンス: 19.9 → 18.9

Grok 4 -1.0

安定性: 33.6 → 32.6

Qwen3 Max -0.5

安定性: 24.7 → 24.2

旧バージョンの次元変動を表示（v5 後方互換データ）

3 上昇

8 下降

0 安定

今週上昇

GLM-4.6 +21.9

GLM-4.6：代码执行 +21.9

DeepSeek V4 Pro +9

DeepSeek V4 Pro：任务表达 +9

Claude Sonnet 4.6 +7.1

Claude Sonnet 4.6：任务表达 +7.1

今週下降

GPT-o3 -12.5

GPT-o3：任务表达 -12.5

Claude Opus 4.7 -9.8

Claude Opus 4.7：代码执行 -9.8

Qwen3 Max -8

Qwen3 Max：任务表达 -8

Gemini 2.5 Pro -7.8

Gemini 2.5 Pro：工程判断 -7.8

Gemini 3.1 Pro：工程判断 -4.1

AIモデル週間変動ランキング

メイン変動 総合力 core_overall

サイドランキング変動 エンジニアリング判断 / タスク表現

運用信号変動 安定性 / 可用性 / コストパフォーマンス

今週上昇

今週下降

メイン変動総合力 core_overall

サイドランキング変動エンジニアリング判断 / タスク表現

運用信号変動安定性 / 可用性 / コストパフォーマンス