AI评测に関するニュース

GPT-o3が91.29点で首位：2026-07-27 YZ Index Smoke速報データブリーフィング

2026年7月27日実施のYZ Index Smoke速測では11モデルを対象に評価が行われ、GPT-o3が91.29点で当日首位を獲得した。本速報はコード実行と資料制約の2次元のみをカバーする1日10問の小規模テストであり、短期シグナルの

赢政指数 Smoke快测 AI评测模型排名

10時間前 126

DeepSeek V4 Pro が83.23点で首位：2026年7月26日 YZ Index Smoke クイックテスト速報

2026年7月26日のYZ Index Smokeクイックテストでは10モデルを対象に評価が行われ、DeepSeek V4 Proが83.23点で当日首位を獲得した。コード実行とマテリアル制約の2次元で構成される本テストは、短期シグナルの観

赢政指数 Smoke快测 AI评测模型排名

Claude Sonnet 4.6とGrok 4が96.98点で同率首位：2026年7月25日 Smokeクイックテストデータ速報

2026年7月25日のYZ Index Smokeクイックテストでは、11モデルを対象に評価が実施され、Claude Sonnet 4.6とGrok 4が96.98点で同率首位となった。本テストはコード実行と資料制約の2次元のみを対象とした

赢政指数 Smoke快测 AI评测模型排名

Grok 4が84.21点で首位：2026年7月24日 YZ Index Smoke速報データブリーフィング

2026年7月24日のYZ Index Smoke速測では10モデルを対象に評価が行われ、Grok 4が84.21点で当日首位を獲得した。Smoke速測は毎日10問の小規模テストであり、短期シグナルの観測に適している。

赢政指数 Smoke快测 AI评测模型排名

Claude Opus 4.7が96.99点で首位：2026-07-23 YZ Index Smoke速報データブリーフィング

2026年7月23日のYZ Index Smoke速測では11モデルを対象に評価が行われ、Claude Opus 4.7が96.99点で当日首位を獲得した。本速測はコード実行と資料制約の2次元のみをカバーする小サンプルの日次シグナルである。

赢政指数 Smoke快测 AI评测模型排名

Grok 4が98.35点で首位：2026年7月22日 YZ Index Smoke速報データ

2026年7月22日のYZ Index Smoke速測では11モデルを対象に評価が行われ、Grok 4が98.35点で当日首位を獲得した。Smokeは1日10問の速測であり、短期的なシグナルの観測に適している。

赢政指数 Smoke快测 AI评测模型排名

Claude Sonnet 4.6とGPT-o3が96.27点で同率首位：2026-07-21 Smokeクイックテストデータ速報

2026年7月21日実施のYZ Index Smokeクイックテストで、Claude Sonnet 4.6とGPT-o3が96.27点で同率首位を獲得。11モデルを対象に代码执行とマテリアル制約の2次元で評価が行われた。

赢政指数 Smoke快测 AI评测模型排名

Claude Opus 4.7が100点で首位：2026-07-20 YZ Index Smoke クイックテストデータレポート

2026年7月20日のYZ Index Smokeクイックテストでは11モデルを対象に評価が行われ、Claude Opus 4.7がすべての次元で満点を獲得し当日首位となった。一方、Gemini 2.5 Pro・Qwen3 Max・Clau

赢政指数 Smoke快测 AI评测模型排名

2026年7月20日 182

Claude Opus 4.7が95.19点で首位：2026-07-19 YZ Index Smoke速報データブリーフィング

2026年7月19日のYZ Index Smoke速測では、10モデルを対象にClaude Opus 4.7が95.19点で当日首位を獲得した。Smokeは1日10問の速測であり、短期シグナルの観察に適しており、Full週間ランキングの結論

赢政指数 Smoke快测 AI评测模型排名

2026年7月19日 230

GPT-o3が80.61点でトップ：2026-07-18 YZ Index Smoke快速テストデータ速報

2026年7月18日のYZ Index Smoke快速テストでは11モデルを対象に評価を実施し、GPT-o3が80.61点で当日首位となった。本テストはコード実行と資料制約の2次元で評価する毎日10問の小規模テストであり、短期シグナルの観察

赢政指数 Smoke快测 AI评测模型排名

2026年7月18日 221

Gemini 2.5 Pro と Gemini 3.1 Pro が92.44点で並列首位：2026-07-17 Smokeクイックテストデータ速報

2026-07-17のYZ Index Smokeクイックテストでは11モデルを評価し、Gemini 2.5 ProとGemini 3.1 Proが92.44点で並列首位となった。本速報は1日10問のクイックテストによる短期シグナル観測を目

赢政指数 Smoke快测 AI评测模型排名

2026年7月17日 219

Grok 4が94.15点で首位：2026-07-16 YZ Index Smoke速報データブリーフィング

2026-07-16のYZ Index Smoke速報（9モデル対象）では、Grok 4が94.15点で当日首位を獲得。Smokeは毎日10問の速報テストであり、短期シグナルの観察に適しているが、Fullウィークリーランキングの結論とは同等

赢政指数 Smoke快测 AI评测模型排名

2026年7月16日 370

Claude Opus 4.7・Gemini 2.5 Pro・GPT-5.5が同率100点：2026-07-15 YZ Index Smoke速報データブリーフ

2026年7月15日のYZ Index Smokeクイックテストでは、Claude Opus 4.7、Gemini 2.5 Pro、GPT-5.5の3モデルが100点満点で並び当日首位となった。本テストはコード実行と資料制約の2次元のみをカ

赢政指数 Smoke快测 AI评测模型排名

2026年7月15日 266

DeepSeek V4 Proが91.46点で首位：2026年07月14日 YZ Index Smoke速報データブリーフ

2026年7月14日のYZ Index Smoke速測では11モデルを対象に評価が行われ、DeepSeek V4 Proが91.46点で当日首位を獲得した。Smokeは毎日10問の速測であり、短期シグナルの観察に適しているが、Full週間ラ

赢政指数 Smoke快测 AI评测模型排名

2026年7月14日 268

Gemini 2.5 Proが100点で首位：2026-07-13 YZ Index Smoke快速テストデータ速報

2026年7月13日のYZ Index Smoke快速テストでは10モデルを対象に評価が行われ、Gemini 2.5 Proがコード実行・資料制約ともに満点の100点を獲得し当日首位となった。一方、Qwen3 MaxやClaude Sonn

赢政指数 Smoke快测 AI评测模型排名

2026年7月13日 229

Claude Opus 4.7・Claude Sonnet 4.6・DeepSeek V4 Pro・Grok 4が96.99点で並列首位：2026-07-12 YZ Index Smoke速報データブリーフ

2026年7月12日のYZ Index Smoke速測では11モデルを対象に評価が行われ、Claude Opus 4.7、Claude Sonnet 4.6、DeepSeek V4 Pro、Grok 4が96.99点で当日首位に並んだ。一方

赢政指数 Smoke快测 AI评测模型排名

2026年7月12日 253

Claude Opus 4.7・Claude Sonnet 4.6・GPT-o3が81.44点で並列1位：2026-07-11 Smokeクイックテストデータ速報

2026年7月11日のYZ Index Smokeクイックテストでは11モデルを対象に評価が実施され、Claude Opus 4.7・Claude Sonnet 4.6・GPT-o3が81.44点で当日首位に並んだ。本テストはコード実行と資

赢政指数 Smoke快测 AI评测模型排名

2026年7月11日 223

GPT-o3が86.9点で首位：2026-07-10 Smoke速報データブリーフィング

2026年7月10日のWinzheng YZ Index Smoke速報では、9モデルを対象に評価を実施し、GPT-o3が86.9点で当日首位を獲得した。Claude Opus 4.7やClaude Sonnet 4.6など複数モデルで大幅

赢政指数 Smoke快测 AI评测模型排名

2026年7月10日 275

Claude Opus 4.7が90.51点でトップ：2026-07-09 Smokeクイックテストデータ速報

2026年7月9日のWinzheng YZ Index Smokeクイックテストでは、10モデルを対象に評価が行われ、Claude Opus 4.7が90.51点で当日首位を獲得した。コード実行と資料制約の両次元でバランスの取れたスコアを記

赢政指数 Smoke快测 AI评测模型排名

2026年7月9日 226

DeepSeek V4 Pro が95.19点で首位：2026-07-08 Smoke 速報データブリーフィング

2026年7月8日のWinzheng YZ Index Smoke速報では、10モデルを対象に評価を実施し、DeepSeek V4 Proが95.19点で当日首位を獲得した。Smokeは毎日10問の速報テストであり、短期シグナルの観察に適し

赢政指数 Smoke快测 AI评测模型排名

2026年7月8日 326