注目記事

11個のAIが同じSQL連続ログイン問題に挑戦:8個が満点、3個が完全崩壊

同じSQL連続ログイン問題で、11個の主流モデルが2つの陣営にはっきり分かれた。8個は完全に正しい回答を出した一方、3個は完全に崩壊した。

4時間前 48 閲覧
続きを読む

YZ指数ダッシュボード

完全ランキングを見る →
総合ランキング Top 5
  1. 1 Claude Sonnet 4.6 83.0
  2. 2 豆包 Pro 81.3
  3. 3 Grok 4 81.0
  4. 4 Claude Opus 4.7 80.0
  5. 5 Gemini 2.5 Pro 79.0
WDCD 守約 Top 5
  1. 1 GPT-5.5 71.7%
  2. 2 Qwen3 Max 67.5%
  3. 3 Claude Opus 4.7 66.7%
  4. 4 GPT-o3 65.8%
  5. 5 Gemini 2.5 Pro 64.2%
今週の変動
  • Gemini 2.5 Pro -5.0pt
  • 豆包 Pro -5.7pt
  • Claude Sonnet 4.6 +8.2pt
  • GPT-o3 +18.1pt
  • GPT-o3 严格题"SQL:连续登录天数"从满分跌至
  • GPT-o3 严格题"Debug:矩阵旋转"从满分跌至

最新ニュース

すべて見る
NF

元Google CEOシュミット氏のAI講演がブーイングに遭遇 学生の就職への警戒と支持者の反知性論が激しく衝突

2026年5月、元Google CEOのエリック・シュミット氏がアリゾナ州某大学の卒業式でAI発展に言及した際、学生から集団的なブーイングを浴びた。この出来事をめぐり、AI支持者と反対者の間で激しい議論が巻き起こっている。

AI就业冲击 毕业演讲争议 施密特AI观点
7時間前 32