注目記事

OpenAIの「災難マスター」はAIの評判危機を解消できるか?

OpenAIが採用したクリス・レヘイン(Chris Lehane)は、政治危機の対応経験を活かしてAI規制を緩和する戦略を進めているが、彼の手法はリスクを正面から解決するのではなく、世論認識を管理する「議題設定」に重点が置かれている。

WD 5時間前 56 閲覧
続きを読む

YZ指数ダッシュボード

完全ランキングを見る →
総合ランキング Top 5
  1. 1 Claude Sonnet 4.6 83.0
  2. 2 豆包 Pro 81.3
  3. 3 Grok 4 81.0
  4. 4 Claude Opus 4.7 80.0
  5. 5 Gemini 2.5 Pro 79.0
WDCD 守約 Top 5
  1. 1 Claude Opus 4.7 65.0%
  2. 2 Claude Sonnet 4.6 62.5%
  3. 3 豆包 Pro 60.0%
  4. 4 Gemini 2.5 Pro 57.5%
  5. 5 Qwen3 Max 57.5%
今週の変動
  • Qwen3 Max -10.0pt
  • GPT-o3 -10.8pt
  • GPT-5.5 -19.2pt
  • Gemini 3.1 Pro -8.3pt
  • GPT-o3 严格题"SQL:连续登录天数"从满分跌至
  • GPT-o3 严格题"Debug:矩阵旋转"从满分跌至

最新ニュース

すべて見る
TC

Tony RobbinsがCalmの元幹部と連携し、より安全なAI心理療法を開発

著名な動機付け講演家Tony Robbinsと瞑想アプリCalmの元幹部が共同設立したAIメンタルヘルス企業The Pathは、メンタルヘルス安全性専用ベンチマークVera-MHで95点を獲得し、ChatGPTなど主流の消費者向けチャットボットの最高得点65点を大きく上回った。これにより、専門AIと汎用AIのセンシティブ領域における格差が浮き彫りとなり、AI心理療法業界の新たな段階を予示している。

AI心理治疗 Tony Robbins Vera-MH
15時間前 47
MIT

AnthropicのCode with Claude:プログラミングの未来は到来、あなたは準備できているか?

Anthropicがロンドンで開催した開発者イベント「Code with Claude」では、Claudeモデルが実際のコーディングシーンでどのように進化しているかが披露され、AIプログラミングの未来像が示された。同時にAI編集ツール市場の激化と、プログラマーの役割変革も議論された。

AI编程 Claude Anthropic
15時間前 59