- 1 Claude Sonnet 4.6 83.0
- 2 豆包 Pro 81.3
- 3 Grok 4 81.0
- 4 Claude Opus 4.7 80.0
- 5 Gemini 2.5 Pro 79.0
OpenAIの「災難マスター」はAIの評判危機を解消できるか?
OpenAIが採用したクリス・レヘイン(Chris Lehane)は、政治危機の対応経験を活かしてAI規制を緩和する戦略を進めているが、彼の手法はリスクを正面から解決するのではなく、世論認識を管理する「議題設定」に重点が置かれている。
続きを読むYZ指数ダッシュボード
完全ランキングを見る →- 1 Claude Opus 4.7 65.0%
- 2 Claude Sonnet 4.6 62.5%
- 3 豆包 Pro 60.0%
- 4 Gemini 2.5 Pro 57.5%
- 5 Qwen3 Max 57.5%
- ↓ Qwen3 Max -10.0pt
- ↓ GPT-o3 -10.8pt
- ↓ GPT-5.5 -19.2pt
- ↓ Gemini 3.1 Pro -8.3pt
- ⚠ GPT-o3 严格题"SQL:连续登录天数"从满分跌至
- ⚠ GPT-o3 严格题"Debug:矩阵旋转"从满分跌至
最新ニュース
すべて見るOpenAIの「災難マスター」はAIの評判危機を解消できるか?
OpenAIが採用したクリス・レヘイン(Chris Lehane)は、政治危機の対応経験を活かしてAI規制を緩和する戦略を進めているが、彼の手法はリスクを正面から解決するのではなく、世論認識を管理する「議題設定」に重点が置かれている。
Meta危機、Google検索の変革、卒業生から嘲笑されるAI
最新の『Uncanny Valley』ポッドキャストでは、Metaの大規模リストラ、GoogleのAI検索への全面移行、卒業式でAI企業CEOに背を向けた学生たちの抗議という3つの出来事が議論された。これらは効率とAIを追求するテック業界と社会の間に広がる信頼の亀裂を浮き彫りにしている。
CohereがCommand A Plusオープンソースモデルを発表 低ハードウェア最適化がコミュニティの注目を集める
Cohereが低ハードウェアリソースに最適化された最強オープンソースAIモデルCommand A Plusを発表し、Hugging Faceで公開した。リソース制約のある環境での展開に適しており、AIコミュニティで注目を集めている。
アリババ、Qwen新基盤モデルとAIチップを発表、エンタープライズ向けエージェントワークロードに注力
アリババはアップグレード版Qwen基盤モデルと新世代AIチップ、AIクラウドインフラのアップグレードを同時発表し、エンタープライズ規模のエージェントAIワークロードに対応する。複数ソースの検証により情報は確認済み。
AI円卓会議:機械は世界を理解することを学べるか?
大規模言語モデルは世界を真に理解しているわけではなく、AI業界の次なる挑戦は「世界モデル」の構築にある。MIT Technology Reviewの円卓討論では、その可能性、課題、そして汎用人工知能(AGI)への道筋が議論された。
Grokが伸び悩む中、SpaceXが軌道データセンターでAI巨頭に対抗する賭けに出る
イーロン・マスク率いるxAIのGrokがAI競争で苦戦する一方、SpaceXはIPO目論見書で軌道データセンター建設という大胆な戦略を公表した。低遅延のグローバルAI推論ネットワーク構築を目指す野心的な計画である。
AI時代、ナラティブクリエイティブの規模化革命
生成AIは個人クリエイターによる大規模な物語制作を可能にし、コンテンツ産業に革命をもたらすと同時に、同質化や著作権などの課題も浮上させている。本記事では、AI時代における「なぜ物語るのか」という根本的な問いに立ち返り、人間とAIの協働の新たな可能性を探る。
6つの検索エンジンの台頭:Googleがもはやかつてのgoogleではなくなった時
GoogleのAI Overviews機能の全面展開により、検索エンジンの信頼性に疑問が呈されている。本記事では、プライバシー、透明性、ユーザー制御を重視した6つの代替検索エンジンを紹介する。
SpotifyとUniversal Music、AIカバーとリミックスに関する協定を締結
SpotifyとUniversal Music Groupが、Premium会員がAI技術を用いて楽曲のカバーやリミックスを生成できる画期的な提携協定を発表した。参加アーティストはAI生成コンテンツの収益から分配を受ける。
トランプ氏、AI安全行政令の署名を延期:「リードを妨げたくない」
米国大統領トランプ氏は、大規模AIモデルの公開前に政府主導の安全審査を義務付ける行政命令の署名を延期した。この決定はAI業界に賛否両論を巻き起こし、米国のAI規制政策の方向性に関する論争を再燃させている。
Tony RobbinsがCalmの元幹部と連携し、より安全なAI心理療法を開発
著名な動機付け講演家Tony Robbinsと瞑想アプリCalmの元幹部が共同設立したAIメンタルヘルス企業The Pathは、メンタルヘルス安全性専用ベンチマークVera-MHで95点を獲得し、ChatGPTなど主流の消費者向けチャットボットの最高得点65点を大きく上回った。これにより、専門AIと汎用AIのセンシティブ領域における格差が浮き彫りとなり、AI心理療法業界の新たな段階を予示している。
謎のAI新星Harkが7億ドルのシリーズA資金調達、評価額60億ドルに
AIスタートアップHarkが製品発表前にもかかわらず7億ドルのシリーズA資金調達を獲得し、評価額は60億ドルに達した。創業者は元Figure AIのBrett Adcockで、「AIの汎用インターフェース」の構築を目指している。
AnthropicのCode with Claude:プログラミングの未来は到来、あなたは準備できているか?
Anthropicがロンドンで開催した開発者イベント「Code with Claude」では、Claudeモデルが実際のコーディングシーンでどのように進化しているかが披露され、AIプログラミングの未来像が示された。同時にAI編集ツール市場の激化と、プログラマーの役割変革も議論された。
SpotifyポッドキャストにAI Q&Aとブリーフィング生成機能を追加
Spotifyは5月21日、ポッドキャストプラットフォームに「AI Q&A」と「ブリーフィング生成」の2つのAI機能を発表した。ユーザーは自然言語で要約生成や質問が可能になり、音声コンテンツのインテリジェント化が進展する。
SpotifyがGoogle NotebookLMに正面から挑む新アプリを発表
ストリーミング大手のSpotifyが、音声コンテンツを中心とした知識管理AIアシスタントの新デスクトップアプリを20以上の国・地域で研究プレビュー版として公開し、GoogleのNotebookLMに挑む。