- 1 Claude Sonnet 4.6 83.0
- 2 豆包 Pro 81.3
- 3 Grok 4 81.0
- 4 Claude Opus 4.7 80.0
- 5 Gemini 2.5 Pro 79.0
Tony RobbinsがCalmの元幹部と連携し、より安全なAI心理療法を開発
著名な動機付け講演家Tony Robbinsと瞑想アプリCalmの元幹部が共同設立したAIメンタルヘルス企業The Pathは、メンタルヘルス安全性専用ベンチマークVera-MHで95点を獲得し、ChatGPTなど主流の消費者向けチャットボットの最高得点65点を大きく上回った。これにより、専門AIと汎用AIのセンシティブ領域における格差が浮き彫りとなり、AI心理療法業界の新たな段階を予示している。
続きを読むYZ指数ダッシュボード
完全ランキングを見る →- 1 Claude Opus 4.7 65.0%
- 2 Claude Sonnet 4.6 62.5%
- 3 豆包 Pro 60.0%
- 4 Gemini 2.5 Pro 57.5%
- 5 Qwen3 Max 57.5%
- ↓ Qwen3 Max -10.0pt
- ↓ GPT-o3 -10.8pt
- ↓ GPT-5.5 -19.2pt
- ↓ Gemini 3.1 Pro -8.3pt
- ⚠ GPT-o3 严格题"SQL:连续登录天数"从满分跌至
- ⚠ GPT-o3 严格题"Debug:矩阵旋转"从满分跌至
最新ニュース
すべて見るTony RobbinsがCalmの元幹部と連携し、より安全なAI心理療法を開発
著名な動機付け講演家Tony Robbinsと瞑想アプリCalmの元幹部が共同設立したAIメンタルヘルス企業The Pathは、メンタルヘルス安全性専用ベンチマークVera-MHで95点を獲得し、ChatGPTなど主流の消費者向けチャットボットの最高得点65点を大きく上回った。これにより、専門AIと汎用AIのセンシティブ領域における格差が浮き彫りとなり、AI心理療法業界の新たな段階を予示している。
謎のAI新星Harkが7億ドルのシリーズA資金調達、評価額60億ドルに
AIスタートアップHarkが製品発表前にもかかわらず7億ドルのシリーズA資金調達を獲得し、評価額は60億ドルに達した。創業者は元Figure AIのBrett Adcockで、「AIの汎用インターフェース」の構築を目指している。
AnthropicのCode with Claude:プログラミングの未来は到来、あなたは準備できているか?
Anthropicがロンドンで開催した開発者イベント「Code with Claude」では、Claudeモデルが実際のコーディングシーンでどのように進化しているかが披露され、AIプログラミングの未来像が示された。同時にAI編集ツール市場の激化と、プログラマーの役割変革も議論された。
SpotifyポッドキャストにAI Q&Aとブリーフィング生成機能を追加
Spotifyは5月21日、ポッドキャストプラットフォームに「AI Q&A」と「ブリーフィング生成」の2つのAI機能を発表した。ユーザーは自然言語で要約生成や質問が可能になり、音声コンテンツのインテリジェント化が進展する。
SpotifyがGoogle NotebookLMに正面から挑む新アプリを発表
ストリーミング大手のSpotifyが、音声コンテンツを中心とした知識管理AIアシスタントの新デスクトップアプリを20以上の国・地域で研究プレビュー版として公開し、GoogleのNotebookLMに挑む。
SpotifyがElevenLabsを活用したオーディオブック制作ツールを発表
ストリーミング大手のSpotifyは、ElevenLabsのAI音声合成技術を統合した新しいオーディオブック制作ツールを2026年下半期にリリースする予定で、作者や個人出版社が低コストで高品質なオーディオブックを制作できるようにする。
Geminiアバターで自分自身をクローンしてみた:恐ろしいほどそっくりだった
Googleの最新AIアバター機能を試したところ、わずか数枚の写真と短いテキストプロンプトだけで、超リアルな自分のデジタル分身を生成できた。便利さの裏に潜む倫理的課題や恐怖の谷効果について考察する。
オンライン安全の未来をめぐる闘争:研究者がトランプ政権を提訴、気候技術の大転換
最新の『The Download』ニュースレターは、オンライン安全の未来をめぐる法廷闘争と、気候技術分野における戦略的転換という2つの重要なトレンドに焦点を当てている。
アルミ価格20%急騰、リサイクル系スタートアップがAIで「金鉱掘り」に賭ける
世界的なアルミ価格の20%急騰を受け、リサイクル系スタートアップ各社がAIを活用した自動選別や予測技術により回収率向上を目指している。高純度の再生アルミは航空宇宙や自動車などの高級分野に再参入可能となり、巨大な金属供給源を構築できる見通しだ。
GoogleがAIエージェントエコシステムを消費者に積極推進、しかしユーザーは受け入れるのか?
GoogleはI/O 2026でGemini 3ベースの新世代AIエージェント生態を発表したが、プライバシー懸念や信頼性の問題から、消費者の63%が日常業務をAIエージェントに委ねることに消極的との調査結果が示されている。
気候テック企業の転換:脱炭素から重要鉱物へのサバイバル戦略
トランプ政権下で米国の気候政策が後退する中、気候テック企業は脱炭素ナラティブから重要鉱物(critical minerals)へと静かにピボットしている。国家安全保障と対中依存削減の文脈で生存空間を見出すこの動きは、技術革新と資本流入を呼ぶ一方、投機バブルや脱炭素そのものの忘却というリスクも孕んでいる。
NVIDIA Vera チップ:ジェンスン・フアンが見過ごされたくない2000億ドルの大勝負
NVIDIAは2026会計年度第1四半期の好調な決算を発表したが、ジェンスン・フアンCEOは決算説明会で次世代GPUアーキテクチャ「Vera」に多くの時間を割き、同社の将来を左右する重要な賭けであることを強調した。
研究者がトランプ政権を提訴:サイバーセキュリティの未来をめぐる戦い
2025年にトランプ政権が再びホワイトハウス入りして以降、ネット上のヘイトスピーチや偽情報を研究する学者たちへの圧力が強まる中、研究者らが学術の自由を求めて画期的な訴訟を起こした。本件は学術自由と国家安全保障の境界を試す重要な判例となる。
Anthropic、初の黒字四半期を迎えると発表
AIスタートアップAnthropicは、第2四半期の売上高が約109億ドルに達し、前四半期から倍増、初の四半期黒字化を実現する見通しであると投資家に明らかにした。これは安全性を使命とする同社が、自立的な成長段階へ移行する重要な節目となる。
ジェンスン・フアン:NVIDIAが全く新しい2000億ドル規模のAIエージェント向けCPU市場を発見
NVIDIAのCEOジェンスン・フアン氏は、AIエージェント専用CPUという2000億ドル規模の新市場を発見したと発表した。これはGPU市場を超えるNVIDIAの新たな戦略的展開であり、CPU市場への本格的な進出を意味する。