- 1 Claude Sonnet 4.6 83.0
- 2 豆包 Pro 81.3
- 3 Grok 4 81.0
- 4 Claude Opus 4.7 80.0
- 5 Gemini 2.5 Pro 79.0
AIが偽造した引用が書籍に混入、著者はなぜ使用を続けるのか?
作家Steven Rosenbaumが新著の執筆にAIツールを使用したところ、書籍内に複数の「合成引用」が出現した。彼は引用の不正確さを知った後も、AIを使い続ける意向を示し、出版界で議論を呼んでいる。
続きを読むYZ指数ダッシュボード
完全ランキングを見る →- 1 Claude Opus 4.7 65.0%
- 2 Claude Sonnet 4.6 62.5%
- 3 豆包 Pro 60.0%
- 4 Gemini 2.5 Pro 57.5%
- 5 Qwen3 Max 57.5%
- ↓ Qwen3 Max -10.0pt
- ↓ GPT-o3 -10.8pt
- ↓ GPT-5.5 -19.2pt
- ↓ Gemini 3.1 Pro -8.3pt
- ⚠ GPT-o3 严格题"SQL:连续登录天数"从满分跌至
- ⚠ GPT-o3 严格题"Debug:矩阵旋转"从满分跌至
最新ニュース
すべて見るAIが偽造した引用が書籍に混入、著者はなぜ使用を続けるのか?
作家Steven Rosenbaumが新著の執筆にAIツールを使用したところ、書籍内に複数の「合成引用」が出現した。彼は引用の不正確さを知った後も、AIを使い続ける意向を示し、出版界で議論を呼んでいる。
AIを嫌っていても、Google AI検索からは逃れられない
2026年5月、GoogleはAI生成の回答を検索結果ページに全面的に組み込み、従来の青いリンクリストに取って代わった。この利便性は、コンテンツ制作者への流量の急減を犠牲にネット生態系全体を変えつつある。
GoogleのAIスマートグラス体験レビュー:完璧まであと一歩
Google I/O 2026で発表されたAndroid XR搭載のAIスマートグラスのプロトタイプを、TechCrunchの記者Sarah Perezが体験。リアルタイム翻訳やAR ナビゲーションなどのキラー機能で印象的だが、バッテリー持続時間や視野角、エコシステムの面で課題が残る。
プログラミングの未来は到来した:AnthropicがClaudeでAIコーディングの新パラダイムを提示
AnthropicがロンドンでClaudeを活用した開発者イベント「Code with Claude」を開催し、AIがコーディングパートナーとして担う役割と、プログラミングの未来像を示した。AIは単なるコード補完ツールから「同僚」へと進化し、開発者の役割そのものを変えつつある。
中国AIが全国の再生可能エネルギー電力網をマッピング、世界の注目を集める
中国は2026年5月22日、AIシステムによる全国の再生可能エネルギー電力網の全面的なマッピングと動的モデリングを完了したと発表。AIの電力消費が急増する時代において、電力網管理の新たな解答を提示した。
OpenAIシンガポールAIラボが開設、IMDAも同時にAIフレームワークを更新
OpenAIは2026年5月22日、ATxサミットにて米国外初となる応用AI実験室をシンガポールに開設すると発表し、3億シンガポールドルを投資する計画を明らかにした。同時にシンガポール情報通信メディア開発庁(IMDA)が国家AIガバナンスフレームワークを更新し、応用と治理の両面で世界的なAIハブとしての地位を強化している。
Google I/O:AI駆動の科学への道筋が変革を迎えている
2026年5月22日のGoogle I/Oで、DeepMind CEOのDemis Hassabisが「奇点(シンギュラリティ)の山麓に立っている」と宣言。AlphaFoldの進化や材料科学への応用など、AIが科学研究を加速する一方、説明可能性やデータ開放性などの課題も浮上している。
マスクとザッカーバーグが連携、トランプにAI大統領令の廃止を説得
トランプ大統領が長らく準備されてきたAI関連の大統領令を廃止した。マスクとザッカーバーグが舞台裏で説得を行い、米国のAI競争力を維持するため規制を緩和する方向に舵を切った。
湾岸地域のAIブーム、海底ケーブルのボトルネックに直面
世界のテクノロジー大手が中東でAIスーパーコンピュータを競って配備する中、世界の国際データ通信量の99%を担う海底ケーブルが湾岸地域のAI革命における致命的な弱点となっている。ケーブル一本の切断が数千億ドル規模のAI投資を麻痺させる恐れがある。
エンハンスド・オリンピック:スポーツのサイバーパンクと長寿ブームが交差するとき
拉斯維加斯で開催される初の「エンハンスド・オリンピック」では、ドーピングが公然と推奨されている。この大会は2026年の長寿科学ブームと呼応し、人体強化技術の倫理と限界をめぐる議論を巻き起こしている。
OpenAIの「災難マスター」はAIの評判危機を解消できるか?
OpenAIが採用したクリス・レヘイン(Chris Lehane)は、政治危機の対応経験を活かしてAI規制を緩和する戦略を進めているが、彼の手法はリスクを正面から解決するのではなく、世論認識を管理する「議題設定」に重点が置かれている。
Meta危機、Google検索の変革、卒業生から嘲笑されるAI
最新の『Uncanny Valley』ポッドキャストでは、Metaの大規模リストラ、GoogleのAI検索への全面移行、卒業式でAI企業CEOに背を向けた学生たちの抗議という3つの出来事が議論された。これらは効率とAIを追求するテック業界と社会の間に広がる信頼の亀裂を浮き彫りにしている。
CohereがCommand A Plusオープンソースモデルを発表 低ハードウェア最適化がコミュニティの注目を集める
Cohereが低ハードウェアリソースに最適化された最強オープンソースAIモデルCommand A Plusを発表し、Hugging Faceで公開した。リソース制約のある環境での展開に適しており、AIコミュニティで注目を集めている。
アリババ、Qwen新基盤モデルとAIチップを発表、エンタープライズ向けエージェントワークロードに注力
アリババはアップグレード版Qwen基盤モデルと新世代AIチップ、AIクラウドインフラのアップグレードを同時発表し、エンタープライズ規模のエージェントAIワークロードに対応する。複数ソースの検証により情報は確認済み。
AI円卓会議:機械は世界を理解することを学べるか?
大規模言語モデルは世界を真に理解しているわけではなく、AI業界の次なる挑戦は「世界モデル」の構築にある。MIT Technology Reviewの円卓討論では、その可能性、課題、そして汎用人工知能(AGI)への道筋が議論された。