注目記事

YZ Index 週報：タスク表現能力の集団的向上、Claudeシリーズが材料制約で独自の進展

今週のYZ Index評価システムは、11の主流AIモデル中10モデルが「タスク表現」次元で同時向上するという珍しい現象を捉えました。同時に、Claude Opus 4.6は「材料制約」次元で唯一の突破を果たしました。

18時間前 79 閲覧数

最新ニュース

すべて見る

韓国の男性、AIによる偽の狼動画で5年の禁錮刑に直面：深度偽造規制の世界初の事例か？

韓国でAI技術を用いて偽の狼動画を制作したとして逮捕された男性が、最高5年の禁錮刑に直面している。この事件は、AI技術の悪用と創作の自由の境界についての世界的な議論を引き起こしている。

AI监管深度伪造韩国法律

8時間前 33

米国司法省とxAIが共同でコロラド州のAI反差別法を止める：アルゴリズムの偏見監査は革新の敵か？

米国司法省がxAI社と共にコロラド州のSB24-205法案に対する訴訟に介入し、偏見監査の要求が革新と表現の自由を妨げる可能性があるとの主張を支持しました。これにより、コロラド州政府は一時的に法案の執行を停止しました。

AI监管算法公平 xAI

8時間前 31

グーグルが最大400億ドルのAnthropic投資を発表：Geminiを保有しながらAI競合に大きく賭ける、軍備競争が再びエスカレート

グーグルがAIスタートアップのAnthropicに対して最大400億ドルの投資を発表し、AI分野での軍備競争が新たな段階に突入した。

谷歌Anthropic投资 AI军备竞赛大模型产业格局

18時間前 147

DeepSeek V4オープンソースモデル発表：1.6兆パラメータで100万トークンのコンテキスト、クローズドソースの覇権を覆せるか？

2026年4月25日、中国のAI企業DeepSeekがV4シリーズの大規模モデルを正式にオープンソース化しました。Proバージョンは1.6兆パラメータを持ち、100万トークンのコンテキストウィンドウをサポートします。

DeepSeek V4 开源大模型 AI产品评测

18時間前 348

OpenAIがGPT-5.5を正式に発表、エージェント能力を強化早期のベンチマークテスト結果は一様でない

OpenAIが最新の閉源モデルGPT-5.5を発表しました。このモデルはエージェント能力の強化に焦点を当てており、初期のベンチマークテスト結果にはばらつきが見られます。

GPT-5.5 OpenAI 大模型评测

18時間前 100

SQLの重大な誤り：Claude Sonnet 4.6が満点からゼロ点への反省

Claude Sonnet 4.6は、SQLの課題において満点からゼロ点への大きな変化を経験し、その原因を分析することで、モデルの改善に向けた洞察を得ることができました。

AI性能 SQL评测模型分析

18時間前 85

DeepSeek V3の安定性が21.4ポイント急落：出力の一貫性危機を深く分析

DeepSeek V3は、性能指標の多くが向上し、総合得点が52.9から66.6に上昇する一方で、安定性が大きく低下しました。この「能力向上だが出力不安定」という現象を詳しく分析します。

DeepSeek V3 模型稳定性 AI评测

18時間前 87

豆包Proの安定性が19.8ポイント急落：同一問題に対する異なる回答が最大の弱点に

豆包Proは今週のWinzheng AI評価で、総合得点は16.1ポイント上がったものの、安定性の評価は19.8ポイント下がり、54.5ポイントから34.7ポイントに低下しました。このデータは、同一または類似の問題に対する回答の一貫性を維持する上で直面する深刻な課題を示しています。

豆包Pro 稳定性测试 AI评测

18時間前 83

Sony 'Ace'ロボット、20ミリ秒で卓球の名手に勝利：AI物理応用の新たな高み

Sonyの'Ace'ロボットが、20ミリ秒の反応時間でプロの卓球選手を打ち負かし、AIの物理応用における新たな進展を示しました。この出来事はAI技術のスポーツ分野での潜在的価値を際立たせました。

AI技术机器人乒乓球

19時間前 52

米国が12か国とAI連盟を設立：グローバル技術標準の新たな戦場か？

米国は英国、日本、カナダ、欧州連合を含む12の国と地域と共に「安全AI連盟」（SD-AI Alliance）を発足させました。この動きは、グローバルAI技術標準の制定において地政学的影響力を確立する重要なステップと見なされています。

AI 国际关系技术标准

19時間前 33

DeepSeek、Huaweiチップ上でV4モデルを発表：米中AI技術争端の激化

最近、中国のAI企業DeepSeekがHuaweiのチップ上で最新のV4モデルを発表し、米中間のAI技術争端がさらに激化しました。この動きは、中国がAI分野で技術的独立を目指す重要な試みとされています。

AI技术中美竞争 DeepSeek

19時間前 96

GoogleがGemma 2.0をオープンソース化：1500億パラメータの大規模モデルがMeta Llamaに挑戦

GoogleはI/Oカンファレンスで最新の大規模モデルGemma 2.0をオープンソース化し、1500億パラメータを持つバージョンを発表しました。この動きはMeta Llamaシリーズへの強力な対抗と見なされており、開発者コミュニティの主導権を巡る競争の一環と見られています。

Google AI Gemma 2.0

19時間前 63