AIニュース — 今日のAI世界

Gemini 2.5 Pro 严格题测试时区推理模型可靠性

Gemini 2.5 Proのタイムゾーン推論100点から0点へ：大規模言語モデルの常識の盲点はどれほど恐ろしいか

小学生でも答えられるタイムゾーンの問題で、GoogleのフラッグシップモデルGemini 2.5 Proが完全に失敗した。これは偶然のミスではなく、モデルが現実世界の基本的な常識を処理する際の体系的な欠陥を露呈している。

2026年3月21日 238

文心4.0の一行コードが致命的欠陥を露呈：AIが辞書すら認識できない時

文心一言4.0がPythonの基礎的な辞書内包表記で完全に失敗し、リスト形式で出力した上に謎の数字まで追加するという前代未聞のAI劣化事例が発生した。

文心一言4.0 编程能力代码生成模型退化

2026年3月21日 325

豆包Pro満点問題でゼロ点：AIが実際のセキュリティインシデントで集団沈黙する理由

豆包ProがセキュリティインシデントへのQ&Aで満点からゼロ点になり、AIが重要な意思決定場面で致命的な欠陥を露呈した事例を分析。

豆包Pro 工程判断力安全事件响应 AI测评

2026年3月21日 334

Claude Opus 4.6 工程判断力安全事件响应 AI决策失误

Claude 4.6が崩壊：満点の安全問題で全滅した背後にある致命的欠陥

Claude Opus 4.6が安全事件対応問題で0点を取り、安定性が49.1%まで低下。AIが緊急事態で「教科書的」な回答しかできない構造的問題を露呈した。

2026年3月21日 253

GPT-o3が8.7ポイント急上昇の裏側：今週の11AIモデル評価で明らかになった3つの危険信号

100の評価問題で11の最先端モデルを測定した今週の結果から、AI業界の3つの危険な兆候が浮き彫りになった。安定性の欠如、長文コンテキスト処理能力の集団的後退、そして中国産モデルの台頭だ。

GPT-o3 豆包Pro 模型稳定性长上下文处理

2026年3月21日 223

Amazon AI智能手机市场竞争 Fire Phone

Amazonの新AI搭載スマートフォン：期待できる要素はほとんどない

Amazonが再びスマートフォン市場への参入を計画していると報じられたが、AI機能を搭載した新デバイスは競争の激しい市場で成功する見込みは低い。

2026年3月21日 224

Anthropic、戦争時のAIツール破壊工作の可能性を否定

米国防総省がAI企業Anthropicが戦争時に遠隔でAIツールを破壊・操作できる可能性を指摘したのに対し、Anthropicは技術的に不可能だと強く反論した。

Anthropic AI安全性国防部军事AI

2026年3月21日 250

Anthropic 米国防総省特朗普 AI国家安全

法廷文書が暴露：ペンタゴン、Anthropicとの交渉は「ほぼ合意に達していた」――トランプ大統領が関係断絶を宣言した1週間後

AI企業Anthropicがカリフォルニア連邦裁判所に提出した宣誓供述書により、ペンタゴンがトランプ大統領の関係断絶宣言のわずか1週間前に「双方はほぼ合意に達した」と述べていたことが明らかになった。

2026年3月21日 240

Sora 2.0：生成AIの両刃の剣と規制の課題

Sora 2.0の強力な動画生成能力が世界的な注目を集める一方、偽情報の氾濫という深刻な問題も浮き彫りになり、生成AI技術の規制に対する新たな挑戦となっている。

生成AI 虚假信息技术监管

2026年3月21日 250

Meta Llama 4のオープンソース化が安全性論争を引き起こす：AI民主化かグローバルリスクか？

MetaがLlama 4をオープンソース化したことで、AI技術の民主化と悪用リスクを巡る激しい議論が巻き起こっている。開発者コミュニティは歓迎する一方、セキュリティ専門家は武器化AIの脅威を警告している。

AI开源 Llama4 Meta 安全风险

2026年3月21日 369

Mamba-2 Transformer AI架构斯坦福SAIL

スタンフォードMamba-2アーキテクチャが強力に登場：Transformer覇権が効率革命に直面？

スタンフォードAIラボがMamba-2アーキテクチャを発表し、同規模のTransformerモデルより5倍高速な推論速度を実現。状態空間モデル（SSM）による長シーケンス処理の効率化がTransformer支配体制に初の実質的な挑戦状を突き

2026年3月21日 317

AI药物设计 DeepMind AlphaFold3 临床试验

DeepMind AlphaFold 3が初のAI設計抗がん薬の臨床試験入り：AI創薬における予測から創造への質的転換

DeepMindのAlphaFold 3がゼロから設計した抗がん薬DM-301が第I相臨床試験に入り、AI創薬分野における「ゼロからの設計」の初の成功事例となった。この突破口は、AlphaFold 3が拡散モデルとマルチモーダル融合アーキテ

2026年3月21日 271

プレイヤーがNVIDIA DLSS 5を嫌悪、開発者も不満を表明

NVIDIAの最新AI アップスケーリング技術DLSS 5は、理論上5倍の性能向上を実現するものの、「不気味の谷」現象や画質の劣化により、プレイヤーと開発者双方から強い反発を受けている。

NVIDIA DLSS 5 游戏技术 AI上采样

2026年3月21日 226

英伟达 OpenClaw策略 GTC大会 AIチップ

NvidiaのOpenClaw戦略、あなたの企業は準備できているか？

Nvidia CEOジェンスン・ファンがGTC 2026で発表したOpenClaw戦略は、オープンソースソフトウェア、モジュール式ロボットハードウェア、クラウドAIサービスを統合し、企業がAIロボットを迅速に構築できる包括的フレームワークで

2026年3月21日 286

NVIDIA GTC大会レビュー：NemoClaw、ロボットOlafと1兆ドルのAI賭け

NVIDIA GTCでCEO黄仁勲が2027年までにAIチップ市場が1兆ドルに達すると予測し、生成AIとロボット工学の融合を示すNemoClawやロボットOlafを発表した。

NVIDIA GTC大会 AIチップ机器人

2026年3月21日 439

Microsoft、Windows Copilot AIの肥大化を見直し：Photosなどのアプリでエントリーポイントを大幅削減

MicrosoftはWindows上の一部Copilot機能を削減し、Photos、ウィジェット、メモ帳などのAIエントリーポイントを簡素化する。この変更は、積極的なAI全体統合から、より洗練されたユーザー中心の設計への転換を示している。

微软 Copilot Windows AI优化

2026年3月21日 232

作家がAI疑惑を否定、出版社がホラー小説を緊急撤回

新人ホラー小説『Shadow's Curse』がAI生成疑惑により出版社から撤回されたが、著者は人工創作を主張し続けている。この事件は、AI検出技術の限界と出版業界の新たな課題を浮き彫りにした。

AI生成内容出版业争议恐怖小说作家否认

2026年3月21日 225