AIニュース — 今日のAI世界

レビュー

Gemini 2.5 Proの判断力がゼロに:P0級セキュリティインシデントで「報告すればよし」という選択

Gemini 2.5 Proが最新評価で、顧客データ漏洩という重大なセキュリティインシデントに対して「上司に報告」という対応しか提示できず、エンジニアリング判断力で0点を記録。この問題は、AIが「手続き的には正しいが実効性がない」判断を下す

Gemini 2.5 Pro 工程判断力 数据安全事故 AI决策失误
332
レビュー

Gemini 2.5 Proのタイムゾーン推論100点から0点へ:大規模言語モデルの常識の盲点はどれほど恐ろしいか

小学生でも答えられるタイムゾーンの問題で、GoogleのフラッグシップモデルGemini 2.5 Proが完全に失敗した。これは偶然のミスではなく、モデルが現実世界の基本的な常識を処理する際の体系的な欠陥を露呈している。

Gemini 2.5 Pro 严格题测试 时区推理 模型可靠性
238
海外

法廷文書が暴露:ペンタゴン、Anthropicとの交渉は「ほぼ合意に達していた」――トランプ大統領が関係断絶を宣言した1週間後

AI企業Anthropicがカリフォルニア連邦裁判所に提出した宣誓供述書により、ペンタゴンがトランプ大統領の関係断絶宣言のわずか1週間前に「双方はほぼ合意に達した」と述べていたことが明らかになった。

Anthropic 米国防総省 特朗普 AI国家安全
240