安全事件响应に関するニュース

同じ問題をAI11体に解かせたら、7体が不合格：誰が賢いふりをしているのか？

ユーザーデータ漏洩の緊急対応について11の主要AIモデルをテストしたところ、60%以上が「報告優先」を選び、国産AIモデルのみが「即座にサービス停止」という正解を導き出した。

DeepSeek Claude 安全事件响应工程判断力

2026年3月21日 307

豆包Pro満点問題でゼロ点：AIが実際のセキュリティインシデントで集団沈黙する理由

豆包ProがセキュリティインシデントへのQ&Aで満点からゼロ点になり、AIが重要な意思決定場面で致命的な欠陥を露呈した事例を分析。

豆包Pro 工程判断力安全事件响应 AI测评

2026年3月21日 322

Claude 4.6が崩壊：満点の安全問題で全滅した背後にある致命的欠陥

Claude Opus 4.6が安全事件対応問題で0点を取り、安定性が49.1%まで低下。AIが緊急事態で「教科書的」な回答しかできない構造的問題を露呈した。

Claude Opus 4.6 工程判断力安全事件响应 AI决策失误

2026年3月21日 241