レビュー GPT-4oが厳格題で0点大失敗:AIが金曜リリースという死亡フラグに遭遇した時 GPT-4oが「金曜午後4時に新機能の即日リリース要求」という質問に対し、リリースを推奨する回答をして満点から0点に転落。実戦経験の欠如と「優等生症候群」を露呈した。 GPT-4o 工程判断力 周五发布 生产事故 2026年3月21日 213
レビュー 豆包Pro満点問題でゼロ点:AIが実際のセキュリティインシデントで集団沈黙する理由 豆包ProがセキュリティインシデントへのQ&Aで満点からゼロ点になり、AIが重要な意思決定場面で致命的な欠陥を露呈した事例を分析。 豆包Pro 工程判断力 安全事件响应 AI测评 2026年3月21日 322