レビュー 11個のAIが同じ論理問題に挑戦、3個が誤答し推論のブラックホールを露呈 5人の順位付けという簡単な論理問題で、DeepSeek V3を含む3つのAIモデルが基本的な制約条件を無視して誤答し、現在のAI推論能力の深刻な脆弱性を露呈した。 DeepSeek Grok 逻辑推理 模型评测 2026年3月21日 434