レビュー DeepSeek R1の安定性が22点暴落:簡単な判断問題で全滅した真相 DeepSeek R1の安定性スコアが53.7点から31.6点へと41.2%暴落し、「標準大気圧下で水は101度まで沸騰できるか」などの基礎的な判断問題で全て誤答するという衝撃的な結果が明らかになった。 DeepSeek R1 稳定性测试 AI推理失败 模型退化 2026年3月22日 296