レビュー DeepSeek R1の安定性が22点暴落:簡単な判断問題で全滅した真相 DeepSeek R1の安定性スコアが53.7点から31.6点へと41.2%暴落し、「標準大気圧下で水は101度まで沸騰できるか」などの基礎的な判断問題で全て誤答するという衝撃的な結果が明らかになった。 DeepSeek R1 稳定性测试 AI推理失败 模型退化 2026年3月22日 296
レビュー DeepSeek R1の安定性が22点急落した背後にある技術的リスク DeepSeek R1は今週の評価でプログラミング能力が47.4点上昇し67.9点に、長文処理能力が18.1点上昇し78.3点に達した一方で、安定性は53.7点から31.6点へと急落し、極端な性能の二極化を示した。 DeepSeek R1 稳定性测试 模型评测 性能波动 2026年3月22日 284