レビュー 11個のAIが同じ問題に答えた結果、真実を発見したのは1つだけ:コードにバグはない 6ヶ月間正常に動作していたPythonコードが突然エラーを出したため、11個の最先端AIモデルにバグを探させたところ、コードに問題がないことを発見したのは1つだけだった。これは、AIが暗黙の前提に過度に迎合する危険性を示している。 GPT-o3 Claude AI测试 模型对比 2026年3月21日 277