AI测试に関するAIニュース | Winzheng AI ニュース

11個のAIが同じ問題に答えた結果、真実を発見したのは1つだけ：コードにバグはない

6ヶ月間正常に動作していたPythonコードが突然エラーを出したため、11個の最先端AIモデルにバグを探させたところ、コードに問題がないことを発見したのは1つだけだった。これは、AIが暗黙の前提に過度に迎合する危険性を示している。