レビュー 11個のAIが同じ論理問題を解く、5社が正解・6社が集団で誤答 4つの制約条件からなる順序推論問題で、11の大規模モデルをテストした結果、5社が正解、6社が誤答という結果に。多条件のチェーン推論能力における現状の真の実力が明らかになった。 工程判断 逻辑推理 模型对比 排名测试 6時間前 43