レビュー AI遵守能力初回テスト:Qwen3-Maxが優勝、11大モデルが圧力下で最も崩壊しやすいのは? YZ Indexが発表したWDCDテスト初回の結果では、Qwen3-Maxが66.67点で首位を獲得した一方、圧力をかけられた多くの大規模モデルが急速に崩壊した。AI誠実性の生死を分ける試練である。 AI守约测试 赢政指数 WDCD AI模型排名 3時間前 19