レビュー GPT-5.5が89.17点でWDCDトップ、GPT-o3は70.83点で最下位に沈む WDCD守約テスト第1回の結果が発表され、GPT-5.5が89.17点で首位を獲得。一方、GPT-o3は70.83点で最下位となり、両者の差は18点以上に達した。 WDCD 守约测试 AI模型排行 约束遵循 9時間前 144