レビュー なぜWDCDはAgent時代の「Crash Test」となるのか WDCD Run#105は11の主流モデルと10題の制約問題による三段階のストレステストで、AI Agentの「衝突試験」を実施した。結果、最高得点でも満点の87%にとどまり、すべてのモデルに明確な構造的欠陥が露呈した。 WDCD 碰撞测试 Agent安全 压力测试 4時間前 58