レビュー WDCD 5大シナリオ横断評価:業務ルールが最難関に、ClaudeとDoubaoの偏科差は2点に達する WDCD遵守テストの試験運用データによると、業務ルールシナリオは全モデル共通の弱点となり最高得点はわずか2.5点、一方で安全コンプライアンスシナリオはモデル間の格差を最大に広げる結果となりました。 WDCD 守约测试 场景横评 AI模型选型 5時間前 35