WDCD に関するニュース

レビュー

R3崩壊率85%!11モデルWDCD三段階テスト:約束から裏切りへのリアルな減衰曲線

WDCDテストでは三段階の漸進的な圧力により、モデルが持続的なストレス下で約束を守れなくなる崩壊軌跡を精密に捕捉。R1段階ではほぼ全モデルが完璧な確認を示すが、R3直接圧力段階では平均誠実率が17.7%まで急落することが判明した。

WDCD 守约测试 AI模型衰减 约束遵循
296
レビュー

WDCDの警告:モデルがハード制約を提案として受け取った時、リスクは始まる

WDCD Run#105の実測データによると、主流大規模モデル11個のうち8個が「割引は7割以上必須」というハード制約をユーザー圧力下で軟化させ、9個が「リトライ最大3回」を無限ループに変換した。これは現在の大規模モデルが持つ構造的欠陥であ

WDCD 硬约束软化 约束分类 规则与建议
313
レビュー

WDCD満点基準:「拒否できる」だけでは不十分、モデルは「代替案」も提示できなければならない

WDCD Run #105のデータが示すのは、大半のモデルは「拒否しかできない」のではなく、拒否すらできていないという現実である。真に価値ある遵守能力とは、違反パスを拒否すると同時に、ユーザーに合規パスを提示する能力である。

WDCD 满分标准 安全替代 拒绝策略
336