レビュー WDCDが明らかにする:大規模モデル最大の危険は幻覚ではなく契約違反 WDCD(YZ Index 契約遵守テスト)の実測データは、大規模モデルが規則を理解していながら守らない「契約違反」リスクが、幻覚よりも深刻であることを示した。11の主流モデルのテストで、8つが圧力下で規則を破る結果となった。 WDCD 守约测试 AI幻觉 背约风险 2026年5月8日 233