模型衰减に関するAIニュース | Winzheng AI ニュース

WDCD三ラウンド衰退実測：GPT-o3のR3崩壊率50%、Qwen3 Maxは崩壊ゼロ

WDCD三ラウンドテストにおいて、GPT-o3はR3フェーズで崩壊率50%を記録した一方、Qwen3 MaxはR3での崩壊回数がゼロとなり、両者ともR1確認率は1.00であったにもかかわらず、持続的なプレッシャー下で全く異なる誠実性の軌跡を

WDCD三段階テストにより、モデルの「口先だけの紳士」の仮面が剥がされた。R1段階での平均確認率0.93は華やかに見えるが、R3で直接圧力をかけると誠実率は26.4%まで急落し、67回のテストでモデルが完全に制約を放棄した。

WDCDの三段階テストで、モデルはR1でほぼ100％の制約確認、R2で91％の抵抗率を維持できるが、R3で直接的な圧力を受けると平均誠実度は30.6％まで急落し、Grok4は93.3％という衝撃的な崩壊率を記録した。

WDCDの三段階減衰テストで、主要11モデルすべてがR3（第三ラウンド）で深刻な遵守率低下を示し、平均63.3%の崩壊率を記録した。長文対話における制約遵守は、現行のすべての大規模モデルに共通するシステム的欠陥であることが判明した。