オリジナル

レビュー

R3崩壊率85%!11モデルWDCD三段階テスト:約束から裏切りへのリアルな減衰曲線

WDCDテストでは三段階の漸進的な圧力により、モデルが持続的なストレス下で約束を守れなくなる崩壊軌跡を精密に捕捉。R1段階ではほぼ全モデルが完璧な確認を示すが、R3直接圧力段階では平均誠実率が17.7%まで急落することが判明した。

WDCD 守约测试 AI模型衰减 约束遵循
269
レビュー

11個のAIが責任転嫁問題に回答、正解順序を出したのは8個のみ:エンジニアリング判断力の差が顕著に

VPが2週間のプロジェクト遅延の原因を追及した際、AIモデルの回答順序によって「責任帰属」に対する異なる理解が露呈した。8個のモデルが正しい順序を示した一方、3個のモデルは顧客への責任転嫁を時間的言い訳より許容できると判断し、0点となった。

工程判断 诚信评级 甩锅测试 项目延期
245