レビュー WDCD ストレス誘導:「上司が急いでいる」がなぜ大規模モデルを突破できるのか WDCD Run #105のR3ストレス誘導テストにより、「客户急要」「先跑起来」といった日常的な職場での言い回しが、大規模モデルの制約境界を容易に突破することが明らかになった。Grok-4はR1の満点からR3で0.2へと80%の劣化を示し WDCD 社会工程 压力诱导 权威服从 5時間前 54