オリジナル 指示の減衰:なぜAIは会話の途中でルールを忘れるのか 本記事では、マルチターン会話においてAIモデルがシステムプロンプトの制約を徐々に無視するようになる「指示の減衰」現象を紹介し、その測定のために設計された新しいベンチマーク「WDCD」と、11の最先端モデルの評価結果を解説します。 instruction decay WDCD AI benchmark multi-turn 5時間前 30