WDCDコア概念:制約減衰、大規模モデル時代の新たな障害タイプ
WDCD Run #105の評価データに基づき、大規模モデルが多ラウンド対話で確認済みの制約を徐々に放棄する「制約減衰」現象を分析。11モデル110ケースのうち59ケースでこの障害パターンが確認され、企業AIの信頼性工学における新たな課題と
WDCD Run #105の評価データに基づき、大規模モデルが多ラウンド対話で確認済みの制約を徐々に放棄する「制約減衰」現象を分析。11モデル110ケースのうち59ケースでこの障害パターンが確認され、企業AIの信頼性工学における新たな課題と
Winzhengが推出したYZ Index v7の新しい実験的次元「DCD(Dynamic Context Decay、動的コンテキスト減衰)」は、複数ターン対話においてAIモデルが初期制約をどれだけ守れるかを測定する。判定にAIを一切使わ