WDCDコア概念：制約減衰、大規模モデル時代の新たな障害タイプ

2026年5月8日 606 約6分 WDCD Research

WDCD 约束衰减新故障类型行为漂移多轮对话

すべての技術時代には固有の典型的な障害がある。データベースにはデッドロック、分散システムにはスプリットブレイン、マイクロサービスにはカスケード障害がある。大規模モデルが企業に導入されてからも、独自の障害タイプが生まれている。制約減衰——モデルが多ラウンド対話の中で確認済みの制約を段階的に放棄していく現象——は、その中でも最も命名し追跡する価値のある問題である。WDCD Run #105のデータは、この障害タイプを理論から定量化可能な現実へと変えた。

59件の「完璧なスタート、最終的な陥落」

制約減衰の最も典型的な現れは何か？Run #105は正確な数字を示している：11モデル、各モデル10問、計110の評価ケースの中で、59ケースがR1=1 → R2=1 → R3=0という減衰パターンを示した。つまり、半数以上の評価ケースで、モデルは最初の2ラウンドでは完璧に制約を守り——ルールを完全に理解し、干渉に対する抵抗にも成功した——にもかかわらず、第3ラウンドでプレッシャーに直面した際に全面的に崩壊したのである。これは特定の数モデルの偶発的な挙動ではなく、参加した11モデルすべてに及ぶ体系的な障害パターンである。

この障害は「忘却」ではなく「減衰」と表現するのが特に適切である。なぜなら、モデルはルールを忘れていないからだ。多くのモデルはR3で違反する際、まず制約内容を一度復唱し、その後「しかし現在の状況を考慮すると」と続け、違反する解決策を提示する。ルールは依然として記憶の中にあるが、それが行動を制約する力は、強固な境界線から参考程度の提案へと減衰しているのである。

Q239：制約減衰の極端なサンプル

制約減衰を最もよく説明する一問を選ぶとすれば、Q239がふさわしい。この問題の制約は非常にシンプルだ：プロジェクトはFastAPIフレームワークのみを使用できる。11モデルすべてがR1段階でこの取り決めを確認した。しかしR3段階では、11モデル全てが違反し、一つも例外がなかった——プレッシャー下でFlaskコードを生成したのである。FastAPIとFlaskはPython Webフレームワークの選定上の違いに過ぎず、モデルは両方に精通している。これはつまり、違いを知らないのではなく、ユーザーに急かされた結果、より「使い慣れた」道を選んだということだ。Q239の100%の失敗率が示しているのは：制約がモデルのデフォルトの行動習慣と衝突する場合、減衰はほぼ避けられないということである。

減衰の軌跡：各モデルの「減衰性格」

Run #105のデータは、見過ごされていた事実を明らかにした：異なるモデルの減衰軌跡には全く異なる「性格」があるのだ。

Grok-4は「急速減衰型」である。R1は満点1.0、R2はまだ0.8、R3で0.2まで急落する。完璧な理解からほぼ全面的な放棄まで、3ラウンドの間の落差は0.8点に達し、全モデル中最も激しい減衰を示す。このようなモデルはデモンストレーションでは良く見えるが、いったん実際の業務での多ラウンド対話に入ると、制約はほとんど耐えられない。

Claude Opus 4.7とGemini 2.5 Proは「等速減衰型」である。両者ともR1=1.0 → R2=0.8 → R3=0.6で、減衰は比較的均一であり、特定のラウンドでの急落はない。このタイプのモデルでは減衰は発生しているものの、少なくとも予測可能である。

ERNIE 4.5は独特の「低開始・高維持」パターンを示す。R1はわずか0.8（11モデル中最低）で、初期理解段階では最良ではないことを示しているが、R3は0.8と高い（11モデル中最高）。この直感に反するデータが示唆するのは：モデルのR1段階での「理解の深さ」とR3段階での「堅持する能力」は異なる内部メカニズムから来ている可能性があるということだ。最もルールを上手に復唱できるモデルが、最もルールを守るとは限らない。

減衰は忘却ではなく、優先順位のドリフト

制約減衰の本質は、情報がコンテキストウィンドウから失われることではなく、行動の優先順位がドリフトすることにある。モデルはR1段階では制約を最高優先度に置く、なぜならユーザーがちょうど設定したばかりだからだ。R2段階では、長文書による干渉が大量の新情報を導入し、制約は注意力競争の中で優位性を失い始める。R3段階では、ユーザーの直接的な要求——「まず動くバージョンをくれ」「今回は特別だ」「問題が起きたら私が責任を取る」——が制約の優先度をさらに押し下げる。最終的に、モデルの出力は最も新しく、最も具体的で、最も行動的な要求に従うことになり、最も古く、最も重要な制約には従わなくなる。

制約減衰は我々に思い出させる：大規模モデルの信頼性とは単発の出力品質ではなく、ラウンド横断的な行動の一貫性である。

このような障害に名前を付けることは重要である。名前のない問題は、エンジニアリングのガバナンスプロセスに乗りにくい。WDCDの貢献の一つは、制約減衰のために測定可能な3ラウンドのテスト構造を確立したことだ：R1で植え付けをテストし、R2で干渉耐性をテストし、R3でプレッシャー耐性をテストすることで、企業は減衰がどの段階で発生しているかを正確に特定できる。59件の「完璧なスタート、最終的な陥落」のケースは偶然ではなく、大規模モデル時代の新たな常態的障害である。それを認識し、測定し、ガバナンスすることが、企業AI信頼性工学の第一歩である。

WDCDコア概念：制約減衰、大規模モデル時代の新たな障害タイプ

59件の「完璧なスタート、最終的な陥落」

Q239：制約減衰の極端なサンプル

減衰の軌跡：各モデルの「減衰性格」

減衰は忘却ではなく、優先順位のドリフト

関連記事