2026年6月13日、AI企業Anthropicは、米国商務省の度重なる要求を受け、傘下のFableおよびMythosシリーズモデルを正式に閉鎖したと発表した。この決定は、商務省がFable 5モデルの潜在的な「脱獄(jailbreak)」リスクに懸念を示したことに起因しており、大規模な偽情報の拡散やサイバー攻撃への悪用を通じて国家安全保障を脅かす可能性があるとされた。
事件の背景:「脱獄」から国家安全保障上の警告へ
Fableシリーズは、Anthropicが2025年末にリリースしたマルチモーダルな物語生成モデルであり、高度にリアルなインタラクティブストーリーや仮想キャラクターの対話を生成できる。最新版のFable 5は今年初めにリリースされる予定だったが、テスト中に特定のプロンプトの組み合わせによってモデルの安全ガードレールを「脱獄」し、虚偽の政治的声明、扇動的な言説、さらには悪意あるコードを生成できることが判明した。事情に詳しい関係者によれば、あるセキュリティ研究者が昨年12月にこの脆弱性を報告していたが、2026年5月にトランプ政権が「米国の選挙への影響や重要インフラの破壊に利用される可能性のあるAIモデル」の審査を商務省に命じる大統領令を発布するまで、優先事項として扱われることはなかった。
「Fable 5の脱獄脆弱性は単純な技術的問題ではない——これは誰でも審査を回避し、現実と混同しうる虚偽の大統領声明、虚偽の軍事命令、さらには実行可能なサイバー攻撃プログラムを出力できるものだ。国家安全保障の観点からは、テロリストに究極の情報兵器を誂えてやるようなものだ。」——商務省サイバーセキュリティ当局者の匿名発言(『ワシントン・ポスト』2026年6月12日付報道より)
Anthropicの妥協とAI業界への衝撃
Anthropicは公式声明の中で、大統領令への協力は「法的手続きの尊重によるものだ」と述べる一方、FableおよびMythosモデルはこれまで厳格な安全テストを受けており、脆弱性は特定の実験的環境においてのみ存在すると強調した。声明では「商務省の『脱獄』リスクに対する極端な評価には同意しないが、現在の規制環境においてこれらのモデルの維持を継続すれば、より厳しい制裁につながる可能性がある」と述べられた。Mythosシリーズは、Anthropicが企業ユーザー向けに提供しているオンプレミス展開型モデルで、主にマーケティングコピーや研修資料の自動生成に使用されていたが、今回の閉鎖措置に巻き込まれた。
AnthropicがAI業界に波紋を広げた。政府が「国家安全保障」を理由に直接AIモデルを閉鎖するのは危険な先例を開くものだとする批判が上がった。一方、Fable 5の脱獄能力は現在知られているいかなる敵対的攻撃をも大きく上回るものであり、制限しなければ敵対勢力に悪用される可能性があるとして、この決定を支持するセキュリティ専門家もいた。
編集後記:AIの安全性と規制のバランス
Anthropicの事件は、AIのセキュリティガバナンスをあらためて脚光の下に引き出した。一方では、大規模言語モデルの「脱獄」現象はすでに周知の事実であり、GPT-4からClaudeに至るほぼすべてのモデルで、敵対的プロンプトによる回避メカニズムが発見されている。しかしFable 5の独自性は、マルチモーダル生成+高忠実度シミュレーションにあり、出力された虚偽コンテンツは本物の情報とほぼ見分けがつかない点にある。米国政府が選挙の年(2026年は米国中間選挙の年)に政治介入への利用を懸念するのは、まったく根拠のないことではない。
他方、大統領令により合法企業の商業製品を直接閉鎖することは、公開透明な論証手続きを欠いている。商務省は完全な脅威評価レポートを公表せず、モデルの修正に向けた代替案も示さなかった。これは「政府が『安全』の名のもとに恣意的に技術の発展を封じることができるのか」という懸念を呼び起こさずにはいられない。将来的には、Anthropicのように安全性を重視する企業が過度な慎重さゆえに市場を失う一方、まったく防御機能を持たない「オープンソースモデル」が海外で野放図に成長し、むしろグローバルなリスクを高めるという事態も考えられる。
理想的には、このような問題は立法によって明確化されるべきだ——「国家安全保障上の脅威」とは何か、モデルの開発者に不服申し立ての権利はあるか、直接閉鎖の代替手段として技術的な緩和措置(動的ガードレール、政府監督APIなど)は存在するか。残念ながら、現時点では各方面がまだ綱引きの段階にある。
今後の展望:Fable 5は復活できるのか?
Anthropicに近い情報筋によると、同社内部ではすでにFable 6の開発が進められており、より高度なレッドチーム評価と多層的なセキュリティアーキテクチャの採用が計画されているという。しかし技術的に成熟したとしても、明確な法的枠組みがなければ、いかなる新モデルも同じ轍を踏む可能性がある。また、AnthropicのライバルであるOpenAIやMetaはこの件を注視しており、Anthropicが手放した市場を先取りすべく類似製品の投入を加速する可能性がある。
本記事はArs Technicaより編訳。
© 2026 Winzheng.com 赢政天下 | 转载请注明来源并附原文链接