AnthropicがClaude Fable 5を再起動、サイバーセキュリティ制限を新たに追加——2026年7月2日に世界展開

2026年7月3日 33 約3分 News Factory

Anthropic Claude Fable 5 AI安全出口管制

2026年7月1日、AnthropicはClaude Fable 5が翌日に世界で再公開されると発表した。以前、米国政府の輸出規制により停止されていた同モデルには、サイバーセキュリティ関連タスクをブロックする分類器が新たに追加され、通常のコーディングデバッグはOpus 4.8にフォールバックする仕様となった。同時に、Amazon・Microsoft・GoogleとのGlasswingフレームワークを始動し、AIジェイルブレイクの深刻度を評価するとともに、米国政府とのモデルテスト協力体制を強化する。

政策的圧力下での技術的妥協

米国の輸出規制によりモデルが停止され、再公開後はサイバーセキュリティタスクを対象とした分類器が追加された。通常のコーディングデバッグはOpus 4.8に移行する。Glasswingフレームワークには複数のテクノロジー企業が参加し、ジェイルブレイク試行の深刻度を定量化する。

モデルの公開日と分類器の展開は同時に実施され、規制要件が製品リリースプロセスに組み込まれた形となっている。

機能制限による実際への影響

サイバーセキュリティタスクがブロックされることで、開発者はモデルバージョンを手動で切り替える必要が生じる。Opus 4.8は基本的なデバッグには対応できるが、複雑なシナリオにおける応答速度と精度について公開された比較データは存在しない。Glasswingフレームワークの導入により、評価基準が単一企業から多者協調へと移行し、モデルの反復サイクルが長期化する。今後のアップデートには外部審査が必要となる。

多者協調フレームワークの運用ロジック

Amazon・Microsoft・GoogleはGlasswingに参加し、AIジェイルブレイクの深刻度を評価する。ジェイルブレイク事例のデータ共有により統一リスク評価基準の構築が求められる。Fable 5の分類器はすべての高リスク入力ではなくサイバーセキュリティ関連の指令を優先的にブロックしており、目的を絞った制限であることが示されている。政府とのテスト協力については具体的なプロジェクトが開示されていないものの、公開スケジュールは2026年7月2日に固定されている。

独自の評価

Fable 5の再起動は規制コンプライアンスの要件を満たしているが、タスクのフォールバックにより実際の使い勝手は低下している。安全措置には明確な根拠があり、バランスは全面的な機能回復よりも制限側に傾いている。Glasswingが定量的な基準を生み出せば、業界全体で統一されたセキュリティインターフェースの普及を促進する可能性がある。

AnthropicがClaude Fable 5を再起動、サイバーセキュリティ制限を新たに追加——2026年7月2日に世界展開

政策的圧力下での技術的妥協

機能制限による実際への影響

多者協調フレームワークの運用ロジック

独自の評価

関連記事