Anthropicがアリババによる2.5万アカウントを使ったClaude抽出を告発——未公開の事件への対応

2026年6月27日 20 約4分 News Factory

AI模型安全数据提取争议中美AI竞争

2026年6月24日から25日にかけて、AnthropicはロイターおよびU.S. Congressに書簡を提出し、アリババ関連組織が約2.5万件の偽アカウントを通じて、4月22日から6月5日の間に2,880万回以上のClaudeとのインタラクションを生成し、その推論・プログラミング能力の蒸留を試みたと告発した。

Claude APIの防護メカニズムの実際の動作

Claudeモデルは多層レート制限と異常検知によって一括呼び出しをブロックしている。今回の攻撃では、2.5万件の分散アカウントに直面した際にこれらのメカニズムが機能しなかったことが明らかになった。各アカウントの1日あたりのインタラクション数は合理的な範囲内に抑えられていたにもかかわらず、累計で2,880万回という総量に達しており、現行の検知が主に単一アカウントの閾値に依存していることを示している。

公式に開示されたインタラクションデータは4月22日から6月5日までの約45日間をカバーしている。攻撃者は推論チェーンとコード生成タスクを重点的に狙い、その出力を蒸留モデルの学習に使用した。これはClaudeが長コンテキストのプログラミングシナリオにおいて高い価値を持つことを示す一方で、分散型の低頻度パターンが防護の対象外であったことも露呈させた。

同種製品との防護比較

OpenAIのGPTシリーズも同様にアカウント認証と行動分析を採用しているが、2025年にはすでにクロスアカウントグラフ検知が導入されている。それに対し、Claudeは2026年6月以前に同様のクロスアカウント関連アルゴリズムを導入しておらず、2.5万件のアカウントが速やかに統合・識別されなかった原因となった。

GoogleのGemini APIは2025年末にデバイスフィンガープリンティングとIPクラスタリング技術を導入し、1日あたりのブロック効率はClaudeの現行方式を上回っている。Claudeの課題は、入口制御よりもコンテンツフィルタリングへの過度な依存にあり、同等の効果を得るための運用コストがより高くなっている。

開発者向け実践的アドバイス

開発者がClaudeのAPIを呼び出す際は、クライアント側でリクエスト署名とデバイスバインディングを追加し、APIキーを直接露出させないようにする必要がある。プログラミングタスクに関しては、プロンプトを分割し、1回のインタラクション内で機密推論チェーン全体が完全に露出されないようにすることを推奨する。

エンタープライズユーザーはローカルプロキシ層を導入し、各呼び出しのメタデータを記録してクロスセッション閾値を設定することができる。1日の総呼び出し数が過去ピーク値の80%に近づいた際には自動的にバックアップモデルへ切り替え、蒸留リスクを低減させることが望ましい。

企業向けリスク管理アドバイス

企業がClaudeサービスを調達する際は、契約に異常検知の対応タイムラインを明記する必要がある。毎月アカウントの使用パターンを監査し、平均値の3倍を超える低頻度・高累計パターンを検知した場合は直ちに凍結することを推奨する。

同時に、企業は自社モデルが同種の抽出脅威にさらされていないかを評価すべきである。Claudeの事件は、公開APIであればいかなるものも攻撃対象となりうることを示しており、内部モデルには出力ウォーターマーキングとアクセスログの暗号化を採用する必要がある。

ロイターの報道によれば、Anthropicは書簡の中で今回の攻撃を既知最大規模のモデル抽出攻撃と明示した。

Anthropicがアリババによる2.5万アカウントを使ったClaude抽出を告発——未公開の事件への対応

Claude APIの防護メカニズムの実際の動作

同種製品との防護比較

開発者向け実践的アドバイス

企業向けリスク管理アドバイス

関連記事