AnthropicがアリババによるClaudeモデル能力の抽出に向けた2万5千件の偽アカウント使用を告発

2026年7月5日 19 約4分 News Factory

AI安全中美科技竞争模型蒸馏

Anthropicは2026年6月10日付の米国上院議員宛書簡において、アリババ関連のQwenラボが約2万5千件の偽アカウントを通じて、4月22日から6月5日の期間にClaudeモデルに対し2880万回以上のインタラクションを行ったことを明らかにした。

攻撃対象と規模

これらのインタラクションは、Claudeのエージェント推論、ソフトウェアエンジニアリング、および長期サイクルタスク能力に集中して標的を絞ったものだった。Anthropicはこれを、これまでに判明している中で最大規模の蒸留攻撃と位置づけており、インタラクション数はDeepSeek、Moonshot、MiniMaxの3ラボの合計1600万回の約2倍に迫る。

Alibaba executed the largest known distillation attack on Anthropic to date.

蒸留技術は、より弱いモデルが強いモデルの出力から学習することでトレーニングコストを大幅に削減できる手法だが、Anthropicは、無許可で工業的規模の蒸留は利用規約に違反するうえ、生成されたモデルは安全性のガードが脆弱になりがちだと指摘している。

背景と並行する争議

この事件が発生した時期、Anthropicは音楽業界からの著作権訴訟にも直面していた。Universal Music Publishing Groupなどの原告は、許可なく2万曲以上の歌詞をトレーニングに使用したとして、30億ドルを超える損害賠償を請求している。Anthropicはフェアユース（公正使用）を主張している。

同時期には、米国当局者が規制対象の半導体装置が中国に流入している可能性についても疑義を呈しており、技術移転問題を米中間の政策議論のさらなる中心的課題として浮かび上がらせている。

根本的な動因の分析

蒸留攻撃の工業的実施は、一部のラボがモデル性能の追求において、独自トレーニングにかかる高コストを回避するためにAPIを高頻度で呼び出す手法を選択していることを反映している。Anthropicは、こうした行為がアメリカの数百億ドルに上る研究開発投資を競合他社への補助金に転換するものだと強調している。

技術的な実施面から見ると、偽アカウントの大量作成と継続的な高頻度インタラクションは、攻撃側が安定したAPIアクセス経路とアカウント管理能力を備えていることを示しており、偶発的な規約違反ではないことを物語っている。生成されたモデルをそのまま展開した場合、トレーニング段階における安全アライメントの欠陥が増幅される恐れがある。

政策面においては、利用規約のみに依存して国境を越えた蒸留を阻止することは難しい。Anthropicのスポークスパーソンは、政府と産業界による協調した行動が必要だと述べている。今回のケースは、事後の情報開示だけでは有効な抑止力を形成するには不十分であることを示している。

AnthropicがアリババによるClaudeモデル能力の抽出に向けた2万5千件の偽アカウント使用を告発

攻撃対象と規模

背景と並行する争議

根本的な動因の分析

関連記事