AI画像生成の著作権をめぐる嵐:Midjourney、アーティストらに提訴される 訓練データの合法性が焦点に

ニュースリード

AI生成アートツールの急速な発展に伴い、創作権と技術革新をめぐる激しい論争が世界規模で勃発している。先日、複数の著名アーティストが米国カリフォルニア州の裁判所で画像生成プラットフォームMidjourneyを集団提訴し、同社がAIモデルの訓練時に彼らの芸術作品を大規模に無断使用し、許可なくデータセットに組み込んだと主張した。この事件は瞬く間にXプラットフォームのトレンド入りを果たし、#AICopyrightタグのインタラクション数は12万を突破、AI従事者、アーティスト、法律専門家の間で幅広い議論を呼び起こした。焦点は核心的な問題に向けられている:AI企業は訓練データに対して補償を支払うべきか?これは単に芸術分野の局所的な紛争ではなく、AI業界全体のエコシステムを再構築する可能性がある。

事件の背景

Midjourneyは主要なAI画像生成ツールとして、2022年のリリース以来、そのリアルで高品質な画像生成能力により数百万人のユーザーを魅了してきた。ユーザーはテキストによる説明を入力するだけで、印象派の油絵から未来的なサイエンスフィクションまで、多様なスタイルの画像を生成できる。しかし、この魔法のような機能の背後にある訓練データの出所は常に疑問視されてきた。Midjourneyのモデルは、LAION-5Bなどの大量のインターネット画像データセットに依存しており、その中には数億枚の公開画像が含まれ、多くはアーティストの個人ウェブサイトやDeviantArt、ArtStationなどのプラットフォームから取得されたものだ。

早くも2023年初頭、米国のイラストレーターSarah Andersenら3名のアーティストが同様の訴訟を起こし、Midjourneyなどの AI企業がウェブクローラーを使って彼らの作品を違法にコピーし、商業化されたモデルの訓練に使用したと主張した。この訴訟は一時和解段階に入ったが、最近になって数十名のアーティストが集団訴訟の波に加わった。同時に、Suno AI音楽生成ツールの著作権訴訟の連鎖反応を受けて―Sunoは許可なく音楽サンプルを使用してモデルを訓練したと告発されている―芸術分野での権利保護活動がさらにエスカレートした。Xプラットフォームのデータによると、#AICopyrightトピックの閲覧数は今週から急増し、インタラクション数は12万に達し、AI著作権問題に対する公衆の高い関心を反映している。

核心内容の分析

今回の訴訟の核心は、Midjourneyの訓練データの実践にある。原告側の弁護団は、Midjourneyのモデルが特定のアーティストのスタイルを正確に再現できることを示す証拠を提供した。例えば、「Sarah Andersenスタイルの猫」と入力すると、高度に類似した画像が生成される。これは「派生作品」の侵害証拠とみなされている。米国著作権法によると、訓練データの使用が「フェアユース」を構成するかどうかが重要な弁護ポイントとなる。Midjourneyは、そのモデルは抽象的な特徴を学習するだけで、画像を直接コピーするものではなく、データセットは公開されたインターネットから取得したもので、人間のアーティストが博物館からインスピレーションを得るのと同様だと主張している。

しかし、原告側は反論し、AIは受動的に学習するのではなく、「取り込み-変換-出力」メカニズムを通じて、原作のピクセルデータを直接埋め込み、モデルの出力作品が原作者のスタイルと高度に類似する結果を生んでいると主張した。さらに重要なのは、Midjourneyのビジネスモデル―サブスクリプション有料生成サービス―がすでに数億ドルの利益を上げているにもかかわらず、一切のロイヤリティを支払っていないことだ。Sunoの事例の類似性はさらに論争を拡大させた:ユニバーサルミュージックなどのレコード会社がSunoを提訴し、その訓練データが録音物の権利を侵害していると主張しており、現在この事件は米国著作権局で審理中だ。これらの連鎖的な事件は、AI訓練データのグレーゾーンを浮き彫りにしている:LAIONのようなオープンソースデータセットは重複を除去したと主張しているが、実際のフィルタリングは不完全で、多くの著作権で保護された作品が依然として潜んでいる。

各方面の意見の対立

アーティスト陣営の声は強烈だ。Sarah AndersenはXで投稿し:

「私の作品はAIに飲み込まれ、安価な模倣品を作るために使われている。これは私の生計を奪っている。AI企業は音楽ストリーミングがロイヤリティを支払うのと同じように、データに対価を支払わなければならない。」
別の原告であるデジタルアーティストのKelley McKernanは、AI生成アートがすでにNFT市場や広告に氾濫し、オリジナルの価値を希薄化させていると付け加えた。

AI企業側は革新の必要性を強調する。Midjourney創業者のDavid Holzはインタビューで次のように回答した:

「訓練データはAI進歩の基礎だ。すべての画像に許可が必要なら、モデルは訓練できない。我々は著作権を支持するが、技術発展とのバランスが必要だ。」
Stability AIのCEO、Emad Mostaqueもオープンソースモデルを公に支持し、厳格な許可制度は中小開発者を窒息させると述べた。

法律専門家の意見は分かれている。米国著作権法学者のLawrence Lessigは、AI訓練は「変形的使用」に該当する可能性があり、Google Books事件のような検索エンジンのサムネイル事例に類似していると考えている。しかし、スタンフォード法科大学院のJennifer Urban教授は警告する:

「AI出力は抽象的な学習ではなく、商業的に収益化可能なスタイル模倣だ。これはフェアユースの範囲を超えている。将来的にはデータ許可メカニズムを明確にする立法が必要かもしれない。」
中国のAI著作権専門家で北京大学法学院の副教授である沈岿氏は最近のインタビューで、中国でも類似の紛争が頻発しており、アリババがAI小説の侵害を提訴した例を挙げ、「AI訓練データ許可ライブラリ」の構築を呼びかけた。

潜在的影響の分析

この訴訟の勝敗はAI業界に深い影響を与えるだろう。第一に、Midjourneyのようなクローズドソースモデルにとって、敗訴は巨額の賠償とデータのクリーニングにつながり、運営コストを押し上げる可能性がある。第二に、オープンソースモデルはより大きな打撃を受ける:LAIONなどのデータセットが強制的に削除された場合、Hugging Face上の数千もの画像生成モデルは存続が困難になる。欧州の「AI法」はすでに高リスクAIに訓練データソースの開示を要求しており、米国議会は「No Robots条項法案」を準備中で、AIの無許可訓練を禁止する。

長期的には、これは新しいビジネスモデルを生み出す可能性がある:Getty ImagesとNVIDIAが協力して許可済みデータセットを提供したり、AdobeのFireflyモデルが許可された画像のみで訓練されているようなケースだ。同時に、アーティストは「オプトアウト」ツールを通じて作品を保護できるが、カバー率は限定的だ。Suno事件の示範効果により、ChatGPTのような文章生成AIの書籍データ紛争を含む、分野横断的な連鎖訴訟が引き起こされる可能性がある。全体として、革新と権益のバランスを取ることがAIガバナンスの痛点となり、合意がなければ、業界は「許可の冬」に入る可能性がある。

結語

AI生成アートの著作権紛争は、技術と法律の衝突だけでなく、デジタル時代における人間の創造力の試練でもある。Midjourney事件の判決はマイルストーンとなり、AI企業を透明な許可制度への転換に導き、同時にアーティストに公正な補償の道を提供する可能性がある。結果がどうであれ、この議論はすでに業界に反省を促している:技術の進歩は創作者を犠牲にして成り立つべきではない。将来的には、グローバルな協力により、持続可能なAIエコシステムが構築され、芸術とアルゴリズムが共に繁栄することを期待する。