arXiv、AI乱造論文を厳格取締:粗悪論文の投稿者は1年間投稿禁止に

プレプリントプラットフォームarXivは、学術界が研究成果を迅速に共有する重要な拠点であり続けてきたが、近年、生成AIツールの普及に伴い、AIによって粗雑に生成された大量の論文がプラットフォームに流入している。これらは品質が低いだけでなく、虚構の内容や偽データを含むこともあり、学術エコシステムを深刻に汚染している。先日、arXivのモデレーターがソーシャルメディアで急進的な新ポリシーを明らかにした。著者が意図的にAI生成の「ゴミ」論文を投稿したと判明した場合、その著者は1年間の投稿資格停止処分を受けるというものだ。

氾濫から統制へ:arXivのやむを得ない措置

明らかにされたところによれば、このポリシーは突然打ち出されたものではない。早くも2023年には、arXivは著者にAIによる執筆補助の有無を明示するよう求めていたが、違反行為は後を絶たなかった。2025年下半期には、プラットフォームが月ごとに処理する必要のあるAI生成疑い論文の数が倍増し、管理者は低品質の原稿を選別・却下するために多大な労力を費やすことになった。このモデレーターは投稿で次のように書いている:「著者がarXivをAIモデルのテスト用遊び場とすることを容認することはできない。一度の違反で、一年間の投稿禁止。これは脅しではなく、ルールだ」

「著者がarXivをAIモデルのテスト用遊び場とすることを容認することはできない。一度の違反で、一年間の投稿禁止。これは脅しではなく、ルールだ」——arXivモデレーターの匿名発言

公式にはまだ詳細な規則が正式発表されていないものの、判定基準は人手によるレビューとAI検出ツールを組み合わせるとの情報がある。一度認定されれば、著者名義のすべての投稿予定論文は即時差し戻され、1年間は新規投稿が一切受け付けられない。この処罰の厳しさはarXiv史上極めて稀であり、これまで学術不正行為に対する最高処罰でも、アカウントを数か月凍結する程度にとどまっていた。

「ゴミ」の定義と論争

新規則の最大の論点は、「AI生成のゴミ」とは何かという点である。編者が分析したところ、今回arXivが取り締まりの重点としているのは、すべてのAI補助論文ではなく、「人間による実質的な貢献を欠き、内容が明らかに空疎または誤りを含み、AIによって完全に代筆されレビューも経ていない」原稿である。しかし、実際の運用において、AIによって完全に執筆されたものの著者が大幅に修正した論文は誤判定されないのか?AIを使った言語校正は違反に当たるのか?現時点では明確ではない。

複数の学者がソーシャルメディアで懸念を表明している:厳格な「一律」ポリシーは、AIを合法的に研究補助に活用している若手研究者を巻き添えにする可能性がある。例えば、英語が母語でなく、AIに頼って文法エラーを修正している研究者は、検出ツールの誤検出率の高さによって誤判定されないだろうか?一方、支持者は、AI生成の「学術工業廃水」がすでにプラットフォームの処理能力を圧迫しており、剽窃、捏造、低品質の論文乱発を抑止するためには断固たる手段を取らざるを得ないと主張している。

編者注:AI学術汚染の統制にはバランスの取れた知恵が必要

より深い視点から見ると、arXivのこのポリシーは、生成AIに対する学術出版界の複雑な姿勢の縮図である。一方では、AIは確かに研究効率を向上させ、著者が草稿を素早く作成したり文献を整理したりするのを助けることができる。他方で、その濫用がもたらすのは信頼の危機である——査読者が一見厳密でありながら完全に虚構の実験報告に直面した時、ピアレビュー体系全体が脅威にさらされる。

ChatGPTなどの大規模モデルが普及してからの2年間、『Nature』『Science』を含むトップジャーナルが相次いで著者ガイドラインを更新し、AI使用状況の明確な申告を求めるようになっていることがわかる。しかしプレプリントプラットフォームとしてのarXivの特殊性は、通常のピアレビューを行わず、審査が主にフォーマットと基本的な科学的妥当性に基づくことにある。これがAI生成コンテンツのフィルタリングをより困難にしている。1年間の投稿禁止令の抑止力は、あからさまな乱発を一時的に減らすことはできるかもしれないが、長期的には、プラットフォームはより精緻なAI利用ルールを整備し、学界とともに人とAIの協働における学術的誠実性の最低ラインを模索する必要があるだろう。

本記事はArs Technicaから翻訳・編集したものである