AIは集団思考に陥っている?あるスタートアップが打開策を発表

AIは集団思考に陥っている?あるスタートアップが打開策を発表

「1から100の間でランダムな数字を教えて」――Claude、ChatGPT、あるいはGeminiにこう話しかけると、返ってくる答えはおそらく42、73、または17だろう。これは偶然ではない。研究によれば、主流の大規模言語モデルは、オープンエンドな質問への回答、創造的なコンテンツの生成、さらには提案の提供においても、深刻な「集団思考」現象を示している。その出力は収束し、多様性に欠けており、まるで同じ模範解答を暗記した学生の集団のようだ。

この現象は「AIの共謀」と呼ばれ、モデルの能力不足に起因するものではなく、訓練パラダイムとアライメントメカニズムの副産物である。数億件ものユーザーフィードバック、RLHF(人間のフィードバックによる強化学習)、および選好最適化が、すべてのモデルを「最も安全」で「大多数の期待に最も沿った」答えへと誘導するとき、独自の視点や型破りな創造性は知らぬ間に消し去られてしまう。

ランダム数テストが暴いた真実

MIT Technology Reviewの記者がテストを行ったところ、複数の主流モデルにランダムな数字を生成させると、その確率分布が均一でないことが判明した。例えば、Claudeは30%を超える確率で42を選ぶ(SFの古典『銀河ヒッチハイク・ガイド』の影響)一方、GPT-4は73を好む傾向がある(米ドラマ『ビッグバン★セオリー』でシェルドンが語る「最も良い数字」の影響)。こうした文化的偏見に加え、訓練データの重複により、モデルたちはまるで「互いに答えを写し合っている」かのような状態になっている。

より深刻な影響は実際のユースケースに現れる。AIがブレインストーミング、製品設計、あるいは科学研究に活用される場合、集団思考はイノベーションのボトルネックを意味する。すべてのAIアシスタントが同じマーケティング戦略、同じコード構造、同じ薬物分子を推薦するならば、AIは人間の思考を広げるどころか、私たちをより狭い認知の回廊に閉じ込めてしまうことになる。

均質化を打ち破る:Diversify AIの「対抗的多様性トレーニング」

サンフランシスコに拠点を置くスタートアップDiversify AIが、この根深い問題に立ち向かっている。創業者兼CEOのElena VasquezはDeepMindでAIアライメント研究に従事していたが、現在のアライメントプロセスが本質的に「一種の隠れた平均回帰」であることに気づいた――報酬モデルはモデルが「最も特徴的な」答えではなく「最もまずくない」答えを出力するよう促しているというのだ。

彼女とチームが開発した「対抗的多様性トレーニング(Adversarial Diversity Training、ADT)」技術は、「多様性識別器」を構築することでモデル出力の新規性をリアルタイムで評価する。訓練フェーズでは、2つのモデルが互いに競い合う。一方は多様な出力を生成する役割を担い、もう一方はそれらの出力からパターンを見つけ出し「次に最も出現しやすい結果を予測」しようとする。生成器が識別器をうまく欺けたとき、その出力は十分に独自性があることを意味する。このプロセスは生成的敵対ネットワーク(GAN)に似ているが、目標は画像のリアリティではなく、テキストの創造的多様性だ。

初期実験の結果は有望だ。ADTでファインチューニングされたモデルは、「5つの単語を使ってショートショートを書く」「新製品の名前を考える」といったタスクにおいて、出力間のコサイン類似度が約40%低下し、同時に95%以上の正確性を維持した。これはAIが「最も無難な」答えを提供するだけでなく、「リスクを取る」ことを学び始めたことを意味する。

編集後記:多様性はAI進化の次なる鍵

AIの集団思考問題は、本質的に「技術的な正確さ」と「認知的豊かさ」の間の矛盾だ。現在の業界がベンチマークスコアを過度に追求するあまり、モデルの振る舞いは均一化に向かっている。Diversify AIの試みは注目に値する。それは私たちに示している――優れたAIとは「模範解答のコピー機」であるべきではなく、「多元的思考の触媒」であるべきだと。

もちろん、ADTには課題もある。多様性を過度に追求すると、事実誤りや有害なコンテンツが混入する可能性がある。「有用性」「安全性」「独自性」の三者のバランスをいかに取るかは、より精緻なアルゴリズム設計を必要とする。さらに、この技術が数千億パラメータのモデルにどのようにスケールアップできるかは、まだ検証が必要だ。

「AIに私たちが聞きたいことだけを言わせるなら、それはエコーチェンバーの中の一枚の壁に過ぎない。」――Elena Vasquezはインタビューでこう語った。

今後、AIがツールからパートナーへと進化するにつれ、その出力の多様性は知性水準を測る重要な指標となるだろう。Diversify AIの試みは、一つの始まりかもしれない――AIが「集団的な無意識」から抜け出すための始まりだ。

本記事はMIT Technology Reviewより編訳