23億ドルの大勝負:ビデオゲームでAIの「真のインテュイション」を訓練する

23億ドルの大勝負:ビデオゲームでAIの「真のインテュイション」を訓練する

人工知能の分野において、データは燃料であり、アルゴリズムはエンジンである。しかし大半のAIの学習データは、静的なテキスト、画像、またはアノテーション済みの構造化データセットに由来する。General Intuition(ジェネラル・インテュイション)社はまったく異なる道を歩んでいる——AIにビデオゲームをプレイさせるのだ。このスタートアップは3億2,000万ドルのシリーズBラウンドを完了したばかりで、総調達額はすでに4億ドルを超え、長期的な投資コミットメントは23億ドルに達する。投資家たちは明らかに、ゲーム内のアクションデータがAIに人間の直感に近い能力を与えられると信じている。

ゲームはデータ:なぜビデオゲームなのか?

General Intuitionは、元DeepMind研究員のSarath Chandarとロボット工学の専門家Katie Boumanによって2023年に設立された。彼らの核心的な洞察は、ビデオゲーム(特にアクションRPG、リアルタイムストラテジー、オープンワールドゲーム)が本質的に高忠実度のシミュレーターであり、豊富な因果連鎖と意思決定ツリーを含んでいるという点だ。プレイヤーはリアルタイムで環境を認識し、意思決定を下し、その結果を受け入れる必要があり、このプロセスは現実世界におけるナビゲーション、操作、協働と高度に類似している。

「私たちはAIにゲームのプレイ方法を教えているのではなく、『考え方』を教えているのです」と創業者のSarath Chandarは社内デモで述べた。「ゲームのすべてのフレームには、状態・アクション・報酬が含まれています——これはまさに強化学習が必要とする完璧なデータです。」

従来の強化学習は、人工的に設計された報酬関数と環境シミュレーターに依存しており、時間と労力を要するうえ過学習に陥りやすい。これに対してGeneral Intuitionのアプローチは、既存のゲームの録画データを直接活用し、リバースエンジニアリングによってアクションシーケンスを抽出した上で、自己教師あり事前学習と大規模な模倣学習を用いて「基盤行動モデル」を訓練するというものだ。その規模は、視覚とアクションを統合したGPTの版に相当する。

23億ドルの賭けの根底にあるロジック

この巨額資金は一括投入ではなく、マイルストーンに基づいて段階的に支払われる。投資家にはAndreessen Horowitz、Sequoia Capital、サウジアラビアの政府系ファンドPIFが名を連ねる。彼らは、General Intuitionのアプローチが成功すれば、まったく新しいAI学習トラック——アクションデータ市場——が開拓されると考えている。実際、同社はすでに複数のゲームパブリッシャーと協定を締結し、プレイヤーの匿名化された操作データを取得している。

ロボット工学の分野では、従来の手法は物理的なプロトタイプによる反復的な試行錯誤を必要とし、コストが高く、リスクも大きい。一方、ゲームで訓練されたAIは、シミュレーション環境の中で学習の大部分を完了し、わずかな現実世界でのファインチューニングを経てデプロイできる。General Intuitionはまず倉庫物流ロボット、次いで人型ロボットへの技術応用を計画している。

編集後記:直感AIの限界と懸念

この方向性は非常に興味深いが、顕著な課題も存在する。ゲーム内の物理法則は現実世界と完全には一致しておらず(重力定数や素材の摩擦係数など)、AIがゲームで習得した「直感」は転移誤差を生む可能性がある。また、数百万時間に及ぶゲームデータには偏見、暴力、または最適でない戦略が含まれる可能性があり、データのクレンジングと倫理的審査は隠れたコストとなる。

しかし否定できないのは、General Intuitionが成功した場合、ロボット学習産業全体を——高価な人間によるデモンストレーションとデータアノテーションへの依存から、膨大なゲームデータを活用した「ブルートフォース」型学習へと——根底から覆す可能性があるという点だ。この23億ドルの賭けは、汎用人工知能に向けた予想外の道を切り開いているのかもしれない。

本記事はTechCrunchより編訳