RSIがAGIを継承：同様に到達困難なAIの新目標

2026年5月29日 422 約6分 TechCrunch

递归自我改进 AI前沿技术挑战行业反思安全风险

AGI（汎用人工知能）の過熱が徐々に沈静化する中、AI研究界では新たな潮流が静かに広がっている：再帰的自己改善（Recursive Self-Improvement、略称RSI）である。一部のスタートアップ研究機関は、RSIこそ真の知能を実現する鍵だと主張している——AIを人間のように、学習するだけでなく、自己を反復改良し、自身のアルゴリズムを最適化できるようにするというのだ。しかしAGIと同様、RSIの目標もまた曖昧で捉えにくく、学術界ではその定義と実現可能性について議論が絶えない。

AGIからRSIへ：次の風が吹くのか？

過去10年間、AGIはAI分野の北極星であり続けた。OpenAI、DeepMindなどの巨大企業は数十億ドルを投じ、あらゆる人間のタスクをこなせる汎用知能エージェントの構築を目指してきた。しかし、大規模言語モデルの能力が壁に突き当たり、推論コストが急騰するにつれ、業界では「AGIは合理的な目標ではないのかもしれない」という反省が始まった。そこに、RSIが静かに視野に入ってきた。

TechCrunchの記者Russell Brandomは報道の中で、Synthesis AI、Autocurriculaなどの新興研究機関がRSIに全力を注いでいると指摘している。彼らの論理はこうだ：「万能の脳」を追求するよりも、AIに自己改善の方法を教えるべきだ——モデルが自分自身の欠陥を自動的に発見し、アルゴリズムを修正できるようになれば、知能は雪だるま式に加速して成長するというわけだ。魅力的に聞こえるが、実際の運用は困難を極めている。

「RSIは根本的な問いに答えようとしている：AIを自分自身のエンジニアにすることはできるか？現時点でのあらゆる試みは、暗闇の中で存在しない鍵を探しているようなものだ。」——ハーバード大学のAI研究者メラニー・ミッチェル（Melanie Mitchell）はこう評価する。

概念上のジレンマ：RSIとは結局何なのか？

AGIと同様、RSIには広く認められた定義がない。モデルが推論時に動的に重みを調整すること（最近流行の「自己報酬」訓練など）を指すと考える者もいれば、RSIはアーキテクチャレベルでの自律的な再構築を伴うべきだ——例えばAIにより効率的なアテンション機構を書かせるなど——と主張する者もいる。この混乱により研究の比較が困難となり、A研究機関がRSIを実現したと主張しても、B研究機関ではそれは通常のファインチューニングに過ぎないとみなされる、といった事態が生じている。

さらに、RSIは深刻な「自己言及のパラドックス」に直面している：現在のモデルが十分に賢くないのなら、どの部分を改善すべきかをどうやって知るのか？十分に賢いのなら、なぜRSIが必要なのか？これは「神を造ったのは誰か」という神学的議論に似ている。カリフォルニア大学バークレー校のStuart Russell教授は、制約のないRSIは報酬ハッキングや能力のロックイン——システムが短期的指標を追求するあまり長期的効用を損なうこと——を引き起こす可能性があると警告している。

編集者注：RSIはAIの「二度目の死」なのか？

AIの歴史を振り返ると、技術的飛躍のたびに「AI冬の時代」が訪れた。1970年代、シンボリズムは常識処理ができないため冷え込み、1980年代のエキスパートシステムは保守コストが高すぎて衰退した。今、大規模モデルブームには疲れが見え始め、RSIは資本が探し求めている新たな物語なのかもしれない。だが我々は警戒すべきだ：曖昧な概念を「次なるAGI」として包装することは、業界をより深い信頼危機に陥らせるだけだ。

良いニュースは、RSI分野ではまだ独占が形成されていないことだ。Meta、Googleなどの巨人はこれに対して曖昧な態度を取っており（より制御可能なAIアーキテクチャを好む）、これによりスタートアップには周縁での革新のチャンスがある。しかし悪いニュースは、RSIの基礎理論が極端に欠如していることだ——我々は「知能」の数学的定義すら明確にできていないのに、AIに自己改善させようとしている？これは砂の上に城を築くようなものだ。

技術的課題：RSIの三大未解決問題

第一に、評価基準の欠如。一度の自己改善が成功したかどうかをどう定量化するのか？既存のベンチマーク（MMLU、HumanEvalなど）は固定モデル向けに設計されており、動的な反復後の能力的飛躍を測定することはできない。第二に、計算コストの爆発。再帰的な改善のたびにモデル全体を再訓練または蒸留する必要があり、現在の計算能力価格では、一度の完全なRSIサイクルで数百万ドルの電気代を消費する可能性がある。第三に、安全リスクの倍増。モデルが自身のコードを修正する権限を得れば、予測不可能な挙動を生み出す可能性がある——これは単純なアラインメント問題よりも危険である。なぜなら攻撃面が動的だからだ。

こうした課題に直面し、一部の研究者は基礎知能理論への回帰を呼びかけている。MITのMax Tegmarkはこう述べている：「RSIは単なる工学的問題であってはならない。まず物理学の問題なのだ——我々は知能成長の基本的な動力学を理解する必要がある。」おそらく、「神を造る」ことを急ぐより、物理学が標準モデルを構築したように、まず反証可能な理論的枠組みを築くべきなのだろう。

本記事はTechCrunchより編訳

RSIがAGIを継承：同様に到達困難なAIの新目標

AGIからRSIへ：次の風が吹くのか？

概念上のジレンマ：RSIとは結局何なのか？

編集者注：RSIはAIの「二度目の死」なのか？

技術的課題：RSIの三大未解決問題

関連記事