Genesis AIフルスタックロボットモデル初公開:ロボットハンドが複雑なタスクを実演

ロボティクス分野において、AI基盤モデルが牽引する変革が加速している。現地時間5月6日、ロボットスタートアップのGenesis AIは、TechCrunch Disruptカンファレンスにおいて最新の成果——フルスタックロボットモデル「GENE-26.5」と、印象的なロボットハンドのデモンストレーションを披露した。ベンチャーキャピタル大手Khosla Venturesから支援を受ける同社は、昨年1.05億ドルにのぼるシードラウンドを完了し、本分野で最も注目される企業の一つとなっている。

断片化からフルスタックへ:GENE-26.5モデルがロボット開発をどう再構築するか

従来のロボット開発には2つの大きな課題がある。一つはアルゴリズムとハードウェアが高度に結合しており、タスクごとに再訓練が必要なこと、もう一つは汎用的な理解能力が欠如しており、動的な環境への適応が困難なことである。Genesis AIのGENE-26.5モデルは、この状況を打破することを目指している。同社によると、このモデルはTransformerアーキテクチャを採用し、視覚、言語、触覚などのマルチモーダル情報を統合することで、精密な運動制御指令を生成できるという。デモでは、複数台の協働ロボットが壊れやすい物体の把持から精密部品の組み立てに至るまで、複雑なタスクを人間の介入なしに実行する様子が示された。

「我々はより優れたロボットアームコントローラを作っているのではなく、ロボットの『汎用オペレーティングシステム』を構築しているのです」と、Genesis AI共同創業者兼CEOのAlex Chen氏は発表会で述べた。「GENE-26.5モデルにより、ロボットは人間のように、観察と言語指示を通じて新しいスキルを素早く習得できるようになります」

注目すべきは、今回のデモで使用されたロボットハンドは異なるメーカー製で型式も異なるが、いずれも統一されたGENE-26.5インターフェースを介して協調動作を実現したことである。これは、同モデルがハードウェアやタスクを横断する汎化能力を備えていることを示しており、ロボティクス分野が長年追求してきた「一度訓練すれば、どこにでも展開できる」というビジョンの重要なブレークスルーである。

資本の賭けと業界競争:1.05億ドルのシードラウンドの背後

Genesis AIのシードラウンド規模は、ロボットAIスタートアップとして記録的なものとなった。リード投資家のKhosla Venturesは破壊的技術への賭けで知られており、創業者のVinod Khosla氏は「ロボット基盤モデルは、大規模言語モデルがソフトウェアを変えたように、物理世界を変えるだろう」と公言している。その他の投資家にはTesla元幹部や複数のトップ研究機関が含まれている。

実際、ロボット基盤モデルの分野は次第に混雑してきている。Google DeepMindのRT-2、トヨタ研究所のFMB、中国スタートアップの銀河通用などが、いずれも類似製品を発表している。ただし、Genesis AIのフルスタック戦略とは異なり、多くのプレイヤーはアルゴリズム層または特定のハードウェアに焦点を当てている。アナリストは、Genesis AIがモデルからロボット制御ハードウェアインターフェースまでを一貫してカバーする道を選んだことで、より深い参入障壁を構築している一方、より高いエンジニアリング上の複雑性に直面しているとみている。

編集後記:ロボットの「iPhoneモーメント」はどれほど遠いのか?

Genesis AIのデモは、2023年に大規模モデルがNLP領域で爆発的な成長を遂げた様子を彷彿とさせる。しかし、ロボット基盤モデルが直面する課題はより困難である。アルゴリズムに加えて、物理世界とのリアルタイムな相互作用、安全冗長性、そしてコスト管理が求められる。GENE-26.5は制御された環境では優れたパフォーマンスを示したが、工場や家庭といった雑多な環境で信頼性を維持できるかどうかは、さらなる検証が必要である。

とはいえ、1.05億ドルのシードラウンドとKhoslaの支持は、明確なシグナルを発している——資本は「ソフトウェア定義ロボット」の未来に賭け始めているのだ。Genesis AIがモデルを継続的に反復改良し、業界横断的な展開の標準化問題を解決できれば、ロボットを汎用人工知能へと導く重要な結節点になる可能性が高い。

本記事はTechCrunchから翻訳・編集したものである