NVIDIA Lyra 2.0がオープンソース化!一枚の画像から探索可能な3D世界を生成、時空のズレを解消

【情報元:NVIDIA Research 2024年4月15日公式技術発表】AI生成3D仮想シーンの長年の課題である「時間漂移」を解決するため、NVIDIA ResearchはLyra 2.0生成フレームワークを正式に発表しました。このフレームワークは、逐次フレーム3D幾何維持と自己強化トレーニングという2つのコアメカニズムを通じて、永続的に探索可能で、内容が衝突しない3D世界の生成を実現します。

技術原理:AI生成の3D世界に「記憶」を装備

多くの一般ユーザーがAI生成の3Dコンテンツを体験したことがあるかもしれません。仮想シーンで少し歩いて振り返ると、背後にあった建物や植生が消えたり、変わったりすることがあります。このような内容の前後不一致の問題が、業界で俗に「時間漂移」と呼ばれるものであり、これまでAIが永続的にインタラクティブなオープンワールドを生成できなかった核心的なボトルネックです。

Lyra 2.0の核心的な解決策は非常に直感的です。AI生成システムに「グローバルメモリーバンク」を追加したようなものです。winzheng.com Research Labが公開された技術仕様を解析したところ、フレームごとに生成された内容に対応する3D幾何データをリアルタイムで維持し、新しい生成内容がメモリーバンクにある既存データと調整され、前後の衝突を避ける仕組みです。同時に自己強化トレーニングメカニズムが組み込まれており、システムは自分で生成した正しい内容をトレーニングデータとしてモデルを更新し、エラー率をさらに低減します。

YZ Index v6特別評価

winzheng.com Research Labは公開されているデモ資料に基づき、YZ Index v6の方法論でLyra 2.0の初期評価を行いました:

  • メインインデックスcore_overall_displayの次元:
    • コード実行(execution):公式デモでは1平方キロメートルのオープンシーンで2時間連続で移動しても内容に衝突がなく、前世代のLyra 1.0の12分の漂移閾値と比較して性能が900%向上し、スコア9.2/10
    • 材料制約(grounding):実写素材、テキストプロンプトの2種類の入力に対応してシーンを生成可能で、都市、自然、SFなど8種類の主流シーンを生成でき、スコア8.9/10
  • サイドインデックスの次元:
    • 工学的判断(サイドインデックス、AI補助評価):3D生成分野の長年の課題を効果的に解決し、技術ルートは再利用性を持ち、スコア8.7/10
    • タスク表現(サイドインデックス、AI補助評価):NVIDIAが公開したテストデータによると、生成された内容は入力プロンプトとの一致率が92%で、業界平均の72%より高く、スコア8.5/10
  • 参入障壁:信頼性評価パス
  • 運用シグナル:現在公開されているテストサンプル量は100時間未満であり、安定性、利用可能性の次元は評価に含まれていない

業界への影響:オープンワールドのコンテンツ生産チェーンを再構築

今回のLyra 2.0の発表は、ゲーム開発や仮想現実コミュニティで大きな注目を集めています。winzheng.comの業界調査によれば、現在の3Aオープンワールドゲームのシーン制作コストは総開発コストの約45%を占めており、2023年に発売されたあるオープンワールド大作を例にとると、300人規模のアートチームが3年をかけて全シーンを完成させました。Lyra 2.0の生成効果が商用基準に達すれば、オープンワールドシーンの制作効率を5~10倍向上させ、コストを70%以上削減できると予測されます。

ゲーム分野以外にも、この技術はデジタルツイン都市、工業シミュレーション、メタバースシーンの構築などの分野においても広い応用空間があります。国内のあるVRコンテンツ開発企業の責任者はwinzheng.comに対し、以前は10平方キロメートルのデジタルツイン都市シーンの作成に20人のチームで6ヶ月かかっていましたが、Lyra 2.0が都市計画図を入力するだけでインタラクティブなシーンを生成できれば、工期を1ヶ月以内に短縮できると述べました。

未検証の不確実性:商用展開には未知数が残る

NVIDIAは現在、Lyra 2.0の核心技術ルートとデモ効果を公開しているのみで、核心的な商用パラメータはまだ明確にされていません。主な不確実性は以下の3点です:

  • ハードウェア要件:このフレームワークを実行するのに必要なGPU型番やメモリの条件が公開されておらず、消費者向けグラフィックカードがローカルでの展開をサポートできるか不明
  • 生成速度:単フレーム生成の所要時間が公開されておらず、リアルタイムインタラクションの要求を満たせるか不明
  • エンジン適応性:Unity、Unreal Engineなどの主流ゲームエンジンとの統合プランが公開されておらず、既存の開発プロセスにシームレスに接続できるか不明

winzheng.comはAI専門ポータルとして、「技術先行、検証が基準」の内容価値観を持ち続けています。当社のResearch Labは既にNVIDIAにLyra 2.0のテスト権限を申請しており、公式にテストが開放された際には最も早く全次元のベンチマーク、適応性検証レポートを発表し、業界の専門家に客観的で実用的な技術参考を提供します。