NVIDIAは2026年6月、ロボタクシーなどレベル4自動運転向けのオープンなリーズニングVLA(視覚言語アクション)モデル「NVIDIA Alpamayo 2 Super」を発表しました。パラメーター数は320億で、従来世代の100億から約3倍に拡張し、360度の状況認識を前提に運転の計画と行動まで扱うとしています。発表は台湾・台北で開催されたNVIDIA GTC Taipei(現地時間6月1日)で行われました。
あわせて、強化学習フレームワーク「NVIDIA AlpaGym」、生成型世界基盤モデル「NVIDIA OmniDreams」、実フリートデータから3D環境を再構築する「NVIDIA Omniverse NuRec」とNeural Reconstructionなど、学習・シミュレーション・展開をつなぐツール群も示しました。VLAは画像(視覚)と言語指示を統合し、車両の操作(アクション)まで結びつけるモデルです。
狙いは、運転スタック全体でのリーズニング(理由づけ)と計画・行動を一体化し、安全でスケーラブルなレベル4開発を進め、説明可能性も高めることです。NVIDIAによるとAlpamayoはリリース以来、ダウンロード数が40万回に迫っています。背景として、同社の関連技術がCOMPUTEX Best Choice AwardsのVehicle Technology and Smart Cockpit部門で受賞したことも挙げています。
今後は、Alpamayo 2 Superの推論コードをGitHubで、モデル重みをHugging Faceで2026年夏に公開予定です。データ作成を支援するCoC Auto-Labeling PipelineもGitHubでオープンソース公開予定で、開発者や研究者の検証と実装が広がるかが焦点になります。
【関連リンク】
公式サイトURL https://www.nvidia.com/ja-jp
