NVIDIAは2026年3月17日、米カリフォルニア州サンノゼで開催中のGTCで、Vera Rubinプラットフォームを次世代のエージェント型AI向けインフラとして位置付け、新チップ7種の量産と、NVL72など関連ラック/システム群を示しました。構成は「7つのチップ、5つのラック、1つの巨大なスーパーコンピューター」を掲げます。

中核のNVL72は、Rubin GPU72基とVera CPU36基をNVLink 6で接続します。同社は、Blackwell比で4分の1のGPU数で大規模MoE(専門家を切り替える混合モデル)学習を狙い、トークンあたりコストを10分の1、ワットあたり推論スループットを最大10倍と説明しました。Vera CPUラックは最大256基を統合でき、従来CPU比で効率2倍、速度50%向上をうたいます。

推論ではGroq 3 LPXラック(LPU256基、オンチップSRAM128GB、スケールアップ帯域幅640TB/s)を統合し、1兆パラメータ/100万トークン級のモデル最適化を想定します。加えてBlueField-4やSpectrum-6、DOCA Memos、液冷MGX、DSX Max-Q/DSX Flexなどで、性能・コスト・電力制約下の展開とレジリエンス向上を図るとしています。

Vera Rubinベース製品は今年後半にパートナーから提供開始予定です。リファレンスデザイン公開と200社以上のデータセンターパートナー連携を通じ、協調設計による導入加速が進む一方、実運用でのコスト/電力効果の検証が焦点になりそうです。

【関連リンク】
公式HP: https://www.nvidia.com/ja-jp

AI生成記事のため誤りを含む場合があります

PRTIMES

Share.