NVIDIAは米国時間2026年1月5日、次世代AI向けプラットフォーム「NVIDIA Rubin」をラスベガスで公表しました。CPU・GPU・ネットワーク・DPUなど6つの新チップを中核に協調設計し、Blackwell比で推論トークンのコストを最大10分の1、MoE(専門家を分担させる設計のモデル)学習に必要なGPU数を4分の1にできるとしています。RubinはAIシステムを低コストに構築・展開し、セキュリティまで含めて運用する「AIファクトリー」基盤として位置付けます。構成要素はVera CPU、Rubin GPU、NVLink 6スイッチ、ConnectX-9、BlueField-4、Spectrum-6で、NVLinkはGPUあたり3.6TB/s、NVL72ラックで260TB/sの帯域をうたいます。Rubin GPUは推論でNVFP4の50ペタフロップスを提示し、NVL72ではCPU・GPU・NVLinkをまたぐ第3世代Confidential Computingでデータ保護を維持すると説明しました。BlueField-4を使う「Inference Context Memory Storage Platform」はKVキャッシュ共有でエージェント型AIのリーズニングを高速化し、Spectrum-X Ethernet Photonicsは従来手法比で稼働時間と電力効率を各5倍としています。採用面ではMicrosoftが「Vera Rubin NVL72」を用いるFairwater AIスーパーファクトリーを数十万規模のSuperchipへ拡張予定とし、CoreWeaveも早期提供企業として運用ソフト「Mission Control」を挙げました。Rubin搭載製品は2026年後半にパートナー各社から提供開始予定で、主要クラウドでも2026年の展開が見込まれます。

Share.