NVIDIAは2026年3月17日、AIファクトリー向け推論オペレーティングシステム「NVIDIA Dynamo 1.0」を、本番環境対応のオープンソース基盤として提供開始したと明らかにしました。NVIDIA Blackwell GPUで推論性能を最大7倍高められるとしています。発表の場は米サンノゼで開催されたGTCで、米国時間3月16日の内容です。
狙いは、エージェント型AIの本番運用で顕在化する「推論のスケーリング」課題への対応です。リクエストが予測しにくい状況でも、データセンター内のGPUやメモリを適切に割り当てるリソースオーケストレーション(資源の自動配分)を行い、処理遅延やコスト増を抑えると説明しています。
Dynamoは分散型の「推論OS」として、クラスター全体でGPUとメモリを調整し、トラフィック制御、GPUと低コストストレージ間のデータ移動、関連性の高い短期記憶を持つGPUへのルーティング、不要時のメモリオフロードなどを行います。LangChainやvLLMなどへネイティブ統合し、KVBM、NVIDIA NIXL、NVIDIA Groveは単体でも提供されます。
採用・統合先としてAWS、Microsoft Azure、Google Cloud、OCI、Alibaba Cloudのほか、CoreWeaveやPerplexity、PayPalなどが挙げられました。NVIDIAは今後、ブログやウェブページで導入手順などの情報を順次提示するとしています。
【関連リンク】
公式HP: https://www.nvidia.com/ja-jp
AI生成記事のため誤りを含む場合があります
PRTIMES
PRTIMES
NVIDIA、AI ファクトリー向けに広く採用されている推論オペレーティング システムである Dynamo を本番稼働向けに提供開始
