NVIDIAは2025年12月15日、エージェント型AI向けのオープンモデル「Nemotron 3」ファミリー(Nano/Super/Ultra)を公開し、まずNemotron 3 Nanoの提供を開始しました。Nanoは300億パラメータで、ハイブリッド型Mixture-of-Experts(MoE、複数の専門モデルを切り替えて使う仕組み)により、Nemotron 2 Nano比でトークンスループット最大4倍、推論でのリーズニング用トークン生成を最大60%削減、コンテキスト長は100万トークンとしています。
Superは約1000億、Ultraは約5000億パラメータで、トークンあたりのアクティブ参数はそれぞれ最大100億、最大500億と説明しています。Super/UltraはNVIDIA Blackwell上で4ビットNVFP4を用い、メモリ要件の低減と学習高速化を狙う設計です。データ面では、事前学習・事後学習・強化学習を含む計3兆トークン規模のデータセットや、安全性評価向けのNemotron Agentic Safety Dataset、学習環境のNeMo Gym/NeMo RL、評価用NeMo EvaluatorをGitHubとHugging Faceで公開するとしました。今後はSuper/Ultraを2026年上半期に提供予定で、推論コストと透明性を重視するマルチエージェント開発の選択肢拡大が見込まれます。
【モデル提供情報】
Nemotron 3 Nano:Hugging Face、Baseten、DeepInfra、Fireworks、FriendliAI、OpenRouter、Together AI
AWS:Amazon Bedrock(サーバーレス)でNano提供
Super/Ultra:2026年上半期に提供開始予定
source: PR TIMES