米サンディエゴで12月2〜7日に開かれたNeurIPS 2025で、AI半導体のFuriosaAIはNPU「RNGD」を紹介し、15kWラック基準でNVIDIA H100システムより約3.5倍多くトークンを生成できると示した。発表は同社CROのカン・ジフン氏が担当した。
会期中、投稿2万1,575本のうち採択は5,290本(採択率24.52%)で、今年は推論(Reasoning)やオンデバイスAI、安全性に加え、電力消費を抑える「持続可能なAI演算」が論点になった。カン氏は、データセンターの処理量が電力制約と強く連動するとし、同じ電力で処理を増やす必要性を説明。RNGDは「TCP(テンソル縮約プロセッサ)」でGPUの柔軟性とシストリックアレイの高効率の中間を狙い、SRAMをスライス管理してデータフローを構成、2〜8枚へ同時分配できる点などを挙げた。
同社は2026年1月からRNGDチップを2万枚規模で量産する計画も明らかにし、Kubernetes対応や低レベルAPI提供で運用・最適化を後押しするとした。今後、電力密度が上限に近いラック運用の制約下で、高効率推論向けNPUの導入が各国データセンターで進むかが焦点となる。
source: PR TIMES
