電通総研は12月18日、東北大学 言語AI研究センター、Studio Ousiaと共同で、国際会議NeurIPS 2025のコンペ「MMU-RAG」text-to-textトラックのオープンソース技術部門でBest Static Evaluationとして優勝したと発表しました。長文形式の質問応答(Deep Research)の精度と再現性が評価され、トップスコアを記録しました。

MMU-RAGは、検索拡張生成(RAG)を用い、長文の調査回答を高精度かつ効率的に作る能力を競います。3者はオープンソースLLM「Qwen3-Next-80B-A3B」を基にDirect Preference Optimization(報酬モデルなしで最適化)を適用し、事実性の自動評価にKey Point Recallを導入。文書再ランク付けと要約化で根拠文書を対応付ける検索モジュールも組み込みました。

得た設計・評価の知見は、企業内ナレッジ活用や公共分野、デジタルファイナンスでの調査・企画・文書作成支援などへの展開が見込まれます。

source: PR TIMES

Share.