FlashLabs(東京都千代田区)は2026年6月17日、AIインフェレンスゲートウェイ「OrcaRouter」の新機能「Model Fusion」を日本市場で提供開始しました。1つのプロンプトに複数の大規模言語モデル(LLM)を並列実行し、評価して最良回答を選択・合成します。推論コストは最大70%削減できるとしています。

Model Fusionは、判定器(Arbiter)が回答を評価する仕組みで、戦略はbest_of_n、synthesize、majority、first、tests_passの5つです。必要時のみ複数モデルに分岐させる「難易度ゲート」も備え、閾値は難易度0.3以上とされ、コード生成やツール利用など高難易度時にパネルを起動します。

背景には、単一の高性能モデルへの依存が、得意不得意の偏りに加えてAPIコスト高騰やレイテンシ増大を招く課題があります。OrcaRouterは200以上のLLMを単一エンドポイント・単一APIキーに統合し、トークン上乗せ手数料0%を掲げます。融合ロジックはYAML形式のRouting DSLで定義でき、独自パネルは約12行で構築可能です。

今後は、企業が「モデルを選ぶ」だけでなく用途に応じて「構成する」運用が広がる見通しです。複数モデルの冗長性で可用性を高めつつ、フロンティアモデル級(またはそれ以上)の推論品質を低コストで提供する方針です。

【関連リンク】
OrcaRouter Fusion(詳細URL):https://www.orcarouter.ai/ja/models/orcarouter/fusion
FlashLabs株式会社 公式サイト:https://www.flashlabs.ai

AI生成記事のため誤りを含む場合があります

PRTIMES

Share.