FlashLabs(東京都千代田区)は2026年6月8日、同社が日本独占販売するLLMルーター「OrcaRouter」の研究論文を公開し、LLMルーター評価プラットフォーム「RouterArena」の公開リーダーボードで論文提出時点の2026年5月20日に第2位だったと明らかにしました。条件は1,000クエリあたり1.00米ドルで、精度75.54%、Arenaスコア72.08でした。

OrcaRouterは、プロンプト(指示文)の難易度を判定し、複数の大規模言語モデル(LLM)から最適なモデルへ自動で振り分ける推論ゲートウェイです。開発元はContinuum AIで、200以上のLLMを1つのエンドポイントで統合し、OpenAI互換APIとして導入できるとしています。

企業のAI活用が進む一方、単一の高性能モデルを使い続けるとコストが増え、手作業のルールによるモデル選択は新モデル登場で陳腐化して保守負担が増えます。同社は、Embedding強化LinUCBバンディットアルゴリズムやオフライン/オンラインのハイブリッド学習、スマートウォームアップで最適化し、LLM支出を約40%削減しつつ、用途によっては本番AIコストを最大70%削減できると説明しました。

今後は日本市場での展開を加速し、RouterArenaでの継続評価と実トラフィックのフィードバックを基に改善を続ける方針です。円建て請求、適格請求書対応、国内データルーティングなど運用面の整備も進めるとしています。

【関連リンク】
論文: OrcaRouter: A Production-Oriented LLM Router with Hybrid Offline–Online Learning(arXiv:2605.30736)
URL: https://www.flashlabs.ai

AI生成記事のため誤りを含む場合があります

PRTIMES

Share.