FlashLabs(東京都千代田区)は2026年5月29日12時20分、提携先Continuum AIのLLMルーティングゲートウェイ「OrcaRouter」で、Anthropicの「Claude Opus 4.8 API」を提供開始した。コンテキストウィンドウは1Mトークン、最大出力は128Kトークンで、価格は入力が100万トークン(MTok)あたり5ドル、出力が同25ドル。

OrcaRouterはプロンプトごとに難易度を1ms未満で判定し、定型処理はオープンモデル、高度処理はフロンティアモデルへ自動で振り分ける。定型処理は全体の約65%を占め、オープンモデルへ回すことでコストは目安で約1/15になるという。判断根拠はリクエスト単位で記録・可視化され、複数プロバイダーへ直接接続し200以上のモデルを1エンドポイント、1キーで利用できる。

背景には、LLM利用料がプロダクト成長とともに増大し、全処理を高性能モデルに投げると過剰支払いが生じやすい点がある。手動ルーティングは新モデル登場でルールが陳腐化し保守負担が残りやすい。FlashLabsはプロンプト難易度判定による自動ルーティングで、品質を保ちながらLLM支出を約40%削減できるとしている。

今後はContinuum AIとの日本独占ディストリビューション提携を通じ、日本市場でのOrcaRouter普及を支援する方針だ。新モデル追加やルーティングアルゴリズム改善、ガードレール機能強化を継続し、エンタープライズ向けに専用環境やSLA(稼働率99.99%)、カスタムサポートの提供も進めるとしている。

【商品情報】
提供開始日: 2026年5月29日(金)
価格: 入力 $5 / 100万トークン(MTok)、出力 $25 / 100万トークン(MTok)
OrcaRouter公式サイト: https://www.flashlabs.ai
URL: https://www.flashlabs.ai

AI生成記事のため誤りを含む場合があります

PRTIMES

Share.