FlashLabs(東京都千代田区)は2026年6月3日、日本市場で適応型推論ゲートウェイ「OrcaRouter」の月額プラン提供を始めました。Claude Opus 4.8、GPT-5.5 Pro、Gemini 3.5など200超のモデルを対象に、最大10%のボーナスクレジットを付与しつつ、アダプティブ・ルーティングでAIコストを最大40%削減できるとしています。開発はContinuum AIで、日本ではFlashLabsが独占販売します。
導入はOpenAI互換APIで、既存コードのbase_url変更のみで接続できる設計です。プロンプト難易度を判定してモデルを自動選択し、学習にはLinUCBコンテキスト・バンディット(状況に応じて最適な選択肢を学習する手法)を用いるとしています。ルーティング遅延は1ミリ秒未満で、トークン課金は各プロバイダーの公開価格と同額(上乗せ0%)、ルーティング手数料も0%としました。
背景には、企業のAI導入拡大でコストが上がる一方、フロンティアモデルの一律利用が過剰支払いになりやすい点があります。定型処理が約65%、高度な推論が約35%という前提の試算では、月1万ドル規模のチームで年間純削減額が約4万7700ドル、回収期間は1日未満としています。ガードレールはPIIやシークレット、プロンプトインジェクションなど8機能を備え、判定結果の可視化も可能です。
今後はガードレール強化に加え、ミッドストリーム切り替えによる99.99%稼働率SLAの提供、日本語ドキュメント拡充、日本市場向けカスタマイズやエンタープライズ専用環境の検討を予定しています。
【関連リンク】
公式HP:https://www.flashlabs.ai
RSS URL:https://www.flashintel.ai
