FlashLabs(東京都千代田区)は2026年6月17日、同社が運営するLLM自動ルーティングサービス「OrcaRouter」で、Z.ai(旧Zhipu AI)開発の最新モデル「GLM-5.2」のAPI提供を始めたと明らかにしました。GLM-5.2は実用的コンテキスト100万トークン(最大1,048,576)に対応します。

狙いは、高性能フロンティアモデルに偏った利用で増えがちなAIコストを抑えつつ、品質との両立を図ることです。OrcaRouterはプロンプトの難易度を判定し、高難度タスクはGLM-5.2、定型処理は低コストモデルへ自動で振り分けます(ルーティング=入力内容に応じたモデル切替)。

料金は公開価格・手数料0%(ゼロマークアップ)とし、GLM-5.2は入力$1.40/100万トークン、出力$4.40/100万トークンです。比較として、Claude Opus 4.8は入力$5、出力$25(いずれも100万トークン当たり)としています。OrcaRouter側のモデル数は200以上で、導入はOpenAI SDKのbase_url変更のみ「1行」で済むとしています。

同社は、ルーティング戦略の拡張や評価機能の強化を進め、本番運用のAIワークロード最適化を高度化する方針です。コスト最適化効果として支出を約40%削減できるケースがあるとも述べています(効果は利用条件で変動)。

【関連リンク】
公式サイト:https://www.flashlabs.ai

AI生成記事のため誤りを含む場合があります

PRTIMES

Share.