Ragate(東京都中央区)は12月24日、企業の生成AI活用で膨らみがちな実行コストを最適化する支援サービス「AIモデル賢い使い分け支援」を始めました。業務ごとに最適なモデルを選び、マルチベンダー構成やワークフロー設計まで含めて費用対効果の改善を狙います。

背景には、生成AI導入率が2025年時点で約4割に達した一方、Claude・GPT・Geminiなどの従量課金が積み上がり、PoC段階からコストが想定以上に増える課題があるといいます。同社は「高性能・高額モデルの一律適用」が非効率の要因だとし、ユースケース別のコストシミュレーションを用いて配置を見直します。

支援は①業務特性に応じ、Claude・GPTなどとAmazon Nova/Titanなどを組み合わせるモデル設計②HuggingFaceのオープンモデル調達やNova/Titanをベースにしたファインチューニング、SageMakerでのホスティングによる固定費化③DifyとRAG(社内文書検索を組み合わせる手法)やキャッシュ戦略でLLM呼び出しを減らす最適化、の3本立てです。今後は、ベンダーロックイン回避も含めた運用設計需要の高まりを見込み、継続改善まで伴走するとしています。

【サービス情報】

AIモデル賢い使い分け支援 提供開始日:2025年12月24日

詳細・問い合わせ https://www.ragate.co.jp/service/3sabttk–v

source: PR TIMES

Share.