FlashLabs(東京都千代田区)は2026年6月18日、AIルーティングゲートウェイ「OrcaRouter(オルカルーター)」で、AIエージェントを狙う攻撃を遮断する「Firewall」と「Guardrails」機能を全ユーザー向けに完全無料で提供開始しました。コンソール上のスイッチで有効化でき、既存のAPIキー・ゲートウェイ構成のままコード改修なしで導入できます。
背景には、AIエージェントがメールや外部ツールを使って自律的に動くことで、ソーシャルエンジニアリングなど新たな攻撃面になっている点があります。同日公開の年次レポート『AI Threat Report 2026』では、本番環境のLLMアプリケーションが完全に侵害されるまでの平均時間を42秒、AI関連の侵害を報告した組織のうち適切なアクセス制御を欠いていた割合を97%としています。
機能面では、入力・出力のスクリーニング(プロンプトインジェクション対策、PII=個人情報の検知・マスキング、シークレット/APIキーのブロック)に加え、ツール呼び出し制御、ネットワークのエグレス制限、コスト・キャップなどで防御を自動化します。検証はHarmBenchやJailbreakBench、NVIDIAのgarakなどを含む80以上のレッドチーム・コーパスで継続的に評価し、OrcaRouterは200以上のLLMモデルを単一エンドポイントで管理できるとしています。
今後は、ゲートウェイ層での判定・制御の標準化を進め、2026年8月2日に全面施行されるEU AI法の要件も見据えた安全性、透明性、堅牢性の確保を支援し、AIエージェントの本番導入を後押しするとしています。
【関連リンク】
公式HP:https://www.flashlabs.ai
