Aladdin Security(京都市、代表取締役CEO:勘佐圭吾)は12月26日、企業向け言語モデル(LLM)の品質・安全性・説明性を、推論時の内部ベクトル解析で評価・保証するホワイトボックス型ツールの提供を始めました。外部の入出力だけを試すブラックボックス評価では捉えにくい「なぜその回答に至ったか」を解析し、デセプション(欺瞞)や潜在的な脆弱性を内部挙動から検知するとしています。生成AIの業務利用が広がる一方、金融・医療・公共など高い信頼性が求められる領域では、条件次第で発現するリスクの見逃しが課題でした。同社はファインチューニング不要で再学習に伴うGPUコストを抑え、既存システムへ統合しやすい点を特徴に挙げます。OpenAI主催「GPT-OSS 20B Red Teaming」入賞経験者によるレッドチーミング(攻撃的検証)と、ガバナンス対応の評価項目、業界・企業別の評価ポリシーにも対応可能とし、今後は自動評価機能の強化や規制対応テンプレート拡充を進める方針です。
source: PR TIMES
