FastLabel(東京都新宿区)は、VLM(視覚言語モデル)を使ったドメイン特化型のセマンティック重複排除技術の研究成果が、NVIDIA主催のAIカンファレンス「GTC 2026」(3月16日〜3月19日、米国およびバーチャル)でのポスター発表に採択され、会場で展示されると発表しました。
従来の画像埋め込み(特徴量)ベースの重複排除では、歩行者の有無など、ドメイン固有で重要な差異を「重複」と見なして除外してしまう恐れがありました。ミッションクリティカル領域では、こうした稀なシーンの欠落が学習データの偏りにつながります。
同社はVLMで画像を高度にキャプション化し、ドメイン知識に基づく「意味のある差異」を識別したうえで、NVIDIAのNeMo Curatorと組み合わせてDeduplication(重複排除)するパイプラインを提案しています。Deduplication工程では画像1万枚を4分で処理したとしています。
今後は、埋め込みベクトルを用いた異常・希少性検知をロボティクスやVLAモデル構築に応用し、作業動画の異常検知や姿勢・関節データなど時系列解析へ展開する方針です。
【イベント情報】
イベント名:GTC 2026(NVIDIA主催)
形式:米国およびバーチャル
開催期間:3月16日〜3月19日
詳細URL:https://www.nvidia.com/ja-jp/case-studies/fastlabel-accelerates-image-data-processing-with-nemo-curator
関連URL:https://fastlabel.ai/service/robotics
AI生成記事のため誤りを含む場合があります
PRTIMES
PRTIMES
FastLabelが開発した次世代AIデータキュレーション技術をNVIDIA主催の世界最大級のAIカンファレンス「GTC 2026」で展示
