ストックマーク(東京都港区、代表取締役CEO:林達)は2026年3月17日、製造業に特化した視覚言語モデル(VLM)開発で、NVIDIA提供の日本語ペルソナ合成データセット「Nemotron-Personas-Japan」を使い、合成教師データ生成を通じて開発と実装を加速する取り組みを明らかにしました。学習データは計250万件で、このうち合成教師データは約半数です。
VLMは画像と言語を同時に扱うAIで、製造業ではフロー図や設計図面、複雑なチャートなどの読解が課題になります。一方で、こうした専門領域の教師データを人手で整備するにはコストと時間がかかり、汎用的な海外ベースのVLMでは日本の現場文脈を捉えにくいといいます。
同社は「熟練工」「安全管理者」「機械設計部門のベテランエンジニア」などのペルソナ条件を付与して合成データを作り、日本の商習慣や現場規律に沿う自然な日本語・業務文脈を学習に反映させ、VLMをトレーニングします。
高品質で網羅的な合成データを基盤に、製造業特有の複雑文書を読解できるVLMの開発と、実世界の業務への生成AI実装がどこまで進むかが焦点になります。
【関連リンク】
公式HP:https://stockmark.co.jp
AI生成記事のため誤りを含む場合があります
PRTIMES
PRTIMES
ストックマーク、製造業に特化した視覚言語モデル(VLM)開発に NVIDIAのNemotron-Personas-Japanデータセットを活用
