AI学習用データソリューション「Qlean Dataset」を展開するVisual Bank傘下のアマナイメージズは、日本語の歴史テーマに特化した1話者トーク音声コーパスの提供を始めました。日本史・世界史・文化史を題材にした一人語り音声を約150時間収録しており、音声認識(ASR)や自然言語処理(NLP)、生成AIの基盤モデルの学習・評価に活用できるとしています。

新データセットは、20〜50代の男女話者による5〜40分の長尺モノローグで構成され、台本に依存しない自然な語り口が特徴です。文脈依存の説明や話題転換、エピソード紹介など実際の会話に近い発話構造を保持し、44.1kHzのmp3形式で収録されています。この構成により、長文の音声入力に対する認識精度検証や、要約・固有表現抽出・談話解析など高度な日本語処理研究に対応します。

歴史分野特有の専門用語や固有名詞を含むことから、教育・知識コンテンツ向けのASR精度向上や、長文説明が求められる対話型AI、教育支援AIの開発など産業利用も想定されています。既存データは最短1日で納品可能で、カスタム収録にも対応しており、権利処理済みの安全な学習データを必要とする企業・研究機関のニーズを取り込む狙いがあります。今後は他分野への応用データ拡充や、マルチモーダルAIの評価環境整備がどこまで進むかが注目されます。

【商品情報】

Qlean Dataset

日本語・1話者・歴史テーマトーク音声コーパスデータセット サンプル

https://qleandataset.visual-bank.co.jp/lineup/pn-009

Qlean Dataset サイト

https://qleandataset.visual-bank.co.jp/

source: PR TIMES

Share.