AI学習用データ「Qlean Dataset」で、日本語の1話者によるビジネステーマトーク音声コーパスの提供が始まりました。収録時間は約473時間、形式はmp3・44.1kHz、話者は20〜40代の男女、1ファイルは5〜40分です。独白型の連続解説を収め、ASR(音声認識)やNLP(自然言語処理)、対話・生成AIの学習・評価に利用できます。
本コーパスは、台本に依存しない自然発話を特徴とし、文脈依存の語り、話題転換、自然な抑揚を含みます。ビジネス、経営、働き方などの題材を継続的に説明する場面が中心で、語彙多様性や長尺文脈を含むため、要約・意図認識・話題分類の検証にも適しています。権利クリアの音声のみで構成され、研究用途に加えて商用AI開発でも安全に使えることが強みです。
提供主体のQlean Dataset(運営はVisual Bank傘下のアマナイメージズ)は、画像・動画・音声・3D・テキストなど多形式に対応し、GDPR/CCPA準拠、既存データの最短1日納品、カスタム収録にも対応します。企業の議事録生成やFAQ自動応答、エンタープライズ向け音声UI、マルチモーダルAIの音声理解強化など、実装現場での需要に直結する設計です。
長時間の自然発話データは、音声モデルの汎化性能検証に有効で、国内の日本語音声資源の選択肢拡大につながります。今後は、領域特化の追加ラインアップや他モダリティとの統合データ提供が進めば、業務向け生成AIの精度向上と導入加速が見込まれます(見通し)。
【データセット情報】
日本語・1話者・ビジネステーマトーク音声コーパス 約473時間 mp3 44.1kHz 1音声5〜40分
サンプルページ https://qleandataset.visual-bank.co.jp/lineup/pn-007
Qlean Datasetサイト https://qleandataset.visual-bank.co.jp/
AIデータレシピ https://qleandataset.visual-bank.co.jp/lineup
お問い合わせ https://qleandataset.visual-bank.co.jp/contact
source: PR TIMES
