Visual Bank(東京都港区)は2026年3月25日、AI学習用データソリューション「Qlean Dataset」で、音声合成(TTS)や文語表現の言語理解を目的とした「日本語・1話者・古典朗読音声データセット」の提供を始めました。日本人の単一話者による朗読音声と、正確なトランスクリプト(書き起こし)を組み合わせた内容です。

データは日本の古典文学作品を題材とし、1ファイルあたりの長さは30秒〜90分。音声のサンプリングレートは44.1kHzまたは48kHzで、音声形式はmp3、テキストはtxtやjsonなどで提供します。TTSだけでなく、音声認識(ASR)や言語モデルの研究開発者、オーディオブック等の音声AI開発事業者、EdTechやアクセシビリティ領域の開発者を想定しています。

背景として、Qlean Datasetはアマナイメージズが提供する商用利用可能なAI学習用データ群で、用途別に整えた「AIデータレシピ」として画像・動画・音声・3D・テキストなどを拡充してきました。今回のデータセットは、文語を含む表現の理解・生成や、TTS精度向上に向けた学習データ需要を踏まえた提供といえます。

今後は、日本の文化的資産を捉えた音声・言語データの提供を継続し、多様な表現を扱えるAIの研究開発を支援する方針です。

【商品情報】
サンプル詳細URL:https://qleandataset.visual-bank.co.jp/lineup/pn-042
Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp
AIデータレシピ:https://qleandataset.visual-bank.co.jp/lineup

AI生成記事のため誤りを含む場合があります

PRTIMES

Share.