Visual Bank、古典朗読の「日本語・1話者」音声データセット提供開始　TTS学習向けに最大90分音声も

Visual Bank（東京都港区）は2026年3月25日、AI学習用データソリューション「Qlean Dataset」で、音声合成（TTS）や文語表現の言語理解を目的とした「日本語・1話者・古典朗読音声データセット」の提供を始めました。日本人の単一話者による朗読音声と、正確なトランスクリプト（書き起こし）を組み合わせた内容です。

データは日本の古典文学作品を題材とし、1ファイルあたりの長さは30秒〜90分。音声のサンプリングレートは44.1kHzまたは48kHzで、音声形式はmp3、テキストはtxtやjsonなどで提供します。TTSだけでなく、音声認識（ASR）や言語モデルの研究開発者、オーディオブック等の音声AI開発事業者、EdTechやアクセシビリティ領域の開発者を想定しています。

背景として、Qlean Datasetはアマナイメージズが提供する商用利用可能なAI学習用データ群で、用途別に整えた「AIデータレシピ」として画像・動画・音声・3D・テキストなどを拡充してきました。今回のデータセットは、文語を含む表現の理解・生成や、TTS精度向上に向けた学習データ需要を踏まえた提供といえます。

今後は、日本の文化的資産を捉えた音声・言語データの提供を継続し、多様な表現を扱えるAIの研究開発を支援する方針です。

【商品情報】
サンプル詳細URL：https://qleandataset.visual-bank.co.jp/lineup/pn-042
Qlean Datasetサイト：https://qleandataset.visual-bank.co.jp
AIデータレシピ：https://qleandataset.visual-bank.co.jp/lineup

AI生成記事のため誤りを含む場合があります

PRTIMES