Visual Bank(東京都港区)は2026年3月17日9時、AI学習用データソリューション「Qlean Dataset」で「海外文学の朗読音声とトランスクリプト」の提供を始めます。1ファイルあたりの収録時間は30秒〜90分で、音声はmp3、サンプリングレートは44.1kHzまたは48kHzです。

データは、海外文学作品の日本語訳文を、落ち着いた語り口の日本人話者1人が読み上げた音声と、正確なトランスクリプトをセットで用意します。テキスト形式はtxt、json、csvに対応し、Qlean Datasetの「AIデータレシピ」の一つとして提供します。

狙いは、音声認識(ASR)の精度向上や、自然な韻律を持つ音声合成(TTS)モデル学習に向けた、音声・テキストの整備です。翻訳文学に多い格調高い文体や複雑な修飾を含む「書き言葉」由来の長尺データ需要に対応し、権利処理を済ませた商用利用可能な学習データを供給します。

同社は今後も、日本語資産を基軸としたデータ提供を継続し、国内外のAI研究・開発を支援するとしています。

【商品情報】
サンプル詳細:https://qleandataset.visual-bank.co.jp/lineup/pn-040
Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp
AIデータレシピ:https://qleandataset.visual-bank.co.jp/lineup

AI生成記事のため誤りを含む場合があります

PRTIMES

Share.