Visual Bank(東京都港区)傘下のアマナイメージズは2026年3月10日、「日本語・1話者・文学朗読音声コーパスとトランスクリプト」の提供を開始しました。日本文学・小説作品を、同一の日本人話者が全編朗読した音声(mp3)と、正確な文字起こし(txt/json/csv)をセットで提供します。

収録は1音声あたり30秒〜160分で、音声レートは44.1kHzまたは48kHzです。高品質な音声合成(TTS)モデル学習や自動音声認識(ASR)の精度向上、自然言語処理(NLP)研究に使える音声・テキストの組み合わせとして、研究用途から商用AI開発までを想定します。

Qlean Datasetは、商用利用を前提に画像・動画・音声・3D・テキストなどのAI学習用データを扱い、権利クリアなデータ提供を掲げるサービスです。Visual Bankは2022年4月設立、資本金は1億円で、国の研究開発プログラム「GENIAC」にも採択されています。

同社は、生成AIと音声・言語系AIの需要拡大を踏まえ、今後も用途に合わせたデータ提供を継続し、国内外の研究・開発を支援していくとしています。

【商品情報】
サンプルページ: https://qleandataset.visual-bank.co.jp/lineup/pn-044
Qlean Datasetサイト: https://qleandataset.visual-bank.co.jp
AIデータレシピ: https://qleandataset.visual-bank.co.jp/lineup
問い合わせ(Contact): https://qleandataset.visual-bank.co.jp/en/contact

AI生成記事のため誤りを含む場合があります

PRTIMES

Share.