Qlean Dataset、自然対話の日本語2話者コーパス提供　レジャー題材で約400時間

Visual Bankは、AI学習用データ「Qlean Dataset」で「日本語・2話者・レジャーテーマトーク音声コーパスとトランスクリプト」の提供を始めました。20代〜50代の男女話者による対話音声と書き起こしをセットにし、収録時間は計約400時間です。音声はmp3／wav、レートは44.1kHz、1音声あたり約5〜60分としています。主な内容はドラマやアニメの感想・考察、ゲームやガジェットのレビュー、旅行や外出の体験談など日常的な話題です。台本に依存しない自然会話を前提に、ASR（音声認識）やNLP（自然言語処理）、LLM（大規模言語モデル）の開発・検証で、話者交代や応答関係を含む会話の精度評価に使う想定です。提供元はVisual Bankの子会社アマナイメージズで、権利処理や利用条件を整理したデータ提供を掲げます。今後は、音声UIや対話型AIのPoC、日本語LLMの対話性能評価・追加学習など、用途拡大が見込まれます。

PRTIMES

What's Hot

Accsoon最新ワイヤレス映像伝送を体験、システムファイブ半蔵門で7月2・3日にタッチ＆トライ

朝日新聞社、国際文化会館ジャーナリズム大賞で大賞と特別賞を同時受賞

サントリー、ロンドン気候週間で自然回復の取り組み紹介　森林整備20年以上・自然共生サイト8カ所

Accsoon最新ワイヤレス映像伝送を体験、システムファイブ半蔵門で7月2・3日にタッチ＆トライ

JR西日本、中高生女子向けSTEMツアーを白山で開催　8月25日、応募は6月24日開始

シーマ、能登町「あばれ祭」を遠隔制作で2日間YouTube生配信へ

カフェトークで「Hapa School夏学期」販売開始、日本の話題を英語で語る9週間コース

What's Hot

Accsoon最新ワイヤレス映像伝送を体験、システムファイブ半蔵門で7月2・3日にタッチ＆トライ

朝日新聞社、国際文化会館ジャーナリズム大賞で大賞と特別賞を同時受賞

サントリー、ロンドン気候週間で自然回復の取り組み紹介 森林整備20年以上・自然共生サイト8カ所

Qlean Dataset、自然対話の日本語2話者コーパス提供 レジャー題材で約400時間

おすすめ

Accsoon最新ワイヤレス映像伝送を体験、システムファイブ半蔵門で7月2・3日にタッチ＆トライ

JR西日本、中高生女子向けSTEMツアーを白山で開催 8月25日、応募は6月24日開始

シーマ、能登町「**あばれ祭**」を遠隔制作で2日間YouTube生配信へ

カフェトークで「Hapa School夏学期」販売開始、日本の話題を英語で語る9週間コース

サントリー、ロンドン気候週間で自然回復の取り組み紹介　森林整備20年以上・自然共生サイト8カ所

Qlean Dataset、自然対話の日本語2話者コーパス提供　レジャー題材で約400時間

JR西日本、中高生女子向けSTEMツアーを白山で開催　8月25日、応募は6月24日開始

シーマ、能登町「あばれ祭」を遠隔制作で2日間YouTube生配信へ