0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

はじめに

現在、市場に出回っている音声データのほとんどは読み上げです。しかし、人間と機械の対話は、単なる対話や質問と回答のコマンド制御ではなく、言語の文脈を理解し、人間の発話や感情を認識し、それに対応したフィードバックを行う必要があります。

技術の飛躍的進歩がもたらしたユーザー体験の向上により、会話型音声対話はAI大手の焦点となっています。グーグル、アマゾン、アリババ、テンセントなどは、複数ラウンドの連続対話をサポートするスマートスピーカー、スマートアシスタント、スマートカスタマーサービス、スマートロボットを発表しました。AIシステムの継続的対話能力は、金融、教育、インターネット、交通、モバイル通信、製造などの業界における技術的変化の引き金となるでしょう。

音声認識データセット

世界有数のAIデータサービスプロバイダーとして、弊社は日本語、中国語方言、英語、韓国語、タイ語、フランス語、ドイツ語、ロシア語、スペイン語、韓国語、ヒンディー語、など数十言語の一連の自然対話音声データセットを保有しています。データセットには、発音の癖や特徴、アクセントの強弱、話者の分布など、多種多様なものが含まれています。

513時間 - 電話録音による日本語会話データセット

800人以上のネイティブスピーカーが参加し、男女比のバランスを考慮しながら作成されました。録音装置は電話録音システム。音声フォーマットは8kHz、8bit、非圧縮WAVで、すべての音声データは静かな室内環境で録音されました。すべての音声は、テキストの内容、各有効文の開始時刻と終了時刻、話者の識別を含めて手作業で書き起こし済みです。文の精度は95%以上です。

633時間 - 携帯録音による日本語自然対話音声データセット

テキスト内容、タイムスタンプ、話者ID、性別、その他の属性とともに書き起こされています。多様な話者(約1000人のネイティブスピーカー)から収集されたデータセットは、実際の複雑なタスクにおけるモデルのパフォーマンスを向上させます。様々なAI企業によって品質テストされています。弊社はデータ保護とプライバシー基準を厳格に遵守し、データ収集、保存、使用プロセスを通じて、ユーザーのプライバシーと法的権利の維持を保証します。

1,000時間 - アメリカ英語自然対話音声データセット

このデータセットには1,000時間分のアメリカ英語の会話音声データが含まれています。2,000人のネイティブスピーカーによって録音されています。会話のスムーズさと自然さを保証するために、話し手はよくあるトピックから会話を始めます。文の精度は95%以上になります。‍

136時間 - 韓国語自然対話音声データセット

与えられたトピックに基づく対話から収集され、20以上のドメインをカバーしています。テキスト内容、話者のID、性別、年齢、その他の属性とともに書き起こされています。216人のネイティブスピーカーから収集され、実際の複雑なタスクにおけるモデルのパフォーマンスを向上させます。

500時間 - 携帯電話によるフランス語会話データセット

約1,000人のネイティブスピーカーによって録音されています。会話のスムーズさと自然さを確保するため、話者たちは身近な話題から会話を始めています。文の精度は95%以上です。

上記のデータがお客様の研究ニーズを満たせない場合、弊社は、特定のグループ、特定のシナリオ、特定の言語向けにデータをカスタマイズするサービスも提供しています。

データ仕様・サンプルの確認

まとめ

データサービスが必要な場合は、お気軽にお問い合わせください。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?