様々な言語の商用・研究用 コーパス「Speechocean コーパス」

■こちらは、2016年11月2日に投稿された記事のため、情報の内容が古い可能性があります。

ユニポスWEBサイトに、様々な言語の商用・研究用 コーパス Speechocean コーパス のページを追加しました。

中国 Speechocean 社の、 ASR-Corpus (自動音声認識コーパス)、TTS-Corpus (音声合成コーパス)、Text-Corpus (テキストコーパス) など、商用 約500種類、研究用 約250種類の数多くのコーパスを扱っています。

110以上の言語や方言(アクセント)、年齢、性別、録音時間、録音プラットフォームなどにより細かく種類分けされておりますので、お問合せの際は、ご希望のコーパスの名称、S.N(King-)をお知らせください。

KingLine Data Center (メーカーサイト)

【ユニポスで取り扱い実績のあるコーパスの一例】

King-ASR-090
US English Speech Recognition Corpus-Complex (Desktop)-50 Speakers
Recording Hours: 49.8 Hours

King-ASR-139
US English Speech Recognition Corpus-Sentence (Mobile)-150 Speakers
Recording Hours: 98 Hours

King-ASR-213
US English Speech Recognition Corpus-SMS/Sentence (Desktop)-200 Speakers
Recording Hours: 164.53 Hours

King-ASR-050
Japan English Speech Recognition Corpus-Sentence (Desktop)-201 Speakers
Recording Hours: 382.5 Hours