https://commonvoice.mozilla.org/en/datasets
We’re building an open source, multi-language dataset of voices that anyone can use to train speech-enabled applications.
Includes both Cantonese and Mandarin Chinese!!
抽样粤语(Chinese Hong Kong)语音数据的质量不好,录音人声音不够清晰(不是声优级别的声音),背景噪音较大,标记文件有错。另外还有个Cantonese的分类。
感觉可能用现有的TTS生成数据质量会好得多。
6/25/2025粤语音频统计:
总文件数:123195 个
总时长:8552分7.33秒(513127.33 秒)
平均时长:4.17秒(4.17 秒)
最长时长:1分42.5秒(102.50 秒)
最短时长:0.2秒(0.20 秒)
评论