https://github.com/PlayVoice/vits_chinese
Best practice TTS based on BERT and VITS with some Natural Speech Features Of Microsoft; Support streaming out!
效果很好,似乎比Coqui更好,待研究。
合成“我挥一挥衣袖,不带走一片云彩。”大概需要10秒。“不”的发音有误。
作者还有另外一个更cool的项目,是合成唱歌的:
https://github.com/PlayVoice/so-vits-svc-5.0
AI孙燕姿是基于Sovits4.0制作的(https://github.com/svc-develop-team/so-vits-svc)
Variational Inference with adversarial learning for end-to-end Singing Voice Conversion based on VITS
作者有989个仓库,实在是精力充沛啊……
https://github.com/MaxMax2016?tab=repositories
上面的语音数据可能参考了这个项目的,他是基于标贝数据继续训练:
https://github.com/Executedone/Chinese-FastSpeech2
这个项目的效果也很好(似乎比vits_chinese和coqui都要好),而且有服务器模式。占用1.7G内存(Coqui是1G)。
评论