为方便访问引入,来源:https://github.com/modelscope/DiffSynth-Studio.git 与 ModelScope 深度集成,模型可直接从 ModelScope 或 Hugging Face 下载。
eSpeak NG 基于 eSpeak 引擎,由乔纳森·达丁顿 (Jonathan Duddington)创建,使用“共振峰合成”方法,开源软件文本转语音合成器,用于 Linux、Windows、Android 等作系统。它支持 100 多种语言和口音。 来源:https://github.com/espeak-ng/espeak-ng
Rhasspy Piper是一个开源的语音合成工具,由Rhasspy团队开发,旨在为用户提供自然流畅的语音合成服务。它支持多种语言和语音模型,并允许用户根据自己的需求进行定制和扩展。 来源:https://github.com/OHF-Voice/piper1-gpl(原https://github.com/rhasspy/piper的新址)
Rhasspy Piper是一个由Rhasspy团队开发的开源的语音合成工具,旨在为用户提供自然流畅的语音合成服务。它支持多种语言和语音模型,并允许用户根据自己的需求进行定制和扩展。 来源:https://github.com/rhasspy/piper
MeloTTS的ONNX实现,个人认为是目前资源占用、功能、音色结合最好的项目。 来源:https://github.com/season-studio/MeloTTS-ONNX