GPT-SoVITS:最佳中文语音克隆,支持5秒音频、1分钟音频

洼地云 tuoyidashi.png

一个强大的音色克隆模型,可以用少量的语音数据来训练和转换不同的声音。

一、软件介绍

它支持中文、英文和日文的语音合成,可以实现零样本和少样本的文本到语音转换。

它还提供了一个WebUI工具,集成了语音伴奏分离、自动训练集分割、中文ASR和文本标注等功能,帮助用户创建训练数据集和GPT/SoVITS模型。

特性:

  • 零样本 TTS:输入 5 秒的人声样本,体验即时文本到语音转换;
  • 少量样本 TTS:仅使用 1 分钟的训练数据即可微调模型,提高语音相似度和逼真度;
  • 跨语言支持:使用与训练数据集不同的语言进行推理,目前支持英语、日语和中文;
  • WebUI工具:集成了语音伴奏分离、自动训练集分割、中文ASR、文本标注等功能,帮助初学者创建训练数据集和GPT/SoVITS模型;

如果是Windows用户(使用 win>=10 进行测试),您可以直接通过预压缩进行安装。只需下载预压缩,解压并双击 go-webui.bat 即可启动 GPT-SoVITS-WebUI。

二、在线演示

在线演示视频: 耗时两个月自主研发的低成本AI音色克隆软件,免费送给大家!

三、项目地址

Github: https://github.com/RVC-Boss/GPT-SoVITS

赞(5)
未经允许禁止转载:优米格 » GPT-SoVITS:最佳中文语音克隆,支持5秒音频、1分钟音频

评论 抢沙发

合作&反馈&投稿

商务合作、问题反馈、投稿,欢迎联系

广告合作侵权联系

登录

找回密码

注册