当前位置：优米格  软件  正文

GPT-SoVITS：最佳中文语音克隆，支持5秒音频、1分钟音频

2024-02-25 分类：软件阅读(1524) 评论(0)

一个强大的音色克隆模型，可以用少量的语音数据来训练和转换不同的声音。

一、软件介绍

它支持中文、英文和日文的语音合成，可以实现零样本和少样本的文本到语音转换。

它还提供了一个WebUI工具，集成了语音伴奏分离、自动训练集分割、中文ASR和文本标注等功能，帮助用户创建训练数据集和GPT/SoVITS模型。

特性：

零样本 TTS：输入 5 秒的人声样本，体验即时文本到语音转换；
少量样本 TTS：仅使用 1 分钟的训练数据即可微调模型，提高语音相似度和逼真度；
跨语言支持：使用与训练数据集不同的语言进行推理，目前支持英语、日语和中文；
WebUI工具：集成了语音伴奏分离、自动训练集分割、中文ASR、文本标注等功能，帮助初学者创建训练数据集和GPT/SoVITS模型；

如果是Windows用户（使用 win>=10 进行测试），您可以直接通过预压缩进行安装。只需下载预压缩，解压并双击 go-webui.bat 即可启动 GPT-SoVITS-WebUI。

二、在线演示

在线演示视频：耗时两个月自主研发的低成本AI音色克隆软件，免费送给大家！；

三、项目地址

Github： https://github.com/RVC-Boss/GPT-SoVITS；

赞(7)

未经允许禁止转载：优米格 » GPT-SoVITS：最佳中文语音克隆，支持5秒音频、1分钟音频

分享到

AI 语音克隆

评论抢沙发

合作&反馈&投稿

商务合作、问题反馈、投稿，欢迎联系

广告合作侵权联系