Appearance
GSV配音(新版)
GPT-SoVITS(GSVI推理特化包)
GPT-SoVITS是开源社区的低成本AI音色克隆软件,更多资料信息请查阅 GSV语雀用户手册 和 官方项目 。
本文聚焦由AI-Hobbyist开发的GPT-SoVITS的推理特化包(GPT-SoVITS-Inference),可以快捷使用4000+角色语音模型,更多资料信息请查阅 GSVI语雀文档 和 整合包项目 。
GPT-SoVITS开发者:@花儿不哭
模型训练者:@红血球AE3803 @白菜工厂1145号员工
推理特化包适配 & 在线推理:@AI-Hobbyist
接入话树流程:
话树提供免费接入AI-Hobbyist提供的推理特化包的推理配音,您可以在话树使用更易上手的单人配音与多人配音功能。Windows用户在本地使用的具体操作步骤如下(其他系统用户请自行查阅官方资料下载对应程序并结合下述操作步骤进行接入):
📎 本指南基于ModelScope中20251007发布的整合包版本。不同版本的整合包的运行方法或内部文件可能略有差异,以实际情况为准,亦可参考 GSVI语雀文档 下载使用。
新视频
1. 下载整合包
进入官方分发网站 GPT-SoVITS推理特化包 ,在模型文件页面下载适配自己电脑的整合压缩包。
/image.png)
2.启动GSVI程序
下载并解压后(一定要先解压),找到程序目录中的【gsvi.bat】运行。若出现Windows安全中心或其他弹窗发现风险项等,请自行决定是否同意此开源程序运行以继续后续流程。
/20251223101027.png)
片刻时间后会出现终端控制台,请不要关闭它。
/20251223101037.png)
3. 获取API请求地址
继续稍等片刻,正常情况下会自动在浏览器打开标题为“AI Hobbyist TTS”的网页。
该网页的地址就是您的API请求地址,默认情况下为 http://127.0.0.1:8000 。
/20251223100139.png)
4. 配置声优
在网页侧边栏点击”GSV模型库”,再点击“一键安装”,右侧将会出现一系列声优可供使用。在表格中您想要下载的声优模型的那一行右侧,点击“一键安装”。
/20251223100348.png)
💡 如果出现一键安装失败的情况,您可以手动下载,点击表格行中蓝色的下载链接,等待下载完成后,将压缩包解压到“应用程序目录/models”中。
/20251223100443.png)
以“七七_ZH.zip”压缩包举例,请将压缩包整体解压到/models文件夹下。该声优是v4模型,系统会自动合并v4文件夹。若您在解压后能在/models/v4/七七_ZH这个文件夹中找到如图所示的pth和ckpt等文件,那您的操作就是正确的。
/20251223100457.png)
/20251223100508.png)
5. 配置话树插件
登录话树,在主页点击头像,在个人中心找到“三方插件”进入。
点击“GPT-SoVITS”的接入配置,在新版插件中输入网页网址后,点击确定(默认地址的情况下您可以不输入,直接点击确定)。在可用性检查通过后,便配置完成,此时便可以使用GSVI的声优进行配音。
/20251223100524.png)
6. 开始使用
免责声明
话树提供免费接入服务,配音过程中若您选择此插件的配音声优,不会消耗您的话树配音条数资源;但话树不对接入服务的稳定性和可用性做保障;确定接入即代表您同意免责声明。
在配音过程中请不要关闭终端控制台,重启电脑后需要重新运行GSV程序(重新运行gsvi.bat文件)。若你安装了更多声优模型,请重启话树即可自动读取新的声优列表,或者再次进入三方插件配置页面点击确定按钮以读取新的声优列表。
Q&A
1. 如何快速试用并接入话树?
进入 GSV语雀用户手册 首页,进入 https://tts.acgnai.top/ 官方在线试用网页。
阅读并同意官方协议后,在网页右上角头像处进行账户注册,之后返回上一个网页登录。
/20251223100545.png)
/20251223100554.png)
/20251223100603.png)
/20251223100612.png)
免责声明
话树提供免费接入服务,配音过程中若您选择此插件的配音声优,不会消耗您的话树配音条数资源;但话树不对接入服务的稳定性和可用性做保障;确定接入即代表您同意免责声明。
登录后,在网页右上角头像处,点击“获取访问令牌”。点击“复制API地址”将网址粘贴到如图输入框中,点击”刷新并复制“将访问令牌粘贴到如图高级设置的秘钥输入框内(Bearer后有一个空格)。点击确定,话树将读取新的声优列表。
之后您可以在话树工具箱的多人配音、品质配音或聊天视频创作中,使用来自GSVI的声优。
💡 若官方在线试用服务出现访问缓慢、读取失败、配音失败等情况均为正常情况,可能源于官方正在维护服务器或限速等原因,您可以再次尝试失败的操作或等待一段时间后再试。
/20251223100658.png)
/20251223100709.png)
/20251223100720.png)
2. 如何在移动设备上使用?如何使用非本地部署?
首先,您必须将GSVI程序运行在一台本地电脑或远程服务器上;之后您可以结合接入话树的操作步骤等并自行查询网络资料,获得有效的Api请求地址。
您可能需要自行解决局域网或远程公网服务器部署、修改代码支持秘钥等相关问题。
💡 您也可以参考上方Q&A(如何快速试用并接入话树),在手机上接入官方在线试用服务。
3. 如何使用更多的声优进行配音?
您可以下载 官方社区 分享的更多配音模型,之后参考已有的目录文件结构(或参考语雀文档-自定义模型)整理后,放置于/models文件夹下。最后通过“AI Hobbyist TTS”网页的“情感模式”验证成功配音后,即可在话树内使用。
/20251223100750.png)
/20251223100759.png)
4. 如何快速克隆某个声音?
免责声明
快速克隆仅作为娱乐目的发布,严禁用于违反当地法律的用途,可能造成的后果与语音合成项目的开发者、分发者、接入方无关;使用合成的声音造成的不良后果由使用者自负全责。
如果您不想要经过处理、分类、校对标注、自训练出极佳私有模型的话,您可以使用开发者提供的预训练模型达到快速克隆出一个声优的目的。
💡 快速克隆声音的效果受参考音频与模型影响。部分声色可能在此预训练模型下效果不佳,您需要自己完整训练私有语音模型或查找网络信息尝试搭配其他模型。
举例,您可以使用整合包程序目录中/GPT_SoVITS/pretrained_models/gsv-v2final-pretrained文件夹里的这两个预训练模型文件作为模型,s2G2333k.pth和s1bert25hz-5kh-longer-epoch=12-step=369668.ckpt。再参考已有的目录文件结构配置声优名称、音频、参考文本、语气等信息(或参考语雀文档-自定义模型)整理后,将这一系列的文件放置于/models/v2中,你便快速克隆出了某个声优。最后通过“AI Hobbyist TTS”网页的“情感模式”验证成功配音后,即可在话树内使用。
/20251223100819.png)
5. 如何训练私有配音模型?运行出现问题?我想要这样的功能…
模型训练教程请自行查阅网络视频资料,在整合包中运行官方项目进行配音模型的训练,正确配置模型与参考音频等,验证配音后,即可使用。
您可能会遇到各类错误等问题,此时请自行参考网络资料或加入GSV官方社区寻找解决办法。
/20251223100831.png)
