VITS 语音接入教程
我们使用 MoeGoe-Simple-API 作为 VITS 语音的后端。
接入 MoeGoe-Simple-API 的 VITS TTS 需要在配置文件中添加下面几行配置:
配置项介绍
后端接口地址
此处填写你搭建好的 MoeGoe-Simple-API 的接口地址,http://IP:端口号/voice
。
你可以使用我的接口地址:http://lss.mchank.cn:23456/voice
来体验效果,但我不保证这个接口的稳定性(可能随时会关闭)。
角色ID
和你的模型有关,具体请见 MoeGoe-Simple-API 的文档。
语音速度
这个值越大,语速越慢。经测试发现 1.4
是一个比较均衡的值。
目标语言
即想要转换成语音的语言,支持:
zh - 中文
ja - 日文
mix - 混合
生成超时时间
等待多久放弃生成本次语音,单位为秒。
MoeGoe-Simple-API 搭建教程
搭建此 VITS 后端需要至少 5GB 的磁盘空间和一个较好的 CPU(或 GPU)。
如果你是在 Windows 上进行部署,可以直接项目的 README 进行部署。
模型下载
你可以在这里下载一些训练好的 VITS 模型:
Docker 部署
你可以在 docker-compose.yaml 中加入以下内容:
然后新建一个叫做 Model 的文件夹,在里面放你下载好的模型文件。
然后写一个叫做 moegoe-config.json 的配置文件:
这里的 ./Model/1374_epochs.pth 和 ./Model/config.json 就是你放进去的模型文件。
完成之后,输入 docker-compose up -d
更新容器编排。
然后你的接口地址就是: http://moegoe:23456/voice
最后更新于