玩了 N 小时的 sovits 变声器，结论，目前无法替代 TTS

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 841 天前的主题，其中的信息可能已经有所发展或是发生改变。

原本做内容是正在使用 TTS 的，但要人工打字，对时间轴

看最近很多的 AI 歌手，就尝试了 so-vits-svc （现在是 4.1 了），想着用它替换掉自己说话的口音，变成一个咬字清晰的普通男中音

最后发现只是浪费了 N 个小时！

浪费了 N 个小时之后的结论

网上别人分享的模型很多都是萝莉女音（又懒得自己训练）

唱歌训练出来的模型也不适合讲话，会由普通话变成四川话或河南话

使用那个最普遍的 AI 孙某著名女歌手也不行

3 条回复 • 2023-06-11 12:02:26 +08:00

optional

2023-06-09 11:56:53 +08:00 via iPhone

试试 bark

evemoo

2023-06-09 16:27:09 +08:00

vits 和 sovits 是两个东西

garywill

2023-06-11 12:02:26 +08:00

@optional bark 是 tts 吧，虽然也号称能克隆音色，好像没查到用 bark 作变声的例子。玩 rvc 了，感觉比 sovits 好