原本做内容是正在使用 TTS 的,但要人工打字,对时间轴
看最近很多的 AI 歌手,就尝试了 so-vits-svc (现在是 4.1 了),想着用它替换掉自己说话的口音,变成一个咬字清晰的普通男中音
最后发现只是浪费了 N 个小时!
浪费了 N 个小时之后的结论
网上别人分享的模型很多都是萝莉女音(又懒得自己训练)
唱歌训练出来的模型也不适合讲话,会由普通话变成四川话或河南话
使用那个最普遍的 AI 孙某著名女歌手也不行