ai 已经几乎可以拟合人类的唱歌的音色了

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 887 天前的主题，其中的信息可能已经有所发展或是发生改变。

一些以音色见长的歌手的非边缘区域的声音还原得尤为逼真
比如 ai 孙燕姿
[「 AI 孙燕姿」《下雨天》 cover 南拳妈妈] https://www.bilibili.com/video/BV1Rc411W7ba

7 条回复 • 2023-04-12 15:36:38 +08:00

z4oSkDNGGC2svsix

2023-04-12 00:14:04 +08:00

求相关技术的关键字

foam

2023-04-12 00:38:58 +08:00 via Android

有关键字不老哥们

shuxiaokai

2023-04-12 01:17:14 +08:00 via Android

@foam so-vits

maolaohei

2023-04-12 01:17:36 +08:00 via Android

现在模仿音色的有（干声）高要求 diffsvc ，低要求 sovits rvc ddps ，我用了 sovits 感觉还行

zhangleijuly

2023-04-12 09:10:25 +08:00

上周看创业直播相关的产品已经都有了，不过还存在版权等问题

baobao1270

2023-04-12 09:52:47 +08:00

AI 有两种，或者说四种
从呈现结果来说，一种叫 SVC ，就是唱歌的；一种叫 TTS ，就是传统的生成说话音频
从处理方式来说，一种是 DiffSinger 为代表的合成器，通过输入乐谱（ MIDI 等）来合成声音；一种是 VITS 为代表的换声器，就是把一段音频的音色换成另一个的音色

kloseWu

2023-04-12 15:36:38 +08:00

@x02 so-vits