这是一个创建于 2923 天前的主题,其中的信息可能已经有所发展或是发生改变。
现在很多深度学习都是针对图像的,比如识别和换脸等项目。请问是否存在更换声音的项目呢?
比如,使用一个人(声优)的大量数据作为素材,使得以后你说的每一句话都可以被替换为该声优的声线。我依稀记得某个公司实现过,但是找不到了。另外自己做能通过 TF 实现吗?
小白求问
2 条回复 • 2018-02-15 17:30:05 +08:00
 |
|
1
inflationaaron 2018 年 2 月 14 日 via iPad
当然有了,Deepmind 的 WaveNet 就可以实现
|
 |
|
2
kslr 2018 年 2 月 15 日
Lyrebird
|