试了下官方提供的 TTS 接口 https://api.openai.com/v1/audio/speech 语气是有点接近了,但是那些停顿,以及语气词,类似呃,嗯,这种类似真人一样的发音, 接口没有生成,难道是通过算法自己插入语气词,再调用 tts 生成?
1
Tubbs 338 天前 3
可以看下开源的 suno-ai/bark ,之前就有这个东西了
|
4
alanhe421 338 天前
OpenAI 的 TTS 服务本身就已经有语气了吧,直接调 API 出个 audio ,听听也是这样
|