我主要用两个功能。
一是 视频转文字 ,生成一些视频教程的字幕(看教程一般是 2.5 倍播放,听声音听不清)。用过剪映、openai 的 whisper ,感觉很一般。whisper 的英文非常强,中文不太行。
二是 实时语音转文字 ,记录一些实时的感悟。以前用科大讯飞输入法,发现识别率不太行。
这俩功能在阿里云都是要钱的,但在通义听悟免费,而且效果非常好。
以下是我的邀请链接,有兴趣的可以看看:
https://tingwu.aliyun.com/u/zj78qpje6lwqxdpa