rt 请问安卓是否有自带包可以实现?目前最好用的一般是走什么方案?谢谢~
1
dayeye2006199 3 天前 via Android
不需要本地就随便找个 API
|
2
Yiverin OP @dayeye2006199 您一般推荐什么 api 呀?而且我的需求不是实时的。比如 1 小时的录音转文本
|
3
unclemcz 3 天前 via Android
长音频转录当前好像还没看到有纯客户端方案。
|
5
unclemcz 3 天前 via Android 1
@Yiverin 性能跟不上吧,举个例子,我用 4070laptop ,转录一个小时的音频,差不多 5 分钟左右,这还是用 whisper turbo 模型的情况下。同样模型,手机端估计没办法。
|
6
unclemcz 3 天前 via Android 1
实时转录也就几十秒,体验会好很多。
|
7
felixlong 3 天前 1
有支持 Android 的客户端方案,而且是 Whisper:
https://github.com/ggerganov/whisper.cpp |
11
hahiru 3 天前
语音转文字用飞书就挺好。客户端效果非常不错。
|
13
magicZ 2 天前
当然是新一代的 kaldi ,文档详细功能强大, https://github.com/k2-fsa/sherpa-onnx
|
14
ykrank 2 天前
借楼问一下,有没有本地图像识别的 SDK ?最好免费的模型
|
15
ykrank 2 天前
识别图片里的文字
|
17
luaex 2 天前
ASR 建议用 sherpa
|
18
luaex 2 天前
@ykrank cnocr 里面的那些 onnx 的模型也许能试一下 https://github.com/SvenVincent/cnocr
|
19
XXWHCA 2 天前
|