分享一个 chrome 日语语音离线识别， Python 代码本地调用动态库实现

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 414 天前的主题，其中的信息可能已经有所发展或是发生改变。

here:

https://huggingface.co/datasets/dlxjj/soda_jp_success_call

目前只支持日语，是因为旧版的其他语言模型已经下载不到了。

Linux: 
/home/$USER/.config/google-chrome/SODA/1.1.1.7
windows:
C:\Users\%USERNAME%\AppData\Local\Google\Chrome\User Data\SODA\1.1.1.7\SODAFiles
C:\Users\%USERNAME%\AppData\Local\Google\Chrome\User Data\SODALanguagePacks
	# 语言包和 dll 在这里

关于最新版的 windows dll 调用方法还有待研究。

Chrome

日语

语音

5 条回复 • 2024-07-30 22:04:40 +08:00

kxg3030

2024-07-30 09:19:29 +08:00

谢谢分享看看以后能不能用到

Armor

2024-07-30 10:15:06 +08:00

语速很快的情况下，可以识别吗？🐶

iorilu

2024-07-30 16:43:17 +08:00

怎么个用法

和 chrome 有啥关系

有文章介绍怎么用贴一个吗

SHF

2024-07-30 21:15:51 +08:00

我最近玩了下 https://github.com/SYSTRAN/faster-whisper ，可以勉强用用。
还有 windows 的快捷键 ctrl + win + l 可以离线实时识别，效果也挺好，就是内容不能复制，急求复制方案，要是能复制就好了

siluplsy

2024-07-30 22:04:40 +08:00

@iorilu chrome 浏览器 -> 设置 -> 无障碍 -> 实时字幕 -> 自动为音频和视频创建字幕选项打勾

下面下载并选择一种语言，此时打开一个视频网站比如 youtue ，它就会实时的识别音频，并弹窗显示识别出的字幕。

上面的代码就是调用它的动态库而已。代码在 linux 下测试正常。