canwushuang 最近的时间轴更新
canwushuang

canwushuang

V2EX 第 22480 号会员,加入于 2012-06-21 18:22:02 +08:00
canwushuang 最近回复了
2023-10-28 23:45:48 +08:00
回复了 BaseException 创建的主题 生活 骑电瓶车未戴头盔被摄像头拍到,收到短信了
小区附近适当放宽。关键是自己提升安全意识,而不是靠罚款。
2022-11-11 21:42:58 +08:00
回复了 x1024m 创建的主题 分享发现 老年版才是 并夕夕 的正确打开方式
pdd 红包和支付券的叠加 buff 才是精髓。
2022-02-14 00:41:59 +08:00
回复了 miyuki 创建的主题 分享发现 [真官方出品] 微软电脑管家
总喜欢被管是什么心理?
还是 tg 好用,tg 不够那就 tg 机器人。
2022-02-12 20:41:57 +08:00
回复了 redtech 创建的主题 分享发现 发现油管一个宝藏女孩 CAN YOU FEEL THE LOVE TONIGHT (OST)
宝藏啥。。。细听本身声音很一般,后期调音很明显。视频和音频且不一致
@jifengg 恩 语音 decode 部分还是不错的,要适配各种场景可能需要调整源码的 attention.py 这块。
要么字回拼音,然后用相似度对应行业专业名词去匹配。。
@jifengg 开始是用 ws 接口测试,发现较新的模型会较敏感,可能需要加入环境音降噪会比较好。后面就直接 docker_main 去跑音频切片,单从发音上成字已经较好了,但模型整体基于字的发音结构,成词准确率还不知道需要怎么提高。现在大概思路是想把分片结果再塞入一个上下文的类隐马尔可夫链模型去纠正词语。不知道您是怎么解决的?
11 月 2 日这个是不是很敏感,容易乱出字,是否有解决办法? ps. 我还是用官方 docker 跑。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2737 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 12:34 · PVG 20:34 · LAX 05:34 · JFK 08:34
Developed with CodeLauncher
♥ Do have faith in what you're doing.