V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
MuyuQ
V2EX  ›  程序员

千问推出了 PC 语音输入,功能和 typeless 差不多

  •  
  •   MuyuQ · 1 day ago · 2995 views
    巨头随手做的东西,就把一个创新赛道里的参赛者挤死大半。
    比功能,巨头随便投入点人力就能碾压。
    比营销,根本不是一个量级。
    比财力,比模型,这都没法比啊。。
    说的就是上半年国内蛮火的闪电说。
    更何况后面还有豆包的语音输入法蓄势待发。
    43 replies    2026-05-10 16:39:56 +08:00
    MuyuQ
        1
    MuyuQ  
    OP
       1 day ago
    有一篇爱范儿的广告可以大概了解下。
    https://www.ifanr.com/1664830
    Moonkin
        2
    Moonkin  
       1 day ago via Android   ❤️ 1
    这是啥新鲜玩意吗?把人说的话 stt ,文本送个本地小模型润色,不就行了。。。我有什么漏了的地方吗?
    ktyang
        3
    ktyang  
       1 day ago   ❤️ 1
    也不搞个 linux 的
    ChrisV5
        4
    ChrisV5  
       1 day ago   ❤️ 1
    有的,core 没啥技术含量,各家都有 tts 和 llm 。但是输入法的集成开发有很多很多细节。虽然 vibe coding 很快,但是都架不住生产级别的 bug 。有一定的工程量。
    hxzhouh1
        5
    hxzhouh1  
       1 day ago
    闪电说挺好用的,支持本地模型,自定义 api ,简单、纯粹。
    ko20
        6
    ko20  
       1 day ago   ❤️ 1
    诶,就没有哪家做一个 linux 这方面好用的客户端吗?目前 debian13+gnome48 用下来没一个满意的
    capric
        7
    capric  
       1 day ago
    原理是 asr(语音识别),llm 语义重组排版等
    有意思的是前向修正,比如你说“不对,不对”,它要理解你是否定前面说的
    另外评价标准也很意思,不是错字率而是意图达成率(是否需要手动编辑)

    typeless 开源替代
    https://github.com/cjpais/handy
    https://github.com/sypsyp97/light-whisper
    https://github.com/tover0314-w/opentypeless
    MuyuQ
        8
    MuyuQ  
    OP
       1 day ago
    @ChrisV5 是的。但开源的几个项目用起来都各有各的难受。目前最强还是 type less ,但是那玩意儿付费太贵了点。
    @capric 几个开源项目我也看过,维护是个问题,修 bug 不积极。而且差距还是挺明显的。
    @hxzhouh1 闪电说模型肯定没法和大厂比,自定义功能还是挺好用的。闪电说的优势是搭配豆包流式语音识别,但是等豆包也推出语音输入法的时候闪电说就没什么优势了。 闪电说的付费是 AI 助手,但这个方向肯定打不过千问和豆包。
    ChrisV5
        9
    ChrisV5  
       1 day ago
    @MuyuQ #8 因为我自己也手搓了一个,拿 rime + 豆包 asr + deepseek llm 。

    有些小问题,我自己能忍。但是发出去的话,bug 一堆。
    cutecore
        10
    cutecore  
       1 day ago
    豆包语音输入法发布都快半年了,官网 PC 版本还是敬请期待呢
    哪个输入法先出 linux 版本,我就支持哪一个
    hxzhouh1
        11
    hxzhouh1  
       1 day ago
    @ChrisV5 #9 您好,请问一下 rime 如何接入 豆包 asr 呢?
    ChrisV5
        12
    ChrisV5  
       1 day ago
    @hxzhouh1 #11 rime 的核心是开源的啊。拿 vibe coding 怼就行。大概跑一个 40 分钟的任务,就能跑起来吧。。
    ganbuliao
        13
    ganbuliao  
       1 day ago
    豆包的语音输入法 pc 有内测版本 我已经用一个月了
    很爽 就等豆包正式发布了
    winnerczwx
        14
    winnerczwx  
       1 day ago   ❤️ 1
    @Moonkin 想法和产品还是有差距的
    iorilu
        15
    iorilu  
       1 day ago
    这个就等巨头产品了

    除非是必须走本地
    auhah
        16
    auhah  
       1 day ago
    @ChrisV5 闪电说/typeless 都没走输入法路子,输入法相关的坑也不用踩啊。。。看上去主要功能就一条线,触发录音,丢给模型,回填内容
    ChrisV5
        17
    ChrisV5  
       1 day ago
    @auhah 回填内容没你想的这么简单,输入框的状态是非常不稳定的,他们走剪贴板,现在是个应用都读写改剪贴板。
    emberzhang
        18
    emberzhang  
       1 day ago
    豆包输入法 macOS 测试版我也试了下,问题在于它真是安装为一个输入法了,要把输入法切换到它的时候才能输入,如果状态栏的输入法切换到系统自带,就无法激活豆包的语音输入

    闪电说,lazytyper 这些压根就没按输入法安装,也就不用管系统限制
    lel020
        19
    lel020  
       1 day ago
    我希望语音输入归语音输入,输入法归输入法,语音输入法就很坑爹,挤占了输入法的位置,但作为输入法又垃圾的不行,
    AIXAPI
        20
    AIXAPI  
       1 day ago
    感觉这类产品的技术栈( ASR+LLM 润色)门槛不高,但工程细节拉满,比如实时流处理、语义纠错、输入法集成,大厂砸资源做出来的体验确实是个人项目比不了的。期待后面豆包的版本,也看看开源社区能不能跟上。
    madowenzy
        21
    madowenzy  
       1 day ago
    @ganbuliao Mac 端吧,Win 应该还没有
    HeyWeGo
        22
    HeyWeGo  
       1 day ago
    豆包的语音在 win 上的有办法用,v2 的人才提供的方法
    iorilu
        23
    iorilu  
       1 day ago
    @HeyWeGo 怎么用呢, 有链接吗
    yeh
        24
    yeh  
       1 day ago
    我和 https://v2ex.com/t/1202162 这位老哥一样,参考 https://github.com/yetone/voice-input-src ,codex 生成了一个 macos 下的来 vibe coding ,之后自己用的过程中发现了几个边界问题,补全了下边界,现在还挺稳的。

    输入端是 dji mic mini
    vvv222eeexxx
        25
    vvv222eeexxx  
       1 day ago
    @ganbuliao 可否共享一下,让大家先睹为快?
    Oo0
        26
    Oo0  
       1 day ago
    我也等个 Linu 版
    ebushicao
        27
    ebushicao  
       1 day ago
    智谱也有这个输入法,但本质就是语音转文字再用模型处理一下,我直接文字表达然后让模型处理一下效果应该会更好,毕竟文字输入还能检查一下,语音输入但凡讲多点就容易出错,而且涉及到一些专有名词的时候很容易错误,即便这种输入法都支持添加名词。
    raycool
        28
    raycool  
       1 day ago
    豆包输入法怎么还不发布 mac 端的
    XTTX
        29
    XTTX  
       1 day ago
    @ganbuliao 平时用来替代 cli 打字好用么?
    ganbuliao
        30
    ganbuliao  
       23h 22m ago
    豆包的有需要可以试试
    6ZO+5o6lOiBodHRwczovL3Bhbi5iYWlkdS5jb20vcy8xN25DYUU2cTlHMjllaERSMlF6MTEydz9wd2Q9MVljNwrmj5Dlj5bnoIE6IDFZYzc=
    ganbuliao
        31
    ganbuliao  
       23h 18m ago
    5oiR55So5aS45YWL572R55uY5YiG5Lqr5LqG44CMRG91YmFvSW1lSW5zdGFsbGVyX3YwLjUuNy56aXDjgI3vvIzngrnlh7vpk77mjqXljbPlj6/kv53lrZjjgILmiZPlvIDjgIzlpLjlhYtBUFDjgI3vvIzml6DpnIDkuIvovb3lnKjnur/mkq3mlL7op4bpopHvvIznlYXkuqvljp/nlLs15YCN6YCf77yM5pSv5oyB55S16KeG5oqV5bGP44CCCumTvuaOpe+8mmh0dHBzOi8vcGFuLnF1YXJrLmNuL3MvYjRmODkzZGQ0MDljCuaPkOWPluegge+8mnBGZjM=
    qW7bo2FbzbC0
        32
    qW7bo2FbzbC0  
       23h 13m ago
    @ganbuliao #31 这个怎么用,官网没法下载 pc 版的
    MuyuQ
        33
    MuyuQ  
    OP
       22h 31m ago
    @qW7bo2FbzbC0 https://base64.us/ 用这个转一下
    MuyuQ
        34
    MuyuQ  
    OP
       22h 5m ago
    @ganbuliao 有 PC 版吗? 第二个链接失效了。第一个是 mac 版。感谢
    JackalZhao
        35
    JackalZhao  
       19h 14m ago
    @MuyuQ 实际用了下,2s 以上的转录延迟,根本无法接受。Typeless 也用了,延迟也是一言难尽。

    你要是体验一下最新的 CapsWriter-Offline ,就能体会到真正的得心应手了,我就是作者,在 Windows 上的语音输入体验是无敌的程度。

    @AIXAPI 正符合你所说的工程细节拉满。启用 LLM 润色功能后,延迟也比 Typeless 更低。
    rizon
        36
    rizon  
       18h 55m ago via Android
    目前还没遇到比 typeless 更好用的,如果有人用过千问这个可以说下对比 typeless 是否更好。
    现在我用 typeless 的一个问题是以前可以直连,后来直连经常连不上,只能走 vpn 了,虽然也不是什么大问题吧
    emilyw
        37
    emilyw  
       9h 25m ago
    我目前手机用豆包语音输入,电脑 Windows 用的微信语音输入。感受还可
    higo4u
        38
    higo4u  
       9h 2m ago   ❤️ 1
    离线可用?
    MuyuQ
        39
    MuyuQ  
    OP
       5h 39m ago
    @JackalZhao 试用了下,挺快的。但是缺点也很突出。缺乏一个面向用户的客户端。 佬有空做一个吧。
    JackalZhao
        40
    JackalZhao  
       5h 18m ago
    @MuyuQ 写 GUI 的天才们太多了,我比不过他们。Typeless 、千问、豆包,写界面都是一把好手,但输入体验没一个比得上 CapsWriter-Offline 的。不是赚钱项目,不期待电脑水平是幼儿园的用户能都会用,我的核心追求「把输入体验做到极致」已经达成了,写个 GUI 反而是累缀。

    语音输入这件事,从第一性原理讲,本身也没有 GUI 的客观需求。

    如果有大佬能把 CapsWriter-Offline 的所有功能都拿了去,再写出一个漂亮的界面,我必当竭诚欢迎。
    lozzow
        41
    lozzow  
       4h 46m ago
    我用微信输入法的语音输入也挺好用的啊,多端同步,语音输入都挺好用的啊
    iorilu
        42
    iorilu  
       3h 35m ago
    @JackalZhao 主要是 python 不好搞界面, 想搞得好只能用 pyqt 或 pyside, 那花事件可就大了去了

    哪些输入法, 我看了基本都是 electron 搞得, 没人有精力花事件搞原生界面
    mylxsw
        43
    mylxsw  
       2h 8m ago
    不妨试试我这款 Typeflux:

    https://github.com/mylxsw/typeflux
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2843 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 90ms · UTC 10:48 · PVG 18:48 · LAX 03:48 · JFK 06:48
    ♥ Do have faith in what you're doing.