V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
rupert
V2EX  ›  Node.js

玩了下 tesseract.js,自动识别文字的库,发现不准

  •  
  •   rupert · 2016-11-22 19:44:22 +08:00 · 4828 次点击
    这是一个创建于 2918 天前的主题,其中的信息可能已经有所发展或是发生改变。

    就测了下中文,发现不准啊,只用浏览器测了, npm 还装不了,报错

    https://github.com/naptha/tesseract.js

    4 条回复    2017-02-06 14:34:14 +08:00
    frankerzeng
        1
    frankerzeng  
       2016-11-22 20:06:27 +08:00
    自己训练一下字库,准确率高很多
    Tyanboot
        2
    Tyanboot  
       2016-11-23 08:08:30 +08:00 via Android
    这个得自己训练。自带的库太弱了。识别英文和数字到没问题。
    gemchen
        3
    gemchen  
       2016-11-28 15:10:49 +08:00
    玩过这个库的 C 版本,要自己训练的。以前做过彩票内容自动识别的
    erictaoy
        4
    erictaoy  
       2017-02-06 14:34:14 +08:00
    训练完识别率还可以
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3231 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 12:49 · PVG 20:49 · LAX 04:49 · JFK 07:49
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.