1
xylophone21 2020-09-28 11:51:38 +08:00
Google mnist PyTorch, 大把代码跑到 9X%+,X 大概是 5678
|
2
rimutuyuan 2020-09-28 11:53:32 +08:00
百度智能云 ocr 识别 api,一天很多次免费额度
|
3
supermoonie 2020-09-28 11:55:03 +08:00 via iPhone
飞浆
|
4
miaomiao888 2020-09-28 12:53:36 +08:00
试试 PandaOCR 各种 OCR 引擎自个挑
但如果想要离线库那没啥可推荐的,识别效果基本都不如在线的 |
5
shm7 2020-09-28 13:00:51 +08:00
你放在 go 这个主题下,让我不晓得怎么回答。
第一你这里的截图是什么样的不知道,不晓得识别难度。如果是比较规整的,肯定比歪歪斜斜的好识别。沙发说什么 9X%我觉得可能是微信号看多了。谷歌最赚钱的 youtube 的机器翻译也只能适合慢速不带口音的翻译。稍微复杂一点的情况,错误也会频繁出现。 如果你懂 DL/CV,可以看看 attentionOCR 这种端到端的模型,在歪斜形变的场景也能保持一定的识别率。但是问题是没有中文的训练数据,英文数字应该有。有个同事做过这方面的事情,我有点耳闻。 |
6
shm7 2020-09-28 13:03:26 +08:00
谷歌有过一个识别规整英文数字验证码的开源方案,比较老了,叫 tesseract (对,就是雷神那个东西)。你可以试试。我们这边做验证码识别不太行。
|
7
legendnan OP @shm7 图片是带有颜色的,绿色黄色橙色等根据数字大小来确定颜色。主要是想用 go 写就发在这里了。识别内容就是数字。到现在我也不会在 V2EX 上发图片。要不就发图了
|
8
z21victor 2020-10-14 15:47:02 +08:00
如果只是英文和数字,github.com/otiai10/gosseract 这个应该是可以的。中文的话,基础的模型识别效果都不太好
|