识别图片中的文字与数字

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

The Go Programming Language

› http://golang.org/

› Go Playground

Go Projects

› Revel Web Framework

这是一个创建于 1558 天前的主题，其中的信息可能已经有所发展或是发生改变。

大佬们，我想识别一个图片中的数字，他是网页上的我想给他截图保存下来。然后用程序去识别他里面的数字。请问这个识别率高的库都有什么？

识别

数字

图片

请问

8 条回复 • 2020-10-14 15:47:02 +08:00

xylophone21

2020-09-28 11:51:38 +08:00

Google mnist PyTorch, 大把代码跑到 9X%+，X 大概是 5678

rimutuyuan

2020-09-28 11:53:32 +08:00

百度智能云 ocr 识别 api，一天很多次免费额度

supermoonie

2020-09-28 11:55:03 +08:00 via iPhone

飞浆

miaomiao888

2020-09-28 12:53:36 +08:00

试试 PandaOCR 各种 OCR 引擎自个挑
但如果想要离线库那没啥可推荐的，识别效果基本都不如在线的

shm7

2020-09-28 13:00:51 +08:00

你放在 go 这个主题下，让我不晓得怎么回答。

第一你这里的截图是什么样的不知道，不晓得识别难度。如果是比较规整的，肯定比歪歪斜斜的好识别。沙发说什么 9X%我觉得可能是微信号看多了。谷歌最赚钱的 youtube 的机器翻译也只能适合慢速不带口音的翻译。稍微复杂一点的情况，错误也会频繁出现。

如果你懂 DL/CV，可以看看 attentionOCR 这种端到端的模型，在歪斜形变的场景也能保持一定的识别率。但是问题是没有中文的训练数据，英文数字应该有。有个同事做过这方面的事情，我有点耳闻。

shm7

2020-09-28 13:03:26 +08:00

谷歌有过一个识别规整英文数字验证码的开源方案，比较老了，叫 tesseract （对，就是雷神那个东西）。你可以试试。我们这边做验证码识别不太行。

legendnan

2020-09-28 14:34:24 +08:00

@shm7 图片是带有颜色的，绿色黄色橙色等根据数字大小来确定颜色。主要是想用 go 写就发在这里了。识别内容就是数字。到现在我也不会在 V2EX 上发图片。要不就发图了

z21victor

2020-10-14 15:47:02 +08:00

如果只是英文和数字，github.com/otiai10/gosseract 这个应该是可以的。中文的话，基础的模型识别效果都不太好