有没有小型的数字 / 英文 OCR 模块可以集成进 C++写的小工具里面？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 1284 天前的主题，其中的信息可能已经有所发展或是发生改变。

数字 / 英文的字体 / 大小都是固定的，不包含中文或任何符号，都是软件生成的图片，没有任何扭曲 / 倾斜，识别起来难度应该不大吧。体积越小越好，最好 <2MB 。请问有没有这样的开源模块？

第 1 条附言 · 2022-03-01 18:32:22 +08:00

是性能很烂，硬盘很小还没有联网的工控机。或者有什么更好的方案么？

6 条回复 • 2022-03-01 23:25:37 +08:00

janus77

2022-03-01 17:49:28 +08:00

用在线 api 吧

rv54ntjwfm3ug8

2022-03-01 18:32:52 +08:00

@janus77 #1 工控机，没有联网

3dwelcome

2022-03-01 18:39:39 +08:00

好像网上的 AI 入门第一课，就是写你这个英文和数字识别。

实在不行自己写一个呗。

ysc3839

2022-03-01 18:43:32 +08:00 via Android

看看 Tesseract?也许自己裁剪一下能减小大小

thedrwu

2022-03-01 19:00:03 +08:00 via Android

08/09 年刚有 github 的时候花了一周时间写了个简陋但是快速的 ocr ，投影分割+归一化边界距离向量。不熟悉 github 的玩法，常常收到 fork/pr 嫌麻烦，于是删库了，再后来本地源码也丢失了

Hconk

2022-03-01 23:25:37 +08:00 via iPhone

做过类似场景下在工控机上用 opencv 的 knn 识别，不过只有数字没有字母，时间快效果还挺好。先用相同字体分割出来的图训练出来 label ，用的时候加载提前训练好的 label ，把分割的字符用 knn 分类就行了。不过感觉如果包含字母效果就不一定了，像 O 和 0 就不好区分。