开源的 OCR 库对中文的识别率很低,可用的基本都是 HTTP API: https://www.v2ex.com/t/412363, https://www.v2ex.com/t/412546, https://www.v2ex.com/t/410689, https://www.v2ex.com/t/411218
寻寻觅觅,直到发现 Windows.Media.Ocr 算是中文识别率比较高的方案。
Ocr 命令行工具, 本地调用 UWP API Windows.Media.Ocr 支持多种语言识别。
https://github.com/zh-h/Windows.Media.Ocr.Cli/releases
PS C:\Tools>Windows.Media.Ocr.Cli.exe .\x.png
9·哪位科学家发现了电磁感应现象?
PS C:\Tools>Windows.Media.Ocr.Cli.exe -h
Usage: Windows.Media.Ocr.Cli.exe [options...] <image file path>
Example: Windows.Media.Ocr.Cli.exe x.png
-l <language> Default:zh-Hans-CN Specify language to reconizing
-s Show all supported languages
-h Show help like this
仅供学习参考,请勿用于服务器端生产环境。
请遵守微软 Windows Runtime 使用协议 MICROSOFT OCR LIBRARY FOR WINDOWS RUNTIME
distribute Distributable Code to run on a platform other than the Windows Store or Windows Phone;
PS: 微软提供的开发的工具和应用框架都是很不错的,不知道为什么在推行 Windows 10 Mobile 上做得如此落寞(最后的一款手机都已经下架),看到其他网站上满屏“ wx 小程序”相关的文章,内心是满满的失落。
1
xiao17174 2018-01-31 10:27:46 +08:00
顶一下.竟然有原生的 api,果然我微软大法好.
ps:我也做了个答题的辅助工具,高峰期 baidu 会过 5.6s 才返回结果,很不满意.这样一下 Ocr 的效率可以提高到极限啦. |
2
applehater OP @xiao17174 帖子被降权了,一发帖就下沉一天。不知道是不是这里谈论微软就是原罪?很多有用的 API 都不为人知。
识别选项的话要调整一下对比度,不然完全识别不了,不太熟悉 C#,可以的话给个 PR 提供图片调整对比度的功能。 |
3
yezhiye 2018-02-13 15:39:10 +08:00
感觉能用,虽然没有国内云 api 准确
|
4
applehater OP @yezhiye 这个应该是本地调用最好好的接口之一,微软也有云服务认知服务。
|