把 Tesseract.js 包装成直接能用的网站了,全程在你的浏览器中识别,不需要上传。
个人主要用来识别测试反馈的截图, 抓里面的 TraceID 和接口调用参数,使用体验还不错。
对英文的识别效果还可以,中文的有点菜。
在线体验版: https://ocr.zjyl1994.com/
Github: https://github.com/zjyl1994/lazydogocr
注意:需要你的浏览器支持 WASM ,在线体验版部署在 CF Pages 上,加载训练数据需要 10 多 MB ,可能不会太快。
1
jeesk 2022-09-25 11:54:24 +08:00 via Android
10s 都识别不出 😂
|
2
zjyl1994 OP @jeesk 网络原因?训练数据在 cf pages 上估计没拉下来。超高分辨率的图片也有可能很慢
|
4
Kiriya 2022-09-25 16:15:00 +08:00
可以考虑打包成本地应用😁
|
5
HugoChao 2022-09-25 16:54:25 +08:00
用了一下 感觉不错
|
6
mozila 2022-09-25 21:54:37 +08:00
先 m
|
7
HiCoder 2022-09-25 22:23:09 +08:00
试了下,不错
|
8
zjyl1994 OP @Kiriya 仓库拖下来用任何一个 http 服务器提供服务就可以了,打包本地应用我还不会弄,前端苦手
|
9
subframe75361 2022-09-26 08:55:26 +08:00
好东西,可以考虑做个 pwa ?
|
10
ShuaiYH 2022-09-26 09:11:56 +08:00
个人感觉这个库识别率有点低,特别是对于手写的
|
11
Aying 2022-09-26 10:11:35 +08:00
|
12
villivateur 2022-09-26 10:38:21 +08:00
中文识别,为什么每个字之间都会多出一个空格?
|
13
vantis 2022-09-26 11:38:43 +08:00
中文可以试试 paddle 阿里云有一件部署的 感觉识别率挺高
我是本地用 python 跑的 搭配 Alfred workflow 除了慢都挺好…… |
14
vtwoextb 2022-09-27 08:14:34 +08:00
现在开源的深度学习框架很多都包括 OCR ,这东西比较费资源
|
15
marvinemao 2022-09-27 09:39:09 +08:00
感觉不错
|
16
macy 2022-09-27 13:56:29 +08:00
基于这个库做过一个 pdf 识别的软件,除了慢点,效果还好,可以做精准识别,配置截图,将大图截取指定部分,会快很多,也会准确一些
|
17
caomingjun 2022-09-28 23:49:53 +08:00
如果只开发 Windows 应用,可以试试自带的 OCR: https://learn.microsoft.com/en-us/uwp/api/Windows.Media.Ocr?view=winrt-22621
|
18
bianz103 2022-10-05 18:46:13 +08:00
昨天把 paddleocr 整合到本地软件 verycapture 了,识别速度大概 8 秒左右,建议楼主可以试试
|
20
Endocryne 2023-10-12 14:55:30 +08:00
识别率不是很理想
|