把微信的 OCR 功能提取出来做 Docker 服务

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

爱意满满的作品展示区。

这是一个创建于 271 天前的主题，其中的信息可能已经有所发展或是发生改变。

众所周知，微信的 OCR 识别又快又准，于是就想提出来代替某某桨的识别

https://github.com/golangboy/wxocr

docker 拉取下来直接 post 请求即可

docker pull golangboyme/wxocr

curl -X POST http://localhost:5000/ocr \
  -H "Content-Type: application/json" \
  -d '{"image": "BASE64_ENCODED_IMAGE_DATA"}'

微信OCR

docker服务

快速识别

246 条回复 • 2025-04-23 16:33:01 +08:00

1 2 3

❮

❯

201

ellermister

269 天前

@superhack
@VwEI
我通过 web 实现了一个方便调用 https://d.852853.xyz/

202

acczefly

269 天前

@nextvay 苹果都自带 ocr ，也用不上微信的 ocr 呀

203

npe

269 天前

@VwEI 支持了 docker 部署，另外可以 fork 之后使用 https://vercel.com/ 直接部署。

204

molika

269 天前

@ellermister #201 老哥你这个在线识别可以传递 jpg 等格式,但是我启动的服务无法识别,即时我转换成了 png 在调用接口也不行. 是做了什么特殊处理吗?

205

momo65535

269 天前

搜了一下，已 fork ，感谢。有空了试试

206

VwEI

269 天前

@ellermister 都能等

207

VwEI

269 天前

G7507 这张图片无法识别，N305 可以识别。看来就算是支持 AVX2 还有性能要求

这个图： https://miaobi-lite.bj.bcebos.com/miaobi/5mao/b%27LV8xNzM2ODA4MDYwLjkwMDc2NTQ%3D%27/0.png?authorization=bce-auth-v1%2FALTAKmda7zOvhZVbRzBLewvCMU%2F2025-01-13T22%3A41%3A01Z%2F-1%2F%2F8b6f11f7a5541e45c7eab1f9cefc78a6e95610785ab9d85d9503fa71c8f877df

208

VwEI

269 天前

@ellermister 等一个教程

209

dongyulin353

269 天前

有 mac m 系列芯片能跑起来的吗

210

nananqujava

269 天前

docker 部署到 debian 上试了下, 有些图片可以识别, 但有很多图片 ocr_response 返回为空, 还有些只返回了部分识别数据, 不知道什么情况, 看服务端日志都是 POST /ocr HTTP/1.1" 200

211

swat199538

269 天前

@kk2syc 我只想要技术文章参考

212

Dreamerwwr

269 天前

@000sitereg 我看仓库是空的，作者已经删掉了吗？可以把你的仓库发我看看吗？我想试试

213

superhack

269 天前

@npe 赞👍🏻

214

ellermister

269 天前

@VwEI 我试过这个图，通过截取不同尺寸的图片，得到的结果不相同。

13 行的力量，我反复通过 Win 客户端软件也会识别为最、平、距……等奇怪的文字，但确实 Win 客户端识别准确率高很多。

215

ellermister

269 天前

@molika 什么都没改，可能你 base64 搞错了，或者你服务器不支持？

216

molika

269 天前 via iPhone

@ellermister 有些图片可以有些不可以和楼上 nana 说的我情况一样。明天换个服务器试一试

217

superhack

269 天前

@npe 试了，很赞👍🏻，要是页面能剪贴板贴图就更完美了

218

GoldenDictOCR

269 天前

@superychen 我觉着不会

219

leokun

269 天前

识别效果比手机上的差很远

220

cherishwinner334

269 天前

来晚啦？

221

luckyc

268 天前

看不到了

222

VwEI

268 天前

@ellermister 我用 G7505 这颗 U 是完全识别不出

223

1125677925

268 天前

识别效果不好

224

1125677925

268 天前

@leokun 是这样的，我部署，测试发现也是这样，效果很差

225

npe

268 天前

@superhack 支持了，可以在线体验 https://ocr-nextjs.vercel.app/

226

samun

268 天前

@npe 是什么机器部署的呢我试了阿里云服务器本地虚拟机效果都不好

227

superhack

268 天前

@npe 赞👍🏻

228

huzhizhao

268 天前

牛皮，我都来晚了。还好其他老哥 fork 了

229

TigerJie

267 天前

@l4ever 有 fork

230

luckyc

267 天前

授人以鱼不如授人以渔
wcocr.cpython-312-x86_64-linux-gnu.so 是如何编译的. 能发个包到 pypi 么?

231

qwwe01

266 天前

fork 的老哥分享下 gitlhub 让我也 fork 下？

232

samun

265 天前

用了阿里云机器 esxi 虚拟机 windows docker 效果都不好 aws 服务器就没问题这是什么原因

233

ShenZhen

264 天前

谁发个包谢谢

234

wxyrrcj

263 天前

删库了吗 github 没东西了

235

soseek

261 天前

好像是和 CPU 有关,有些不兼容或者逆向不完全

236

isSamle

261 天前

{'result': {'errcode': 0, 'height': 117, 'imgpath': 'temp/4ee19412-2ede-4ae6-b19f-dcd276a343e7.png', 'ocr_response': [], 'width': 438}}

237

sycxyc

259 天前

@molika
跟你一样仅识别出 2 个字。
i7-1165G7 识别率效果很差，很多图一个字都识别不出来。要背景简单，统一字号，字少的的情况才能识别出大部分。

238

wangxiaoer

251 天前

借楼问一下：

import wcocr
wcocr.init(wechatocr_path, wechat_path)
result = wcocr.ocr("D:\\test.png")

这里的 wcocr 是一个 python 模块，但是没看到这个模块是从哪里来的？

239

sycxyc

251 天前

@wangxiaoer windows 下是 `wcocr.*.pyd`, linux 下是 `wcocr.*.so`

240

aaronlam

250 天前

@GetOctober 请问下，不能执行指的是 OCR4: OCR not supported 这个问题吗？还是解析结果错误码为 0 ，但实际没有解析到文字的问题呀？

241

Marlon

249 天前

@ellermister 请问一下您那边是在 linux 跑的 docker 版本吗，我这边部署到 linux 后识别准确率差很多。

242

ellermister

249 天前

@Marlon 是的，同一个镜像。

243

wangxiaoer

247 天前 via iPhone

@sycxyc 多谢，原来 pyd 是 c 代码编译成 python 库的产物，https://github.com/swigger/wechat-ocr 的 release 里面 demo 压缩包可以下载。

244

armyHcz

247 天前

还有包吗，哪位老哥分享个

245

dasi

246 天前 via Android

https://github.com/golangboy/wxocr/forks

246

sparrww

242 天前

@npe 怎么你的效果这么好，说下机器呗

1 2 3

❮

❯