V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
bybyte
V2EX  ›  分享创造

把微信的 OCR 功能提取出来做 Docker 服务

  •  4
     
  •   bybyte ·
    golangboy · 162 天前 · 37149 次点击
    这是一个创建于 162 天前的主题,其中的信息可能已经有所发展或是发生改变。

    众所周知,微信的 OCR 识别又快又准,于是就想提出来代替某某桨的识别

    https://github.com/golangboy/wxocr

    docker 拉取下来 直接 post 请求即可

    docker pull golangboyme/wxocr
    
    curl -X POST http://localhost:5000/ocr \
      -H "Content-Type: application/json" \
      -d '{"image": "BASE64_ENCODED_IMAGE_DATA"}'
    
    246 条回复    2025-04-23 16:33:01 +08:00
    1  2  3  
    ellermister
        201
    ellermister  
       160 天前
    @superhack
    @VwEI
    我通过 web 实现了一个方便调用 https://d.852853.xyz/

    acczefly
        202
    acczefly  
       160 天前
    @nextvay 苹果都自带 ocr ,也用不上微信的 ocr 呀
    npe
        203
    npe  
       160 天前
    @VwEI 支持了 docker 部署,另外可以 fork 之后使用 https://vercel.com/ 直接部署。
    molika
        204
    molika  
       160 天前
    @ellermister #201 老哥 你这个在线识别 可以传递 jpg 等格式,但是我启动的服务无法识别,即时我转换成了 png 在调用接口也不行. 是做了什么特殊处理吗?
    fanersai
        205
    fanersai  
       160 天前
    搜了一下,已 fork ,感谢。有空了试试
    VwEI
        206
    VwEI  
       160 天前
    @ellermister 都能等
    VwEI
        208
    VwEI  
       160 天前
    @ellermister 等一个教程
    dongyulin353
        209
    dongyulin353  
       160 天前
    有 mac m 系列芯片能跑起来的吗
    nananqujava
        210
    nananqujava  
       160 天前
    docker 部署到 debian 上试了下, 有些图片可以识别, 但有很多图片 ocr_response 返回为空, 还有些只返回了部分识别数据, 不知道什么情况, 看服务端日志都是 POST /ocr HTTP/1.1" 200
    swat199538
        211
    swat199538  
       160 天前
    @kk2syc 我只想要技术文章参考
    Dreamerwwr
        212
    Dreamerwwr  
       160 天前
    @000sitereg 我看仓库是空的,作者已经删掉了吗?可以把你的仓库发我看看吗?我想试试
    superhack
        213
    superhack  
       160 天前
    @npe 赞👍🏻
    ellermister
        214
    ellermister  
       160 天前
    @VwEI 我试过这个图,通过截取不同尺寸的图片,得到的结果不相同。

    13 行的 力量,我反复通过 Win 客户端软件也会识别为 最、平、距……等奇怪的文字,但确实 Win 客户端识别准确率高很多。
    ellermister
        215
    ellermister  
       160 天前
    @molika 什么都没改,可能你 base64 搞错了,或者你服务器不支持?
    molika
        216
    molika  
       160 天前 via iPhone
    @ellermister 有些图片可以 有些不可以 和楼上 nana 说的我情况一样。明天换个服务器试一试
    superhack
        217
    superhack  
       160 天前
    @npe 试了,很赞👍🏻,要是页面能剪贴板贴图就更完美了
    GoldenDictOCR
        218
    GoldenDictOCR  
       160 天前
    @superychen 我觉着不会
    leokun
        219
    leokun  
       160 天前
    识别效果比手机上的差很远
    cherishwinner334
        220
    cherishwinner334  
       160 天前
    来晚啦?
    l4ever
        221
    l4ever  
       159 天前
    看不到了
    VwEI
        222
    VwEI  
       159 天前
    @ellermister 我用 G7505 这颗 U 是完全识别不出
    1125677925
        223
    1125677925  
       159 天前
    识别效果不好
    1125677925
        224
    1125677925  
       159 天前
    @leokun 是这样的,我部署,测试发现也是这样,效果很差
    npe
        225
    npe  
       159 天前
    @superhack 支持了,可以在线体验 https://ocr-nextjs.vercel.app/
    samun
        226
    samun  
       159 天前   ❤️ 1
    @npe 是什么机器部署的呢 我试了阿里云服务器 本地虚拟机效果都不好
    superhack
        227
    superhack  
       159 天前
    @npe 赞👍🏻
    huzhizhao
        228
    huzhizhao  
       159 天前
    牛皮,我都来晚了。还好其他老哥 fork 了
    TigerJie
        229
    TigerJie  
       158 天前
    @l4ever 有 fork
    l4ever
        230
    l4ever  
       158 天前
    授人以鱼不如授人以渔
    wcocr.cpython-312-x86_64-linux-gnu.so 是如何编译的. 能发个包到 pypi 么?
    qwwe01
        231
    qwwe01  
       157 天前
    fork 的老哥分享下 gitlhub 让我也 fork 下?
    samun
        232
    samun  
       156 天前
    用了阿里云机器 esxi 虚拟机 windows docker 效果都不好 aws 服务器就没问题 这是什么原因
    Lucoie
        233
    Lucoie  
       155 天前
    谁发个包谢谢
    wxyrrcj
        234
    wxyrrcj  
       154 天前
    删库了吗 github 没东西了
    soseek
        235
    soseek  
       152 天前
    好像是和 CPU 有关,有些不兼容或者逆向不完全
    isSamle
        236
    isSamle  
       152 天前
    {'result': {'errcode': 0, 'height': 117, 'imgpath': 'temp/4ee19412-2ede-4ae6-b19f-dcd276a343e7.png', 'ocr_response': [], 'width': 438}}
    sycxyc
        237
    sycxyc  
       150 天前
    @molika
    跟你一样仅识别出 2 个字。
    i7-1165G7 识别率效果很差,很多图一个字都识别不出来。要背景简单,统一字号,字少的的情况才能识别出大部分。
    wangxiaoer
        238
    wangxiaoer  
       142 天前
    借楼问一下:

    import wcocr
    wcocr.init(wechatocr_path, wechat_path)
    result = wcocr.ocr("D:\\test.png")

    这里的 wcocr 是一个 python 模块,但是没看到这个模块是从哪里来的?
    sycxyc
        239
    sycxyc  
       142 天前
    @wangxiaoer windows 下是 `wcocr.*.pyd`, linux 下是 `wcocr.*.so`
    aaronlam
        240
    aaronlam  
       141 天前
    @GetOctober 请问下,不能执行指的是 OCR4: OCR not supported 这个问题吗?还是解析结果错误码为 0 ,但实际没有解析到文字的问题呀?
    Marlon
        241
    Marlon  
       140 天前
    @ellermister 请问一下您那边是在 linux 跑的 docker 版本吗,我这边部署到 linux 后识别准确率差很多。
    ellermister
        242
    ellermister  
       140 天前   ❤️ 1
    @Marlon 是的,同一个镜像。
    wangxiaoer
        243
    wangxiaoer  
       138 天前 via iPhone
    @sycxyc 多谢,原来 pyd 是 c 代码编译成 python 库的产物,https://github.com/swigger/wechat-ocr 的 release 里面 demo 压缩包可以下载。
    armyHcz
        244
    armyHcz  
       138 天前
    还有包吗,哪位老哥分享个
    dasi
        245
    dasi  
       137 天前 via Android   ❤️ 2
    sparrww
        246
    sparrww  
       133 天前
    @npe 怎么你的效果这么好,说下机器呗
    1  2  3  
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   996 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 19:34 · PVG 03:34 · LAX 12:34 · JFK 15:34
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.