V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
kidlfy
V2EX  ›  Python

有人做过基于多个打码平台的验证码识别的服务吗?

  •  
  •   kidlfy · 2018-09-10 11:37:46 +08:00 · 4538 次点击
    这是一个创建于 2245 天前的主题,其中的信息可能已经有所发展或是发生改变。
    最近要搞一个验证码打码的服务,要提供接口,主要功能有打码, 返回打码,成功率, 重试,发生错误,都有什么错误,有的图片可以自己识别,自己识别不了再转给打码平台

    但是没什么思路,有没有人能提供或探讨下想法
    第 1 条附言  ·  2018-09-17 10:31:24 +08:00
    现在只写了一小部分就只有多个平台并发打码,返回打码,存到数据库验证成功率, 异常重试也只在调接口部分写了一下,总之还非常不完善。。。感受到了女生思维的局限性。。。重试部分考虑的不周全。。。
    跪求大佬提出修改意见。。。。批评指教。。。🙏🙏🙏

    https://github.com/lfykid/pool_verifycode
    16 条回复    2018-09-17 10:32:36 +08:00
    letitbesqzr
        1
    letitbesqzr  
       2018-09-10 12:21:44 +08:00
    你思路都不已经说的清清楚楚了么,还要什么思路
    Phant0m
        2
    Phant0m  
       2018-09-10 14:01:15 +08:00
    犯法大佬,破坏计算机系统
    kidlfy
        3
    kidlfy  
    OP
       2018-09-10 14:10:31 +08:00
    @letitbesqzr 就是无从下手😔不知道该怎么写 我是小白
    15vnetwork
        4
    15vnetwork  
       2018-09-10 14:13:19 +08:00
    这种想法是不是就是. 我想创业了, 就是差一个程序员
    smh2208
        5
    smh2208  
       2018-09-10 14:25:50 +08:00 via Android
    这种打码平台有几个,可以看下别人怎么做的
    woshipanghu
        6
    woshipanghu  
       2018-09-10 14:43:27 +08:00
    @smh2208 最近正好缺靠谱的打码平台 推荐下
    torment5524
        7
    torment5524  
       2018-09-10 14:56:03 +08:00
    打码兔,若快,联众都用过,也自己做过,你可以去那几个打码平台看看,不知道倒闭没有,前几年用过,现在不知道倒闭没,都是提供 api 或者 http 接口的。
    之前测算过 4 位字母数字码,针对单个网站的算法这几个整体正确率都是 60-85%正确率这个区间,毕竟是适配所有 4 位数字字母码,要求不能太高了,再就是高峰打码时段 /或者是高并发的情况下,响应时间略长,几秒到几十秒不等,平时还是挺快的。自建的针对单独网站算法的,普通的 4 位码,基本学习几万组图,就可以了,正确率远高于通用型的 4 位码,而且是毫秒级出结果。
    要区分不同的码型选择,不能所有种类混在一起。
    再就是有个问题,如果是用人工智能识别打码,总会出个结果的,识别不出来什么的不存在的,只会是错的,除非你设定参数,符合某种算法结果的作为识别不了的。
    smh2208
        8
    smh2208  
       2018-09-10 15:27:21 +08:00 via Android   ❤️ 1
    @woshipanghu 用过云打码,还可以
    kidlfy
        9
    kidlfy  
    OP
       2018-09-10 16:12:52 +08:00
    其实我比较疑惑的地方是,怎么同时把一个验证码同时发给多个平台呢
    kidlfy
        10
    kidlfy  
    OP
       2018-09-10 16:13:37 +08:00
    还有就是 接口得怎么写才能方便别人调用呢
    xuanbg
        11
    xuanbg  
       2018-09-10 16:27:22 +08:00
    打码都是人工识别的,机器识别率达不到要求的,别想了。既然是人工的,那就简单了,平台无非就是一个下单一个接单。
    bobobo80
        12
    bobobo80  
       2018-09-11 14:21:00 +08:00
    看起来是要做一个接口服务,一方面提供自行识别验证码的服务,一方面作为中转,将请求代理到各个打码平台。对于自己识别,大原理上就是接收图片,然后调用模型识别。对于转发,就是统一一下接口输入的参数和格式,把各个打码平台需要的参数适配一下,转发请求。
    这个服务算是响应比较慢的了,建议使用异步的框架,里面还要转发请求,那么自带 server 和 client 的 aiohttp 比较合适了。识别的话,接触不多,之前用 tesseract 效果并不好,图片规律且有一定样本的话 tenseflow 调包训练一下效果就不错。
    kidlfy
        13
    kidlfy  
    OP
       2018-09-11 15:33:44 +08:00
    @bobobo80 大佬说的很有道理,但我在一些小的地方思路不清楚,比如怎么同步转发给多个平台,还有就是打码出错异常重试的实现也不太清楚😔
    15vnetwork
        14
    15vnetwork  
       2018-09-11 18:36:28 +08:00
    若快 我用过, 还不错, 价格也不贵
    bobobo80
        15
    bobobo80  
       2018-09-11 20:01:54 +08:00
    @kidlfy 多平台同步,不就是爬虫的并发请求嘛,开几个协程或线程同时调用各个打码平台的 api 就可以。打码出错处理看你怎么个策略了,多个平台的结果不一样时怎么取值等,这就是业务逻辑了。
    kidlfy
        16
    kidlfy  
    OP
       2018-09-17 10:32:36 +08:00
    顶一下帖子,跪求意见
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2726 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 12:33 · PVG 20:33 · LAX 05:33 · JFK 08:33
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.