V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
louhang
V2EX  ›  Python

高德地图/淘宝,阿里的验证码用 selenium 效果不是很好呀?

  •  
  •   louhang · 2018-11-25 15:47:08 +08:00 · 4318 次点击
    这是一个创建于 2197 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近在做高德地图 poi 的采集,有时会出现“休息一会”的滑块验证码,发现尽然和淘宝的一样,用 selenium 去模拟的时候发现就算添加了鼠标抖动,滑动速度拟人化的操作之后返回的还是验证失败,点击重试,有大佬解决过这种问题的吗?!!

    10 条回复    2018-12-28 15:57:21 +08:00
    Northxw
        1
    Northxw  
       2018-11-26 00:24:45 +08:00 via Android
    假设你遇到的是极验, 你以为极验验证很容易吗, 机器学习加上千万个人机样本, 就是给你这种人用的, 哈哈😄
    louhang
        2
    louhang  
    OP
       2018-11-26 16:35:39 +08:00
    @Northxw 极验的还真没有阿里的这个难,我拿着这套操作骗过了极验但是没骗过阿里的滑块验证。
    cxbanana
        3
    cxbanana  
       2018-11-26 17:45:11 +08:00
    因为阿里会进行 selenium 检测 只要发现你是通过 selenium 驱动的 不管怎么样都要滑块验证 而且手动滑都通过不了
    tanglijun
        4
    tanglijun  
       2018-11-26 18:09:39 +08:00
    @cxbanana 群里看到有人用 slenium 通过了天猫滑块验证(视频)!我觉得应该是与 selenium 操作滑块速度有关吧!!
    Northxw
        5
    Northxw  
       2018-11-26 19:31:08 +08:00
    @louhang 哈哈 也是哦,一个加速度公式就 ojbk 了。 不过京东(只知道京东)你用 selenium 驱动,就会出现滑块验证,前提是你清除 cokkies 等,亲测。
    cxbanana
        6
    cxbanana  
       2018-11-27 08:54:24 +08:00
    @tanglijun 是么~ 可能网站不同,我登录的是阿里钻展,里面 js 文件会进行 selenium 检测,然后直接用 fiddler 捕获更改请求的 js 文件 就不会出现滑块验证了
    louhang
        7
    louhang  
    OP
       2018-11-27 09:59:54 +08:00
    @cxbanana 我发现用 selenium 添加代理之后会有很大几率不出现滑块验证,我的初衷是想用 selenium 去滑动验证码通过之后获取 cookie 中的一个 x5sec 参数,如果用 requests 发送 url 链接不带这个 cookie 的话,可能会访问 10 几次就会给你重定向到滑块验证页面,所以很纠结呀!!!!!
    cxbanana
        8
    cxbanana  
       2018-11-27 10:29:20 +08:00
    @louhang 这个你可以捕获一下请求的 index.js 文件 看下里面是否会进行 webdriver 的判断,如果会进行判断的话,就下载该 js 文件,把 webdriver 字段的判断返回由 True 改为 Flase 后另存为一个文件,然后用 fiddler 捕获请求 index.js 文件的接口,将该文件进行替换,这样就应该不会出现滑块验证了。
    515576745
        9
    515576745  
       2018-12-26 18:13:29 +08:00
    有没有大佬解决了。。。?
    frogex
        10
    frogex  
       2018-12-28 15:57:21 +08:00
    @cxbanana 这些方法我试过,有些数据不是登录 cookie 就行了,要一个 x5sec 的校验才能获取,这个 x5sec 有效期半小时。
    我试过了在 mitmdump.exe 下注入 html 代码,修改 navigator.languages,plugins,webdriver
    然后在 sufei_data.index.js 替换了重点 2 个判断,现在的结果是,打开 chrome,手动大概率能过滑块,但自动好像还是一次都过不了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1004 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 19:39 · PVG 03:39 · LAX 11:39 · JFK 14:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.