V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
soratadori
V2EX  ›  Python

请教下如何登陆新浪

  •  
  •   soratadori · 2015-03-19 02:30:12 +08:00 · 2546 次点击
    这是一个创建于 3568 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我直接载入本地的cookie登录,发现并未成功。用浏览器分析之后,发现即便是带有已登录过的cookie也要分3~5步再登录。但在第一步就卡住了:

    登录/weibo.com/的之后,发生302跳转,跳转到login.sina.com.cn。
    在访问login.sina.com.cn的时候会发送几个新的cookie,但是这几个cookie我不知道是哪来的,在访问weibo.com的时候并没有得到(weibo.com只送出了2个值)。
    因为发送的cookie不完整,所以也没有返回完整的信息。接下去的步骤自然也没法做了。

    请教各位大大,如何解决?

    以上用的都是urllib的库。别提新浪 open api,用那玩意还不如不用
    5 条回复    2015-03-19 11:01:30 +08:00
    BlueWolf
        1
    BlueWolf  
       2015-03-19 09:07:29 +08:00
    用weibo.cn 通过手机端浏览器无法使用cookie的方式,在URL后附加session串来认证
    BlueWolf
        2
    BlueWolf  
       2015-03-19 09:08:48 +08:00   ❤️ 1
    http://www.jianshu.com/p/8e942437d071
    不确定你要的是不是爬东西
    soratadori
        3
    soratadori  
    OP
       2015-03-19 10:10:58 +08:00
    @BlueWolf 这篇文章的内容有点意思,虽然现在文章里的那个方法有点不太适用了(直接用get请求已经不行了),但也多亏了这个文章,发现weibo.cn和weibo.com的访问机制有很大的不同,已经成功登陆上了。
    soratadori
        4
    soratadori  
    OP
       2015-03-19 10:14:21 +08:00
    有没有人可以介绍一下,weibo.com为什么如此难登陆,要登录的话还需要破解哪些方面的内容,是不是常规的分析很难很难?
    davidlau
        5
    davidlau  
       2015-03-19 11:01:30 +08:00
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1372 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 17:23 · PVG 01:23 · LAX 09:23 · JFK 12:23
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.