首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
V2EX
›
问与答
python 抓取动态网页的问题
hatcat3
·
2013 年 5 月 11 日
· 4050 次点击
这是一个创建于 4661 天前的主题,其中的信息可能已经有所发展或是发生改变。
比如这个网页
http://image.baidu.com/channel#%E6%98%8E%E6%98%9F&%E5%88%98%E8%AF%97%E8%AF%97&0&0
里面的图片都是通过js动态生成的, 用urllib获取不到里面的图片
请问类似这种问题有好的解决方案吗?
网页
动态
图片
6 条回复
•
1970-01-01 08:00:00 +08:00
1
binux
2013 年 5 月 11 日
1
chrome打开network,看实际请求
这根本就不是解不解决方案的问题,只是你不会罢了
建议你爬之前先学学怎么写,至少了解下HTML、HTTP协议、JS、AJAX、CSS以及一种服务器语言实现。
2
ljbha007
2013 年 5 月 11 日
http://image.baidu.com/channel/listjson?fr=channel&tag1=明星&tag2=刘诗诗&sorttype=0&pn=0&rn=30&ie=utf8&oe=utf-8&1368273391754
改下参数就好了
输出数据是JSON:
http://gist.github.com/5559777
3
ljbha007
2013 年 5 月 11 日
@
Livid
V2EX的gist 问题真的很严重啊
4
phuslu
2013 年 5 月 11 日 via iPhone
可以试下g ho s t . p y
5
hatcat3
OP
2013 年 5 月 11 日
@
binux
呵呵 如果只是这个倒是可以取得 我想问的是一种通用型的解决方案
6
binux
2013 年 5 月 11 日
@
hatcat3
上浏览器引擎
关于
·
帮助文档
·
自助推广系统
·
博客
·
API
·
FAQ
·
Solana
·
1973 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 23ms ·
UTC 15:59
·
PVG 23:59
·
LAX 07:59
·
JFK 10:59
♥ Do have faith in what you're doing.
❯