首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
V2EX
›
问与答
微博、微信公众号现在有什么比较好的爬虫方案吗?
cqcn1991
·
2016-04-06 18:33:20 +08:00
· 3031 次点击
这是一个创建于 3445 天前的主题,其中的信息可能已经有所发展或是发生改变。
想定期爬几个微博号、公众号的数据,做个信息汇总的网站 但是不知道现在微博和公众号的爬取难度如何?
公众号
爬取
爬虫
微博
8 条回复
•
2016-05-01 17:55:41 +08:00
1
liaowu
2016-04-06 18:55:30 +08:00 via iPhone
公众号爬搜狗就好了。历史文章都有
2
cqcn1991
OP
2016-04-06 19:00:36 +08:00 via iPhone
@
liaowu
话说有没例子?还是得做 cookies 那种?
3
zcoder
2016-04-06 19:35:14 +08:00
@
cqcn1991
不需要 cookie ,直接从
http://weixin.sogou.com/
爬取
4
cqcn1991
OP
2016-04-06 20:14:45 +08:00
@
zcoder
有现成的例子嘛...我打开的话,比如
http://weixin.sogou.com/gzh?openid=oIWsFt5VXo_r9FO8m6f3vJ7XpYrE&ext=KyZuplSC23Ks2fd6j023fb1Ok8RDlXz7l0tb4XTqfw7ibVq4seKWRxnN9rE9Kt5F
还是看不到信息
5
dong3580
2016-04-06 20:33:42 +08:00 via Android
用 c#上的 webbrower 爬取,不过微博可能翻页会有验证码
6
vvaaiinn
2016-04-08 18:58:29 +08:00
@
cqcn1991
楼主你好、最近也在搞这个、但是水平有限、不知道怎么免过登陆、可否加个联系方式交流交流
7
cqcn1991
OP
2016-04-08 19:54:49 +08:00
@
vvaaiinn
我也是啊...不知道怎么搞....我根本抓不到相关的信息
8
cqcn1991
OP
2016-05-01 17:55:41 +08:00
@
liaowu
@
zcoder
@
dong3580
已经基本解决了小量的爬取,我自己是 Ruby ,用的 PhantomJS
凑合着用吧...
关于
·
帮助文档
·
自助推广系统
·
博客
·
API
·
FAQ
·
实用小工具
·
984 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 30ms ·
UTC 22:31
·
PVG 06:31
·
LAX 15:31
·
JFK 18:31
Developed with
CodeLauncher
♥ Do have faith in what you're doing.
❯