V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  binux  ›  全部回复第 234 页 / 共 338 页
回复总数  6756
1 ... 230  231  232  233  234  235  236  237  238  239 ... 338  
2015-02-05 13:04:26 +08:00
回复了 tongle 创建的主题 Python Scrapy 爬取页面时 xpath 取到数据不正确,是不是缓存的关系?
@roricon 解决后告诉我你重启了什么。
2015-02-05 13:04:05 +08:00
回复了 tongle 创建的主题 Python Scrapy 爬取页面时 xpath 取到数据不正确,是不是缓存的关系?
@roricon proxy authorization 吗?你改变行为了,导致 CI 测试不通过。现在 proxy 是默认启用,你没有 merge 这个特性。
2015-02-05 12:58:33 +08:00
回复了 tongle 创建的主题 Python Scrapy 爬取页面时 xpath 取到数据不正确,是不是缓存的关系?
@roricon 先重启 processor 试试,不行 重启 scheduler
2015-02-05 12:52:25 +08:00
回复了 tongle 创建的主题 Python Scrapy 爬取页面时 xpath 取到数据不正确,是不是缓存的关系?
@roricon 你是怎么确认 "任务还是会被scheduler忽略" 的,任务的当前状态是什么。修改后有没有尝试重启 pyspider 。
2015-02-04 23:25:04 +08:00
回复了 tongle 创建的主题 Python Scrapy 爬取页面时 xpath 取到数据不正确,是不是缓存的关系?
你需要把失败时的页面存下来。
2015-02-04 19:12:52 +08:00
回复了 juicy 创建的主题 问与答 面试太多怎么办?
只投一个
2015-02-04 11:37:35 +08:00
回复了 SharkIng 创建的主题 问与答 Docker puppet vagrant 有什么区别/优缺点/不同之处不同用法等?
昨天还看到有人在知乎上问,docker 和 virtualenv 有什么区别。
这些东西都有什么相同点啊!
2015-02-03 16:41:47 +08:00
回复了 4faramita 创建的主题 分享发现 怀疑百度手机输入法窃取用户信息
@4faramita 你可以发个重现教程,搞个大新闻啊
2015-02-03 16:23:50 +08:00
回复了 4faramita 创建的主题 分享发现 怀疑百度手机输入法窃取用户信息
为什么从来都没人想办法重现呢?
2015-02-03 15:06:53 +08:00
回复了 binux 创建的主题 分享创造 每天自动签到 —— 我们不造脚本,我们造框架
@fezar 用 cookie 版
2015-02-03 14:48:36 +08:00
回复了 lecher 创建的主题 服务器 关于图片服务器的反爬虫处理请教
@heaton_nobu curl 不处理编码,只要你正确地把你需要的编码数据传给 curl 就行了。仔细读这句话,看你是否做到了。
2015-02-03 10:48:00 +08:00
回复了 lecher 创建的主题 服务器 关于图片服务器的反爬虫处理请教
@heaton_nobu 什么是『发送参数的编码格式』?
2015-02-03 10:36:34 +08:00
回复了 kisshere 创建的主题 问与答 phantomjs 不能抓取新浪微博和豆瓣原理是什么?
不问是不是,就问为什么,V2越来越像知乎了啊
2015-02-03 01:57:08 +08:00
回复了 lecher 创建的主题 服务器 关于图片服务器的反爬虫处理请教
谁告诉你 curl 不能伪造的

curl 'http://www.lady8844.com/h042/h28/img201501281600230.jpg' -H 'Pragma: no-cache' -H 'DNT: 1' -H 'Accept-Encoding: gzip, deflate, sdch' -H 'Accept-Language: en,zh-CN;q=0.8,zh;q=0.6' -H 'User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.17 Safari/537.36' -H 'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8' -H 'Cache-Control: no-cache' -H 'Connection: keep-alive' --compressed

学业不精
2015-02-02 19:41:44 +08:00
回复了 binux 创建的主题 分享创造 再次分享 pyspider 爬虫框架
@gogobeijing 能自己读一下报错吗
2015-02-02 16:23:35 +08:00
回复了 XadillaX 创建的主题 Node.js 查快递的包又来啦——xto
这种有时效性的包,放在包管理器里好吗?
2015-02-02 10:34:18 +08:00
回复了 djyde 创建的主题 程序员 为什么说期权都是坑爹的?大家来说说自己的亲身经历呗
@omegaga 首先,期权上一般都会写,必须在职,不能转让;其次,期权只是一个行权的『机会』,而公司没有上市之前,除了公司回购,没有其他机会行权。
所以,如果公司不配合行权,等离职后就是一沓废纸。
1 ... 230  231  232  233  234  235  236  237  238  239 ... 338  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3809 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 110ms · UTC 05:19 · PVG 13:19 · LAX 22:19 · JFK 01:19
Developed with CodeLauncher
♥ Do have faith in what you're doing.