V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  binux  ›  全部回复第 214 页 / 共 338 页
回复总数  6756
1 ... 210  211  212  213  214  215  216  217  218  219 ... 338  
2015-06-02 22:19:58 +08:00
回复了 binux 创建的主题 分享创造 每天自动签到 —— 我们不造脚本,我们造框架
@lekai63 smzdm 脚本已经失效了
2015-06-02 19:29:26 +08:00
回复了 koodai 创建的主题 Ubuntu 魅族的 Ubuntu Phone 来了! MX4 Ubuntu edition 开箱全集
你这膜都不撕,是还准备卖吗?
2015-06-02 18:36:12 +08:00
回复了 dongweiming 创建的主题 程序员 JD 的评价也是纯手写么?
你没发现他们可以通过选择颜色来切换吗?
你没发现评论有颜色这一项吗?

都是一样的东西,只是信号不一样,有什么分开的必要!
2015-06-02 16:27:20 +08:00
回复了 llhh 创建的主题 分享创造 你有无法实现的小创意(硬件)吗?
续航一周的智能手机
2015-06-01 19:10:15 +08:00
回复了 codegeek 创建的主题 程序员 技术总监还要用 svn,大家怎么看?
@zhengkai 你怎么知道总监不是对比过 git 和 svn 然后选的 svn ?
2015-06-01 14:57:32 +08:00
回复了 haopic 创建的主题 问与答 怎么最大限度的做防采集?
防爬的代价是爬的10倍
2015-06-01 11:03:46 +08:00
回复了 gamexg 创建的主题 Google 一个还在开发的网站,从未对外公布,结果被 google 索引到了...
360 浏览器收集用户访问的 url —— 作恶啦!
chrome 浏览器收集用户访问的 url —— 用户体验的一大革命!
2015-05-31 23:57:14 +08:00
回复了 underone 创建的主题 问与答 煎蛋被扒站这事大家怎么看?
不存在终极的防爬手段,只能增加对方的成本。但是对于爬取来说,成本是 10 : 1 的。
但是作为做站群的来说,采集的对象实际上并不多,稍微投点人力就能解决。
2015-05-31 23:25:02 +08:00
回复了 jason52 创建的主题 分享发现 手把手教你写爬虫第六弹--pyspider 框架入门之煎蛋无聊图
@11 这样的场景,需要重载 on_result 方法,自己写数据库存储的操作。
2015-05-31 23:23:08 +08:00
回复了 jason52 创建的主题 分享发现 手把手教你写爬虫第六弹--pyspider 框架入门之煎蛋无聊图
@jason52 这个例子需要选择一下
2015-05-31 22:59:12 +08:00
回复了 jason52 创建的主题 分享发现 手把手教你写爬虫第六弹--pyspider 框架入门之煎蛋无聊图
另外看视频发现个 bug,赶紧悄悄修好了。。
2015-05-31 22:57:55 +08:00
回复了 jason52 创建的主题 分享发现 手把手教你写爬虫第六弹--pyspider 框架入门之煎蛋无聊图
首先 callback 这个概念在 pyspider 里面很重要,它指的是用哪个函数去解析抓回来的那个页面,然后在那个页面中,是点击下一页,还是抽取图片(或者两个都有),都是那个函数的代码。
然后,你并不需要手动取获取 css 选择器,点击 enable css selector helper 然后,在 web 面板点击元素,就会自动选择最合适的 css 选择器 pattern 了。
2015-05-31 22:46:17 +08:00
回复了 jason52 创建的主题 分享发现 手把手教你写爬虫第六弹--pyspider 框架入门之煎蛋无聊图
pyspider 不一定是在本地运行的,所以直接编辑文件不是那么通用
以前用 webdav 实现过在本地编辑,同步到到 webui 执行
现在这个功能还在 todo list 上
2015-05-31 19:33:24 +08:00
回复了 tangzx 创建的主题 深圳 深圳电信宽带装机员工私自问我收费 200 元,怎么办
@gdtv 到户这一段的光纤并不是电信公司负责的,一般是开发商做的。
2015-05-30 23:47:47 +08:00
回复了 imNull 创建的主题 Linux linux server 怎么 bt 下载
@msg7086 pt还在干着封ua的事,说明只要是标准实现的bt协议,他们根本无能为力。
2015-05-30 19:53:43 +08:00
回复了 binux 创建的主题 分享创造 每天自动签到 —— 我们不造脚本,我们造框架
@huaxing 因为我并不想维护那么多网站的脚本。。我只做了我用到的
2015-05-30 00:06:06 +08:00
回复了 sketch33 创建的主题 问与答 淘宝上哪家牛排比较好?
好吃就行了,管他是什么做的啊
2015-05-29 20:24:28 +08:00
回复了 bitinn 创建的主题 程序员 一个很简单问题:怎么存 URL?
根据细节,我觉得有问题的是 xss filter
2015-05-29 17:12:34 +08:00
回复了 cevincheung 创建的主题 Python python 如何在请求结束时释放资源?
为什么要释放?下一个请求来了接着用不就好了,还节约了连接的时间。
1 ... 210  211  212  213  214  215  216  217  218  219 ... 338  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   861 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 54ms · UTC 21:21 · PVG 05:21 · LAX 14:21 · JFK 17:21
Developed with CodeLauncher
♥ Do have faith in what you're doing.