V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  dizzy  ›  全部回复第 8 页 / 共 9 页
回复总数  162
1  2  3  4  5  6  7  8  9  
2014-07-09 23:44:43 +08:00
回复了 esplendo 创建的主题 推广 喜获融资 5000 万美元,UCloud 云计算送书啦! [第一波]
[email protected]
祝V2EX和UCloud越办越好.
2014-07-09 23:35:55 +08:00
回复了 dizzy 创建的主题 Python 请问下,python 常用的标准库有哪些呢?
@halfcrazy 谢谢回复,用requests可以代替urllib和urllib2吗?
2014-07-09 23:13:46 +08:00
回复了 MonkLuf 创建的主题 程序员 为什么大家这么喜欢《HTTP 权威指南》
@jiangpeng 好的,谢谢了.
2014-07-08 19:10:39 +08:00
回复了 MonkLuf 创建的主题 程序员 为什么大家这么喜欢《HTTP 权威指南》
JavaScript高级程序设计
规则是什么?
2013-12-26 19:39:56 +08:00
回复了 pc10201 创建的主题 Python yinyuetai.com音悦台 80万数据采集
@pc10201 好的。
2013-12-26 16:48:12 +08:00
回复了 pc10201 创建的主题 Python yinyuetai.com音悦台 80万数据采集
@pc10201 LZ,能否看下你写的代码,学习下。
2013-12-17 10:37:13 +08:00
回复了 dizzy 创建的主题 Python 问大家一个python写网络爬虫程序的问题。
@qu2ena 貌似你也是才学python?
2013-12-09 11:22:16 +08:00
回复了 dizzy 创建的主题 Python 问大家一个python写网络爬虫程序的问题。
@Sylv 刚刚去看了下python json模块的解释,虽然还是不懂你是怎么做到的,但是感觉这个办法挺简单的(我之前确实不能处理加载更多的情况)。可能是我对javascript不了解的原因吧。
2013-12-09 10:13:35 +08:00
回复了 dizzy 创建的主题 Python 问大家一个python写网络爬虫程序的问题。
@Sylv 请问下这个是怎么做出来的?
2013-12-09 10:13:04 +08:00
回复了 dizzy 创建的主题 Python 问大家一个python写网络爬虫程序的问题。
@alexrezit 额。。。只是试试。
2013-12-09 10:12:39 +08:00
回复了 dizzy 创建的主题 Python 问大家一个python写网络爬虫程序的问题。
@Lelouchcr 哎,我也不是说全得用基本库吧,就是先想用基本库做做,然后再用第三方。都得熟悉熟悉嘛。
2013-12-09 09:37:03 +08:00
回复了 dizzy 创建的主题 Python 问大家一个python写网络爬虫程序的问题。
@alexrezit 现在大家写网络爬虫都不用正则了吗?
2013-12-09 09:36:28 +08:00
回复了 dizzy 创建的主题 Python 问大家一个python写网络爬虫程序的问题。
@Lelouchcr 谢谢,又找到个资料,这个是google的python课?英语暂时比较捉急。
2013-12-09 09:34:33 +08:00
回复了 dizzy 创建的主题 Python 问大家一个python写网络爬虫程序的问题。
@hiwljun
@kevinkim
@wizardoz
@luoyou1014 谢谢推荐,我准备尽快熟悉下beautiful soup和pyquery。
2013-12-09 08:56:26 +08:00
回复了 dizzy 创建的主题 Python 问大家一个python写网络爬虫程序的问题。
@jackjm 好的,谢谢你的提供,不过暂时还没有开始了解3。
2013-12-09 04:23:52 +08:00
回复了 dizzy 创建的主题 Python 问大家一个python写网络爬虫程序的问题。
@Livid 这个我大概知道,我只是想在搞懂python基本库的情况下,再用第三方库。
2013-12-09 04:10:49 +08:00
回复了 dizzy 创建的主题 Python 问大家一个python写网络爬虫程序的问题。
@KK233
@vmebeh 代码终于可以运行了。非常感谢你们。我的正则表达式基础还需加强啊。不知道你们的正则表达式在哪学的。只需要看看这个吗?https://deerchao.net/tutorials/regex/regex.htm
最后我的代码是这样写的:
import urllib2
import urllib
import re

pat = re.compile('<img src="(.*?)"')
html = urllib2.urlopen('http://lumeizhi.com').read()
imglist = pat.findall(html)
i = 1
for x in imglist:
url = 'http://lumeizhi.com' + x
urllib.urlretrieve(url, 'D:\pic\%s.jpg' % i)
i = i + 1
2013-12-09 03:43:17 +08:00
回复了 dizzy 创建的主题 Python 问大家一个python写网络爬虫程序的问题。
@KK233 我用'<img src=".*?"'这样的正则表达式又试了下煎蛋网,过滤出了'<img src="http://ww4.sinaimg.cn/xxxxxxxxxxx.jpg"'这样的地址,但是这个图片地址前面有<img src字样,我怎么才能下载呢?
1  2  3  4  5  6  7  8  9  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5656 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 22ms · UTC 06:48 · PVG 14:48 · LAX 22:48 · JFK 01:48
Developed with CodeLauncher
♥ Do have faith in what you're doing.