V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  anexplore  ›  全部回复第 6 页 / 共 7 页
回复总数  140
1  2  3  4  5  6  7  
2015-11-02 16:34:33 +08:00
回复了 est 创建的主题 Python 这么多搞爬虫的,有木有直接解析 HTML 的呀?
渲染以后可以得到更多信息,比如位置、字体大小等等,抽取起来当然更准确;但是渲染网页还是很费时的。
2015-10-30 12:32:16 +08:00
回复了 ray0625 创建的主题 问与答 java 用 HttpClients 请求 url 返回状态码是 503 怎么处理?
从浏览器看看 Request Header 有哪些,想 Refer 、 Cookie 、 UA 等
2015-10-23 10:37:21 +08:00
回复了 HentaiMew 创建的主题 Ubuntu 快点升级 Ubuntu15.10 吧!
一直用 14.04 lts
2015-10-19 11:25:14 +08:00
回复了 RangerWolf 创建的主题 Java 问一个 Java 内存泄漏的问题
不存在了;这里面的泄露是发生在 jvm 管理的堆里面,其实你在程序中将 v = null;就可以通过 gc 回收内存了
2015-09-25 11:10:58 +08:00
回复了 oska874 创建的主题 Linux ubuntu,fedora,arch,怎么选择?
在公司一直用 ubuntu ,搞个大内存
2015-09-25 10:29:56 +08:00
回复了 honam 创建的主题 程序员 关于工作后算法的使用,你真会经常用吗?
后端算法还是用的挺多的
2015-09-24 23:43:08 +08:00
回复了 wohenyingyu01 创建的主题 问与答 pac 如何实现 block 一个 url
@wohenyingyu01 使用 pac 方每次都连接超时。
2015-09-24 22:14:04 +08:00
回复了 wohenyingyu01 创建的主题 问与答 pac 如何实现 block 一个 url
返回错误的 proxy 就行吧
2015-09-24 09:40:16 +08:00
回复了 modkzs 创建的主题 程序员 HBase 的 WAL 日志存在意义
hbase 写数据是先放在内存里的,到达一定量后才 flush 到存储。如果没 flush 之前,机器挂了,内存中的数据就丢失了。如果写了 WAL 那么其他机器就可以根据 log 恢复数据。
WAL 是影响性能的,你可以选择关闭 WAL ,你可以选择关闭 WAL ,你可以选择关闭 WAL
2015-09-21 09:40:41 +08:00
回复了 modkzs 创建的主题 程序员 HBase 的 WAL 日志存在意义
@modkzs wal 存储在 hdfs 上,它是一种保险机制,有它丢失数据概率降低。也可以选择关闭写 log
2015-09-20 20:10:25 +08:00
回复了 modkzs 创建的主题 程序员 HBase 的 WAL 日志存在意义
如果 memstroe 中的数据还没 flush ,宕机就丢失了;可以用 wallog 恢复吧
2015-09-15 20:37:01 +08:00
回复了 wangccddaa 创建的主题 问与答 闲逛的都进来,帮我做个选择题(手机选择综合症)
no 魅族
2015-09-14 20:19:43 +08:00
回复了 painter 创建的主题 问与答 怎么看北京的房价,多少人今年买的房?
首付百分之多少啊
2015-09-08 19:40:41 +08:00
回复了 anexplore 创建的主题 Java apache httpasyncclient 的 direct memory 内存一直增长,直到 oom
@armstrong 这个可以方便的自己控制跳转吗?比如控制最大跳转次数,拿到每次跳转的 HTTP 头
2015-08-19 23:36:42 +08:00
回复了 blackboom 创建的主题 Java JAVA 获取时间不正确
看一下 java.util.TimeZone 的获取 timezone 的源码吧,
private static synchronized TimeZone setDefaultZone () {
TimeZone tz;
// get the time zone ID from the system properties
String zoneID = AccessController.doPrivileged (
new GetPropertyAction ("user.timezone"));

// if the time zone ID is not set (yet ), perform the
// platform to Java time zone ID mapping.
if (zoneID == null || zoneID.isEmpty ()) {
String country = AccessController.doPrivileged (
new GetPropertyAction ("user.country"));
String javaHome = AccessController.doPrivileged (
new GetPropertyAction ("java.home"));
try {
zoneID = getSystemTimeZoneID (javaHome, country );
if (zoneID == null ) {
zoneID = GMT_ID;
}
} catch (NullPointerException e ) {
zoneID = GMT_ID;
}
}}
。。。。。。。。。。
}
2015-08-04 23:27:19 +08:00
回复了 Fing 创建的主题 Python 基于 python 写的一个 google 的爬虫
@Fing 代理ip?
2015-08-04 23:16:09 +08:00
回复了 Fing 创建的主题 Python 基于 python 写的一个 google 的爬虫
google会封你不
j2se基础一定要好啊,要明白各个数据结构底层代码如何实现的,例如hashmap、concurrenthashmap实现等等;并发编程;算法也是必须的;这些基础打好了,后面就好说了。
2015-07-14 19:18:24 +08:00
回复了 mjoseph 创建的主题 MacBook Air 你们都如何清洗和维护 mac 的屏幕的
眼镜布擦擦就行了
1  2  3  4  5  6  7  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   937 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 31ms · UTC 21:42 · PVG 05:42 · LAX 13:42 · JFK 16:42
Developed with CodeLauncher
♥ Do have faith in what you're doing.