1
leehon OP 在netbeans当中一切正常,百思不得将其
|
2
takwai 2013-07-28 21:21:26 +08:00 2
如果两者是抓取同一个地址,建议各导出两者抓取后的 HTML 源代码进行比较是否真得不同。
如果两者不是抓取同一个地址,代码写得严谨点, indexOf = -1 时,就不应该把值传递给 subString 了。 |
3
undeflife 2013-07-28 21:23:38 +08:00
我猜是编码问题..
|
4
scusjs 2013-07-28 21:45:36 +08:00
遇到过在eclipse和myeclipse中不一样的情况
|
5
sonicwu 2013-07-28 21:47:07 +08:00
@takwai 的思路是正确的,既然subString和indexOf的结果不同,差异肯定在操作的字符串上;若是目标页面确实返回了不同的内容,依据可能是user-agent
第一次发现有Java节点... |
6
leehon OP 发现了问题,原因在于ide和最终生产环境中。抓取到的网页代码不一样,生成环境中被服务器识别出来了,我开始用的HttpURLConnection抓取,后来用了jsoup。但在ide下都能测试通过,而编译后就不行,不知道服务器是用什么方式判定我的
|