1
insoxin 2017-08-12 11:09:04 +08:00 via Android
没有万能的规则
|
2
zeq 2017-08-12 12:14:37 +08:00 via iPhone
这看是抓去什么内容了
如果是文章的话,可以一些文章正文提取的包来做。 如果是不同结构的,或者需要更详细的内容,可以考虑一下 data highlighter。Google 的站长工具里面就有这样一个工具,帮助站长优化搜索结果,它需要人工标记若干个页面内的数据,然后 Google 能够根据你标记的数据解析出相同类型的页面 作为参考 @binux 在他的博客里分享了一种 data highlighter 的思路 |
3
NaughtyMonkey 2017-08-14 12:56:29 +08:00
肯定是不同的网站写不同的规则。不然你想上天不成
|