伪电工写了一个简单的程序将新闻类网站转成RSS,有一点问题: 1.目前是定时抓取,每次都会解析一遍首页和各文章网页,很多都是重复劳动。如何简单有效地判断某文章是否已经抓取过,从而避免重复抓取? 2.生成的RSS需要包含所有的文章吗,还是只要包括最新的几条就行?如果是后者,那么RSS阅读器是否可能漏掉一些老文章。 3.有什么更好的方法能实现即时推送到手机?除了RSS以外。 谢谢!