通过 feed43 抓取微博搜索的内容，遇到 script 卡住了，求解

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 3058 天前的主题，其中的信息可能已经有所发展或是发生改变。

RT。想抓去的内容在
<p class=\"comment_txt\" node-type=\"feed_list_content\" nick-name=\"\u5927\u8fde\u65e5\u62a5\">\n\t\t<a class=\"a_topic W_linkb\" href=\"http:\/\/huati.weibo.com\/k\/%E4%BC%98%E5%8C%96%E5%A4%A7%E8%BF%9E%E8%90%A5%E5%95%86%E7%8E%AF%E5%A2%83+%E7%9C%8Bta%E5%81%9A%E5%95%A5%E8%B4%A1%E7%8C%AE?from=526\"suda-data=\"key=tblog_search_weibo&value=weibo_feed_topic\" target=\"_blank\">
里面，如何提取？求大大指步

3 条回复 • 2017-06-14 21:57:29 +08:00

Mavious

2017-06-12 13:43:09 +08:00

没有办法的，我困在网页嵌入 js （由 js 输出我想要的内容）里一筹莫展。和 LZ 遇到的、内容不直接存放在 HTML 上，是一样的情况。
我不是前端，不会分析，所以发过求分析的帖子。
被告知处理这类输出的话，对服务器有性能要求，除非自己部署在自己服务器上，否则无解的。
feed43 只能处理静态页面。

PS：我在 43 上挂了至少 30 个爬虫，虽然不是开发者，但自诩对 43 非常熟悉了。这个真真是无解的。

java

2017-06-14 12:32:14 +08:00

@Mavious 有支持 JS 抓取的 rss 站点吗？

Mavious

2017-06-14 21:57:29 +08:00 via iPhone

@java https://www.v2ex.com/t/341672#reply86