V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
t1thshy
V2EX  ›  问与答

怎么实时爬取网页数据

  •  
  •   t1thshy · 2020-05-07 19:29:35 +08:00 via iPhone · 1319 次点击
    这是一个创建于 1688 天前的主题,其中的信息可能已经有所发展或是发生改变。
    怎么实时爬取一个网页的数据呢
    5 条回复    2020-05-07 19:59:56 +08:00
    kaifang
        1
    kaifang  
       2020-05-07 19:31:50 +08:00
    定时爬虫
    leejaen
        2
    leejaen  
       2020-05-07 19:54:26 +08:00 via iPhone
    rss+iffft
    t1thshy
        3
    t1thshy  
    OP
       2020-05-07 19:57:16 +08:00 via iPhone
    @leejaen 网站没有 rss 咋办
    kaiki
        4
    kaiki  
       2020-05-07 19:58:50 +08:00
    网页肯定不会主动通知你更新了啊,你只能自己周期的访问,自己来判断更新,更新了哪些,去爬哪些
    mumbler
        5
    mumbler  
       2020-05-07 19:59:56 +08:00 via Android
    linux 下用 crontab,win 下用计划任务
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2687 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 12:09 · PVG 20:09 · LAX 04:09 · JFK 07:09
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.