V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
evakiss
V2EX  ›  程序员

一直搞不懂 sitemap,是不是就是一个网站的所有 url 列表?

  •  
  •   evakiss · 2016-01-23 12:22:11 +08:00 · 4807 次点击
    这是一个创建于 3231 天前的主题,其中的信息可能已经有所发展或是发生改变。

    谷歌了很久对 sitemap 的概念还是很模糊, Google sitemap 是不是就是将一个网站的所有 url 以 xml 形式保存下来?

    3 条回复    2016-01-25 05:54:57 +08:00
    Septembers
        1
    Septembers  
       2016-01-23 12:42:55 +08:00 via Android
    目的是显示的告诉 蜘蛛 “你这个 sitemap 是你需要爬的”
    qgy18
        2
    qgy18  
       2016-01-23 13:02:16 +08:00   ❤️ 3
    sitemap 就是一个 xml ,包含你网站所有的 url ,可以指定更新日期和权重,定期更新。例如我博客的 sitemap 如下:
    https://imququ.com/sitemap.xml

    生成好 sitemap 之后,你还需要通过站长平台将其主动提交给搜索引擎,当然也可以在 robots.txt 里写上 sitemap 的地址,例如:
    https://imququ.com/robots.txt

    最后,即使你提交了 sitemap ,还是依赖于搜索引擎的 spider 主动来抓,只不过一般抓 sitemap 的频率会高于主站,因为这相当于种子。所以实际上,更好的做法是有更新之后主动 ping 引擎,例如 Google 就支持 XML-RPC 的 weblogUpdates.ping ;百度也有自己的主动推送方法,可以登录他的站长平台看。
    zonzin
        3
    zonzin  
       2016-01-25 05:54:57 +08:00 via Android
    你要的说的是一种。

    还有一种是按目录来导航的。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3521 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 10:56 · PVG 18:56 · LAX 02:56 · JFK 05:56
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.