V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
strak47
V2EX  ›  问与答

后台新手请教几个基本问题

  •  
  •   strak47 · 2014-02-11 11:05:32 +08:00 · 2933 次点击
    这是一个创建于 3933 天前的主题,其中的信息可能已经有所发展或是发生改变。
    1. 现在大致懂了如何让 proxy/browser 缓存,主要是 response header 那些。但不知道如何实现?
    比如一个 html 页面包括几个 css, js, image 文件,每个文件都有各自的过期时间。
    而 render 的时候只是 render('index.html') ,如何做到为每个文件设置 header ?

    2. 我现在的 vps 的 nginx 的 access 记录总会有一个
    66.249.74.153 "GET /wiki/238 " 200 "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
    虽然写着 googlebot ,但每秒一次的频率会不会有点不正常? 换做你们会 block 掉吗?

    3. 于是我把上面的 ip 段在 nginx 里 deny 掉了,现在返给它的只有 403.
    但昨天我又在 nginx 里加了一条 rewrite 记录:
    rewrite ^/(.*)/$ /$1 permanent;
    这样用户访问 /abc/ 会301 跳到 /abc
    但发现那个 googlebot 现在 GET /abc/ 不会马上 403 而是先 301 到 /abc 再 403.
    我想问为什么不是 deny 优先的,有什么方法让它一来直接 403 forbidden 吗?

    先谢谢了!!
    4 条回复    1970-01-01 08:00:00 +08:00
    strak47
        1
    strak47  
    OP
       2014-02-11 14:01:02 +08:00
    求不沉……
    orzfly
        2
    orzfly  
       2014-02-11 14:19:18 +08:00   ❤️ 1
    nslookup 66.249.74.153 8.8.8.8
    Server: 8.8.8.8
    Address: 8.8.8.8#53

    Non-authoritative answer:
    153.74.249.66.in-addr.arpa name = crawl-66-249-74-153.googlebot.com.

    反正那个确实是 Googlebot 吧……
    orzfly
        3
    orzfly  
       2014-02-11 14:20:56 +08:00   ❤️ 1
    缓存头用 nginx 加吧,比方说我服务器上用了这个:

    location ~* .(ogg|ogv|svg|svgz|eot|otf|woff|mp4|ttf|css|rss|atom|js|jpg|jpeg|gif|png|ico|zip|tgz|gz|rar|bz2|doc|xls|exe|ppt|tar|mid|midi|wav|bmp|rtf)$ {
    expires max;
    }
    strak47
        4
    strak47  
    OP
       2014-02-11 16:25:36 +08:00
    @orzfly 感谢~ 看来果然应该是在 nginx 设置 header 的
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1040 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 22:32 · PVG 06:32 · LAX 14:32 · JFK 17:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.