V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Marchfish3
V2EX  ›  MacBook Pro

每次打开斗鱼都会自动下载一个.woff 格式的东西

  •  
  •   Marchfish3 · 2020-12-28 15:36:36 +08:00 · 4521 次点击
    这是一个创建于 1452 天前的主题,其中的信息可能已经有所发展或是发生改变。

    每次打开斗鱼,以及任何斗鱼新页面打开都会下载这个。我电脑安装了 NDM

    26 条回复    2021-01-11 18:59:16 +08:00
    mooyo
        1
    mooyo  
       2020-12-28 15:40:51 +08:00
    看起来像是字体文件
    wangpao
        2
    wangpao  
       2020-12-28 15:44:31 +08:00
    是字体文件,应该是网络字体
    Marchfish3
        3
    Marchfish3  
    OP
       2020-12-28 15:47:03 +08:00
    @mooyo ![iShot2020-12-28 15.33.24 的副本.png]( )
    Marchfish3
        4
    Marchfish3  
    OP
       2020-12-28 15:47:08 +08:00
    @wangpao ![iShot2020-12-28 15.33.24 的副本.png]( )
    Marchfish3
        5
    Marchfish3  
    OP
       2020-12-28 15:47:31 +08:00
    第一次在 V2EX 发布问题,还不会贴图现在知道了
    Marchfish3
        6
    Marchfish3  
    OP
       2020-12-28 15:47:36 +08:00
    ![iShot2020-12-28 15.33.24 的副本.png]( )
    zhangyangkam1
        7
    zhangyangkam1  
       2020-12-28 15:55:02 +08:00
    Web 开放字体格式( Web Open Font Format,简称 WOFF )是一种网页所采用的字体格式标准。
    可能斗鱼没判断是否已有缓存,每次都重新下载?
    Marchfish3
        8
    Marchfish3  
    OP
       2020-12-28 16:01:52 +08:00
    @zhangyangkam1 那么在 NDM 你们能设置一下不,太烦了。或者是否有其他办法可以解决
    jjplay
        9
    jjplay  
       2020-12-28 16:15:19 +08:00
    看虎牙
    liyang5945
        10
    liyang5945  
       2020-12-28 16:17:58 +08:00
    这玩意浏览器应该识别为字体文件,就像 css 一样,不应该弹出来下载的,应该是你浏览器出了问题
    Marchfish3
        11
    Marchfish3  
    OP
       2020-12-28 16:28:39 +08:00
    @liyang5945 版本 87.0.4280.67 (正式版本) (x86_64)
    Marchfish3
        12
    Marchfish3  
    OP
       2020-12-28 16:30:21 +08:00
    @liyang5945 我已经重装了两次了 Chrome
    leafleave
        13
    leafleave  
       2020-12-28 16:35:56 +08:00
    NDM 自动捕捉的问题
    xrxsh
        14
    xrxsh  
       2020-12-28 16:37:50 +08:00   ❤️ 5
    之前看过一个文章,是说斗鱼利用字体进行反爬虫的,所以无论怎么访问,都一定会下载一个不一样的字体文件。
    《斗鱼关注人数爬取 ── 字体反爬的攻与防》
    https://cjting.me/2020/07/01/douyu-crawler-and-font-anti-crawling/
    Yooe
        15
    Yooe  
       2020-12-28 16:42:21 +08:00
    好像是每次通过字体反爬虫
    caopi
        16
    caopi  
       2020-12-28 16:46:49 +08:00
    @xrxsh
    Marchfish3
        17
    Marchfish3  
    OP
       2020-12-28 17:07:39 +08:00
    @xrxsh 看来没有 NDM 就不会出现这个问题,爬虫肯定是商业需要吧,看来这个也不影响普通用户。
    但是不能没 NDM 啊
    looking0truth
        18
    looking0truth  
       2020-12-28 17:09:24 +08:00
    反爬这个记得最早见过是携程还是美团那边用的来着,所有价格全是用自定义字体
    yaphets666
        19
    yaphets666  
       2020-12-28 19:18:36 +08:00
    @xrxsh 这个大佬思路牛逼 对前端调试这块也手到擒来啊
    justin2018
        20
    justin2018  
       2020-12-28 21:02:34 +08:00
    @Marchfish3 NDM 是啥?
    ly361302747
        21
    ly361302747  
       2020-12-28 21:04:27 +08:00
    反爬的字体,你爬到的文本需要具体的算法逻辑映射出实际展示的文本
    Marchfish3
        22
    Marchfish3  
    OP
       2020-12-28 22:24:07 +08:00
    fffang
        23
    fffang  
       2020-12-28 22:49:07 +08:00
    好家伙,但我选择按键精灵+屏幕截取+OCR
    wjm2038
        24
    wjm2038  
       2020-12-28 22:50:29 +08:00 via Android
    @Marchfish3 你直接在下载器里面过滤 woff 的自动捕捉下载行为不行么
    JetMac
        25
    JetMac  
       2020-12-29 09:13:26 +08:00
    写个规则,把该域名下 *.woff 屏蔽掉
    skybig
        26
    skybig  
       2021-01-11 18:59:16 +08:00
    NDM 没有过滤选项啊,咋整
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3545 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 10:39 · PVG 18:39 · LAX 02:39 · JFK 05:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.