V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
dbzz
V2EX  ›  Cloudflare

Cloudflare 网站监测跟其它监测工具的监测结果差异这么大么?

  •  
  •   dbzz · 2023-12-20 00:59:51 +08:00 · 3895 次点击
    这是一个创建于 367 天前的主题,其中的信息可能已经有所发展或是发生改变。

    先上网站地址(一个租房工具网站): https://dbzz.house/
    网站放在 Cloudflare 上,也尽量使用了 Cloudflare 的工具,包括域名、DNS 、Cache 、HTTPS 证书、WAF 等。
    Cloudflare 有个 Analytics & Logs 工具,提供了基础的网站监测功能,主要是 PV 、UV 、Bandwith 这些。

    自己另外加了些监测工具,主流的应该都加了:GA4(Google Analytics 4)、Piwik 、百度统计、51.la

    不同家的监测结果有些差异。比如,无论 PV/UV ,51.la 的数据都是最少的,而 Cloudflare 是最多的。
    同时 Cloudflare 的数据跟其它家数据差异最大,以 2023.12.18 的数据为例,Cloudflare 统计的 UV 是第二名( Piwik )统计 UV 的 4.3 倍,PV 是第二名( GA4 )统计到的 17 倍。肉眼看其它天数据,感觉大同小异。

    之前以为可能是 cache 的原因,用户的浏览器缓存没有更新,导致监测代码没有统计到这部分用户。但后来看了下,Cloudflare 上配置的 Browser Cache TTL 是 4h ,没改过。
    自己手动测试访问一些 URL ,在各家的后台访问明细里都能看到。

    个人猜测,可能是 Cloudflare 统计多了,毕竟其它家的统计结果差异没有那么大。
    求各位给分析下,可能是啥原因呢?
    谢谢大家。

    27 条回复    2023-12-23 10:38:58 +08:00
    xmoer
        1
    xmoer  
       2023-12-20 01:04:47 +08:00   ❤️ 2
    第三方统计的 js 代码普遍会被各种 AdBlock 插件拦截,故偏少是正常的,我觉得反而 CF 这个更准。
    dbzz
        2
    dbzz  
    OP
       2023-12-20 01:21:58 +08:00
    @xmoer 没理解。各种 AdBlock 插件不是要拦截广告的么,为啥要拦截 JS 统计代码呢?
    Saniter
        3
    Saniter  
       2023-12-20 01:56:56 +08:00   ❤️ 1
    adblock 拦截统计 js 不是常规操作吗
    jinliming2
        4
    jinliming2  
       2023-12-20 02:07:31 +08:00 via iPhone   ❤️ 1
    @dbzz 因为第三方的访问统计被认为是一种隐私泄漏(这一点每个人观点不同)。
    第三方的统计拿到数据之后,可以精准的分析用户在各个网站上的行为,用于精准地推送广告之类的。
    所以广告屏蔽第三方统计都是常规操作了,不过大部分都有设置可以选择不屏蔽。
    yyfearth
        5
    yyfearth  
       2023-12-20 02:50:49 +08:00   ❤️ 1
    @dbzz 这类扩展都默认屏蔽了这些 js 代码的加载
    一般的用户谁会手动去改这些
    airyland
        6
    airyland  
       2023-12-20 03:06:33 +08:00   ❤️ 1
    cf 有两个统计:
    1. Account Analytics 基本会是其他工具几倍以上的数据,因为它不是页面统计,而是在服务器端统计了所有请求。
    2. Web Analytics 这个仅统计页面请求,会相比其他多一点,但不会太离谱。
    estk
        7
    estk  
       2023-12-20 07:20:11 +08:00 via iPhone   ❤️ 1
    Cloudflare 的统计在 js 加载出来之前就可以做到
    其它统计需要等 js 加载完成,然后上报
    tailf
        8
    tailf  
       2023-12-20 09:18:39 +08:00   ❤️ 1
    服务器日志里面,大部分的请求其实都是搜索引擎爬虫发出的
    Shiroka
        9
    Shiroka  
       2023-12-20 09:24:58 +08:00 via iPhone   ❤️ 1
    Cloudflare 统计的是它收到的所有请求,你在某台服务器上 curl 好几次,它就会统计成好几个 PV ,所以有些搜索引擎的爬虫或者播测平台的测试请求都会被算入。

    其他依赖 js 的统计,比如 GA 和 cnzz 是需要访客加载出来那个 js ,然后再回传数据的,这个爬虫和攻击一般做不到,通常还是真实访客居多。

    所以 Cloudflare 比 GA 多的那一部分大概率是非人类用户产生的,不知道楼主能不能理解。
    bingo084
        10
    bingo084  
       2023-12-20 10:21:10 +08:00   ❤️ 1
    别的不说,你这个租房工具网站挺方便的
    deBaikal
        11
    deBaikal  
       2023-12-20 10:34:18 +08:00   ❤️ 1
    工具挺方便的 赞一个
    lizhenda
        12
    lizhenda  
       2023-12-20 11:07:16 +08:00
    cf 速度这么快的吗,不管代不代理,都是秒开啊
    7inFen
        13
    7inFen  
       2023-12-20 11:18:32 +08:00   ❤️ 1
    ![6a154a31cf63ff71af394901fe646097.jpeg]( https://i.miji.bid/2023/12/20/6a154a31cf63ff71af394901fe646097.jpeg)

    基本都被屏蔽了
    admpubcom
        14
    admpubcom  
       2023-12-20 11:39:02 +08:00 via iPhone   ❤️ 1
    页面上加的统计主要统计浏览器环境下的网页行为,无法统计类似于 curl 直接请求网页本身的行为
    ShuA1
        15
    ShuA1  
       2023-12-20 12:20:09 +08:00   ❤️ 1
    cf 的统计是基于四层流量的, 更准确
    samhjn
        16
    samhjn  
       2023-12-20 14:01:29 +08:00 via iPhone   ❤️ 1
    有一些爬虫不会解析 JS ,这个也可能是一部分差量
    sudoy
        17
    sudoy  
       2023-12-20 14:49:59 +08:00
    有没有可能,楼主其实是来宣传网站的 手动狗头
    dbzz
        18
    dbzz  
    OP
       2023-12-20 17:41:01 +08:00
    @Shiroka 听起来 make sense 。另外,播测平台是指?
    dbzz
        19
    dbzz  
    OP
       2023-12-20 17:44:48 +08:00
    @lizhenda 是不是你的网络环境比较好?
    CF 套在境内网站应该是负优化,我的 VPS 是 AWS Lightsail 东京机房。
    dbzz
        20
    dbzz  
    OP
       2023-12-20 17:46:26 +08:00
    @sudoy 出发点真的是来问问题的,困惑了好几天……客观上应该会有些宣传效果。
    dbzz
        21
    dbzz  
    OP
       2023-12-20 17:48:11 +08:00
    @ShuA1 专业啊,高屋建瓴。
    drymonfidelia
        22
    drymonfidelia  
       2023-12-20 21:30:49 +08:00
    @ShuA1 我们说的访问量都是指真实用户的 脚本的不算
    ShallowAi
        23
    ShallowAi  
       2023-12-20 21:33:49 +08:00 via Android   ❤️ 1
    大多数广告屏蔽都默认屏蔽这些监听 js ,另外爬虫也不加载 js 。cloudflare 的结果数据会更多一些,你这个网站是面向国内用户的,那么 cf 的分析中其他区域的访问你都可以默认是爬虫。另外还是少加一点统计,一般百度统计+GA 就覆盖全了。
    dbzz
        24
    dbzz  
    OP
       2023-12-20 21:43:32 +08:00
    @airyland 谢谢。
    我之前没留意到 CF 还有 Account Analytics ,我前面说的是 Web Analytics 。
    dbzz
        25
    dbzz  
    OP
       2023-12-20 23:45:34 +08:00
    @7inFen 谢谢。
    老哥,求问下你这里装的是什么 block 插件啊,我的 Chrome 也装了两个,但并没有拦截。
    7inFen
        26
    7inFen  
       2023-12-21 10:18:17 +08:00   ❤️ 1
    @dbzz AdGuard ,我把广告和隐私过滤都打开了,还有这个 https://github.com/Loyalsoldier/clash-rules ,也会拦截
    sudoy
        27
    sudoy  
       364 天前
    @dbzz 哈哈开玩笑哈,网站确实不错,挺实用
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2418 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 15:46 · PVG 23:46 · LAX 07:46 · JFK 10:46
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.