先上网站地址(一个租房工具网站): https://dbzz.house/
网站放在 Cloudflare 上,也尽量使用了 Cloudflare 的工具,包括域名、DNS 、Cache 、HTTPS 证书、WAF 等。
Cloudflare 有个 Analytics & Logs 工具,提供了基础的网站监测功能,主要是 PV 、UV 、Bandwith 这些。
自己另外加了些监测工具,主流的应该都加了:GA4(Google Analytics 4)、Piwik 、百度统计、51.la 。
不同家的监测结果有些差异。比如,无论 PV/UV ,51.la 的数据都是最少的,而 Cloudflare 是最多的。
同时 Cloudflare 的数据跟其它家数据差异最大,以 2023.12.18 的数据为例,Cloudflare 统计的 UV 是第二名( Piwik )统计 UV 的 4.3 倍,PV 是第二名( GA4 )统计到的 17 倍。肉眼看其它天数据,感觉大同小异。
之前以为可能是 cache 的原因,用户的浏览器缓存没有更新,导致监测代码没有统计到这部分用户。但后来看了下,Cloudflare 上配置的 Browser Cache TTL 是 4h ,没改过。
自己手动测试访问一些 URL ,在各家的后台访问明细里都能看到。
个人猜测,可能是 Cloudflare 统计多了,毕竟其它家的统计结果差异没有那么大。
求各位给分析下,可能是啥原因呢?
谢谢大家。
1
xmoer 2023-12-20 01:04:47 +08:00 2
第三方统计的 js 代码普遍会被各种 AdBlock 插件拦截,故偏少是正常的,我觉得反而 CF 这个更准。
|
3
Saniter 2023-12-20 01:56:56 +08:00 1
adblock 拦截统计 js 不是常规操作吗
|
4
jinliming2 2023-12-20 02:07:31 +08:00 via iPhone 1
@dbzz 因为第三方的访问统计被认为是一种隐私泄漏(这一点每个人观点不同)。
第三方的统计拿到数据之后,可以精准的分析用户在各个网站上的行为,用于精准地推送广告之类的。 所以广告屏蔽第三方统计都是常规操作了,不过大部分都有设置可以选择不屏蔽。 |
6
airyland 2023-12-20 03:06:33 +08:00 1
cf 有两个统计:
1. Account Analytics 基本会是其他工具几倍以上的数据,因为它不是页面统计,而是在服务器端统计了所有请求。 2. Web Analytics 这个仅统计页面请求,会相比其他多一点,但不会太离谱。 |
7
estk 2023-12-20 07:20:11 +08:00 via iPhone 1
Cloudflare 的统计在 js 加载出来之前就可以做到
其它统计需要等 js 加载完成,然后上报 |
8
tailf 2023-12-20 09:18:39 +08:00 1
服务器日志里面,大部分的请求其实都是搜索引擎爬虫发出的
|
9
Shiroka 2023-12-20 09:24:58 +08:00 via iPhone 1
Cloudflare 统计的是它收到的所有请求,你在某台服务器上 curl 好几次,它就会统计成好几个 PV ,所以有些搜索引擎的爬虫或者播测平台的测试请求都会被算入。
其他依赖 js 的统计,比如 GA 和 cnzz 是需要访客加载出来那个 js ,然后再回传数据的,这个爬虫和攻击一般做不到,通常还是真实访客居多。 所以 Cloudflare 比 GA 多的那一部分大概率是非人类用户产生的,不知道楼主能不能理解。 |
10
bingo084 2023-12-20 10:21:10 +08:00 1
|
11
deBaikal 2023-12-20 10:34:18 +08:00 1
工具挺方便的 赞一个
|
12
lizhenda 2023-12-20 11:07:16 +08:00
cf 速度这么快的吗,不管代不代理,都是秒开啊
|
13
7inFen 2023-12-20 11:18:32 +08:00 1
![6a154a31cf63ff71af394901fe646097.jpeg]( https://i.miji.bid/2023/12/20/6a154a31cf63ff71af394901fe646097.jpeg)
基本都被屏蔽了 |
14
admpubcom 2023-12-20 11:39:02 +08:00 via iPhone 1
页面上加的统计主要统计浏览器环境下的网页行为,无法统计类似于 curl 直接请求网页本身的行为
|
15
ShuA1 2023-12-20 12:20:09 +08:00 1
cf 的统计是基于四层流量的, 更准确
|
16
samhjn 2023-12-20 14:01:29 +08:00 via iPhone 1
有一些爬虫不会解析 JS ,这个也可能是一部分差量
|
17
sudoy 2023-12-20 14:49:59 +08:00
有没有可能,楼主其实是来宣传网站的 手动狗头
|
19
dbzz OP @lizhenda 是不是你的网络环境比较好?
CF 套在境内网站应该是负优化,我的 VPS 是 AWS Lightsail 东京机房。 |
22
drymonfidelia 2023-12-20 21:30:49 +08:00
@ShuA1 我们说的访问量都是指真实用户的 脚本的不算
|
23
ShallowAi 2023-12-20 21:33:49 +08:00 via Android 1
大多数广告屏蔽都默认屏蔽这些监听 js ,另外爬虫也不加载 js 。cloudflare 的结果数据会更多一些,你这个网站是面向国内用户的,那么 cf 的分析中其他区域的访问你都可以默认是爬虫。另外还是少加一点统计,一般百度统计+GA 就覆盖全了。
|
24
dbzz OP @airyland 谢谢。
我之前没留意到 CF 还有 Account Analytics ,我前面说的是 Web Analytics 。 |
26
7inFen 2023-12-21 10:18:17 +08:00 1
@dbzz AdGuard ,我把广告和隐私过滤都打开了,还有这个 https://github.com/Loyalsoldier/clash-rules ,也会拦截
|