@
seerhut PS : 爬虫不会识别是不是有可爬取的内容
爬虫只是归因所有的 URL 链接
你应该检查下 这些接口的 url 是不是在哪里公开泄露了 在什么地方有公开贴出来
被爬虫存档到链接库里 然后被爬虫识别到了 导致的这个问题
另外注意下 查看下日志 这些 IP 最开始爬的时候 有无读取 robots.txt 文件
如果有的话 加个 robots.txt 禁止所有爬虫爬取
大部分爬虫还是会遵守规则的
监控集群的话 是没这种规模的
监控一般最大一个区域部署 /24 对外的公网 IP 用于请求
你那动不动就几百个 IP 明显不是监控