V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
libasten
V2EX  ›  问与答

求助,个人博客被像素级克隆了,怎么办?

  •  
  •   libasten · 2020-02-18 16:55:57 +08:00 · 3687 次点击
    这是一个创建于 1733 天前的主题,其中的信息可能已经有所发展或是发生改变。

    这么多年还是第一次看到。 我刚才打开百度统计的后台看,有异常,来源那边很多都是一个网站过来的,我起初还是以为是哪个网友用我之前做的那个主题的原因呢,因为我的那个主题有加友链到我站点。 打开一看,震惊了,以为我眼花了,一模一样一个站点...... 话说我的博客也没有什么亮点,百度指数啥的也不高,不知道怎么被看上了。 估计是哪位站长用软件自动克隆的吧,我想在服务器上禁止了那个域名的 ip,可是查了一下,他这个域名还用了 cloudflare 的 cdn,这也就说,我这暂时还不能知道他的 ip ? 针对这种情况,怎么办呢?

    第 1 条附言  ·  2020-02-18 22:31:32 +08:00
    虚惊一场,刚才看了一下,网站没有被整体克隆走,只是这个哥么域名解析到我的 ip 上了。
    话说现在用的腾讯云的主机,能换 ip 吗?
    在网上搜一个方法,nginx 里面配置里面禁止 ip 访问后,没问题了,不过我看那个恶意域名又跳转到另外一个网友的博客上去, 这个就真奇怪了。
    我在腾讯云主机的 ip 应该是独立的吧?这个机器上只挂了我一个人的博客,现在我刚在我这边禁止了域名访问网站后,那个域名马上又指向另外一个博客了,这个应该 cf 的问题吧,域名无法访问了,随意返回一个网站给用户看?
    我看上面有 Cloudflare 一段话:

    This page ( http://ncbqh.top/) is currently offline. However, because the site uses Cloudflare's Always Online™ technology you can continue to surf a snapshot of the site. We will keep checking in the background and, as soon as the site comes back, you will automatically be served the live version. Always Online™ is powered by Cloudflare | Hide this Alert
    25 条回复    2020-02-20 19:31:58 +08:00
    Whsiqi
        1
    Whsiqi  
       2020-02-18 16:57:59 +08:00 via Android
    引用一个回复:维权成本极大
    另一个回复:针对性放一些不合法内容,然后举报之
    opengps
        2
    opengps  
       2020-02-18 17:05:18 +08:00 via Android
    他可能是动态爬虫,你可以从你服务器上调出来他服务端 ip,然后封锁 ip
    ThirdFlame
        3
    ThirdFlame  
       2020-02-18 17:10:02 +08:00
    是不是应该弄个人眼不可见的连接。 让机器人去点, 不就知道 iP 了
    cxh116
        4
    cxh116  
       2020-02-18 17:38:21 +08:00 via Android
    也许只是反代挂域名而已。
    Ericcccccccc
        5
    Ericcccccccc  
       2020-02-18 17:40:20 +08:00
    1 楼做法是可行的, 放不合法的内容然后上工信部举报它
    leavic
        6
    leavic  
       2020-02-18 17:45:41 +08:00
    基本上就是反代了估计,解决方法,参考 github 当年被 D 的做法,插一段 js 弹窗,检测域名后跳转回你的域名。
    tyzrj766
        7
    tyzrj766  
       2020-02-18 17:46:55 +08:00
    我的小博客被菠菜站镜像过,有源 IP 不知道哪家的,毕竟一个机房的 IP 不知道谁家再用,CDN 和 nginx 屏蔽完全没效果,无解了= =
    Track13
        8
    Track13  
       2020-02-18 18:06:24 +08:00 via Android
    我也发现我友链里有 2 个人的博客被克隆了。。自己的就没办法找
    alect
        9
    alect  
       2020-02-18 18:13:57 +08:00
    如果是用的反代,那访问假网站的时候会向原始网站请求数据,
    你在自己网站上放一个大文件。然后去访问假网站的这个链接,
    本机检测这时哪个 IP 的流量瞬间变大,把对方整个儿 IP 段封了。
    实时流量查看工具我比较常用的是 iftop,你一直开着监测就行。
    vzev
        10
    vzev  
       2020-02-18 19:31:55 +08:00
    你的博客基本都是原创内容,稍微优化一下就能有关键词排名,流量上去了就有收益。
    之前我的站就被复制并超越......
    mikulch
        11
    mikulch  
       2020-02-18 20:00:01 +08:00 via iPhone
    @vzev 被超越,听起来好悲剧
    dototototo
        12
    dototototo  
       2020-02-18 20:31:28 +08:00 via Android
    来个 reffer 判断?直接来自该网站的请求全部 ban 了。
    keepeye
        13
    keepeye  
       2020-02-18 20:36:15 +08:00
    是不是别人的域名解析到你的服务器上了,而你服务器没有禁止非绑定域名访问?
    gam2046
        14
    gam2046  
       2020-02-18 20:52:22 +08:00
    你也上 cloudflare,并且 cf 支持双向 SSL 认证,开启并配置此功能,就可以确保只有 CF 的 CDN 才可以访问你的原站。
    libasten
        15
    libasten  
    OP
       2020-02-18 20:58:51 +08:00
    @leavic 在页面加载时候判断当前域名,如果是哪个山寨的,就执行 location 到我自己的?这个前提是他也把我的这段 js 也复制过吧?
    libasten
        16
    libasten  
    OP
       2020-02-18 20:59:21 +08:00
    @tyzrj766
    @Track13
    等于说无解了?
    different
        17
    different  
       2020-02-18 21:07:09 +08:00
    @gam2046 那我郁闷了,难道我正常访问和反向代理或者其他方式爬你网站的话,不也是通过也是经过 cf 的 cdn 嘛?
    different
        18
    different  
       2020-02-18 21:11:24 +08:00
    如果是被反代了,就动态弄一个些 js (防止被有针对的过滤掉),判断是否为当前域名,然后跳回你网站即可。如果是被爬虫爬了,弄一些反爬虫机制,感觉方法也是有的。
    different
        19
    different  
       2020-02-18 21:13:43 +08:00
    @different “当前域名”,改为“你的域名”
    gam2046
        20
    gam2046  
       2020-02-18 21:24:55 +08:00
    @different #17 是这样的。双向认证确保流量一定要经过 CF,而不能直接访问源站,因为源站双向 SSL 认证不通过,不会返回内容。

    如果你的网站本身访问量不大,可以尝试在 CF 中开启 under attack 或者限制客户端请求频率,应该 CF 可以帮你把一些疑似请求给过滤掉。限制请求频率后,如果对方是简单的反向代理,那么其访问你的服务器 IP 是单一的。但正常用户,IP 是完全不同的。

    另外可以在你的网站上,返回内容时,通过 js 动态获取,而不是服务端渲染,获取内容时,接入 recaptcha,v3 版本的可以对用户无打扰,这个可以帮助你抵御爬虫。recaptcha 通过 .net 域名可以直接在国内使用。

    最后通过 JavaScript 判断一下域名,可以一定程度上阻止对方的无脑反向代理。
    different
        21
    different  
       2020-02-18 21:29:57 +08:00
    @gam2046 感谢!
    libasten
        22
    libasten  
    OP
       2020-02-18 22:07:29 +08:00
    @gam2046 js 返回网站数据,对 seo 不友好吧?
    gam2046
        23
    gam2046  
       2020-02-18 22:31:30 +08:00
    @libasten #22 如果担心 SEO,可以尝试对 Google Spider 做单独处理,由服务端渲染,同时为了防止别人伪造成 Google Spider,别忘了检查 Spider 的真实性。

    https://support.google.com/webmasters/answer/80553?hl=en

    其他搜索引擎的话,可以查阅相关方面提供的文档,如何检查请求确实来自于搜索引擎,而非第三方伪造。
    Tomotoes
        24
    Tomotoes  
       2020-02-20 00:15:09 +08:00 via Android
    在主界面内嵌一段 js,判断当前地址,然后 跳转到你的域名。
    GreyYang
        25
    GreyYang  
       2020-02-20 19:31:58 +08:00
    弱弱的问下,克隆了别人的博客对他有啥好处?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   951 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 22:27 · PVG 06:27 · LAX 14:27 · JFK 17:27
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.