fenglirookie
V2EX  ›  问与答

网站网页文字加解密

  •  
  •   fenglirookie · 20h 23m ago · 986 views

    遇到一个网站 检查元素复制出来的 内容是 𔼗𔺒𕂒音颜值天𔾡板主𔼉𔻇𔸏𔸑𔸘𔸑 网页显示是 极品抖音颜值天花板主播小 movo 这种是怎么实现的呢?自定义一字体吗?那源数据是怎么录入的呢?

    10 replies    2026-05-21 12:34:29 +08:00
    v1
        1
    v1  
       20h 11m ago
    打开控制台看看咯,css/front 自定义字体的方案可以在输出数据渲染的时候进行替换
    lisxour
        2
    lisxour  
       20h 7m ago
    字体字符映射,另外如果需要解决反爬可以找我
    fenglirookie
        3
    fenglirookie  
    OP
       19h 43m ago
    @lisxour 我知道是字体字符映射 ,我就理解他数据库里面存储的是字符 但是我想知道的是 存数据库的字符是怎么从常规文字转为字符的,总不可能他手输字符吧?
    lisxour
        4
    lisxour  
       19h 36m ago
    @fenglirookie 肯定有映射表的啊,查到数据后通过映射表将正常文字替换,变成乱码返回到前端,字体则是通过映射表反向映射生成,负负得正,看到的就是正常文字,内容就是全乱的,这就是最简单的字体反爬了
    fenglirookie
        5
    fenglirookie  
    OP
       19h 6m ago
    @lisxour 按你这个说法等于前端其实也有一套映射 ,完全可以在前端就把这套映射分析出来 得到真实的文字信息?
    ttsh
        6
    ttsh  
       18h 58m ago
    你把网站发出来看看啊
    lisxour
        7
    lisxour  
       18h 54m ago
    @fenglirookie #5 对抗字体反爬,直接 ocr 成本更低,技术难点也更低,字体反爬还有很多变种的
    kdwnil
        8
    kdwnil  
       18h 24m ago via Android
    @fenglirookie 前端的映射就在字体里面啊。

    比如字体里面,a 的字形是 b ,那后端就会把原始内容的 b 替换成 a 来返回,前端用上字体以后直接显示出来就是 b

    直接 ocr 就好了,这种网站一般都会配好几套字体的,甚至还能时不时换一下,你来回处理映射更麻烦
    nc
        9
    nc  
       18h 20m ago
    你试试把 UA 改成 Mozilla/5.0 (compatible; Baiduspider/2.0; +http://baidu.com),有奇效,肯定会对搜索引擎做白名单的,不过如果是 IP 白名单就不好整了。
    lumia1020
        10
    lumia1020  
       16h 59m ago
    见过在线法考网站就这样的,防止大家复制出来搜答案。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   913 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 21:33 · PVG 05:33 · LAX 14:33 · JFK 17:33
    ♥ Do have faith in what you're doing.