遇到一个网站 检查元素复制出来的 内容是 音颜值天板主 网页显示是 极品抖音颜值天花板主播小 movo 这种是怎么实现的呢?自定义一字体吗?那源数据是怎么录入的呢?
遇到一个网站 检查元素复制出来的 内容是 音颜值天板主 网页显示是 极品抖音颜值天花板主播小 movo 这种是怎么实现的呢?自定义一字体吗?那源数据是怎么录入的呢?
1
v1 20h 11m ago
打开控制台看看咯,css/front 自定义字体的方案可以在输出数据渲染的时候进行替换
|
2
lisxour 20h 7m ago
字体字符映射,另外如果需要解决反爬可以找我
|
3
fenglirookie OP @lisxour 我知道是字体字符映射 ,我就理解他数据库里面存储的是字符 但是我想知道的是 存数据库的字符是怎么从常规文字转为字符的,总不可能他手输字符吧?
|
4
lisxour 19h 36m ago
@fenglirookie 肯定有映射表的啊,查到数据后通过映射表将正常文字替换,变成乱码返回到前端,字体则是通过映射表反向映射生成,负负得正,看到的就是正常文字,内容就是全乱的,这就是最简单的字体反爬了
|
5
fenglirookie OP @lisxour 按你这个说法等于前端其实也有一套映射 ,完全可以在前端就把这套映射分析出来 得到真实的文字信息?
|
6
ttsh 18h 58m ago
你把网站发出来看看啊
|
7
lisxour 18h 54m ago
@fenglirookie #5 对抗字体反爬,直接 ocr 成本更低,技术难点也更低,字体反爬还有很多变种的
|
8
kdwnil 18h 24m ago via Android
@fenglirookie 前端的映射就在字体里面啊。
比如字体里面,a 的字形是 b ,那后端就会把原始内容的 b 替换成 a 来返回,前端用上字体以后直接显示出来就是 b 直接 ocr 就好了,这种网站一般都会配好几套字体的,甚至还能时不时换一下,你来回处理映射更麻烦 |
9
nc 18h 20m ago
你试试把 UA 改成 Mozilla/5.0 (compatible; Baiduspider/2.0; +http://baidu.com),有奇效,肯定会对搜索引擎做白名单的,不过如果是 IP 白名单就不好整了。
|
10
lumia1020 16h 59m ago
见过在线法考网站就这样的,防止大家复制出来搜答案。
|