网站的加密方案

This topic created in 667 days ago, the information mentioned may be changed or developed.

有一个网站地址如下： http://xxfb.mwr.cn/sq_dxsk.html 直接看这个页面上中文都是正常的，但是如果我拷贝一些中文字段再粘贴发现就会乱码，比如页面上显示“珠江” 使用 ctrl + c 复制后，粘贴在本地的记事本上会变成 “䆔䂒”。请问这是用啥技术实现的啊？

加密

乱码

复制

10 replies • 2024-09-04 08:36:20 +08:00

wOuv7i4e7XxsSOR1

Sep 3, 2024

特殊的字体，用来反爬的

mU9vX912XopmAoE1

Sep 3, 2024

这种你试试用 ublock 停止 javascript 说不定这功能就废了

ming2050

Sep 3, 2024

自己弄的字体库，一共 744 个字，自己做下映射吧

scyuns

Sep 3, 2024

好有意思自定义了一个字典表

xR13zp0h67njQr2S

Sep 3, 2024

502,看不到了

Latin

Sep 3, 2024

http://xxfb.mwr.cn/ttf/FE0xJBJItc_1725347140107.ttf

hongye

Sep 3, 2024

@jdkxnktkdkxod 感谢

y77FXoxF970725SJ

Sep 3, 2024

要爬这个的话先请求 **http://xxfb.mwr.cn/sq_dxsk.html** 获取到 loadData() 里的 URL

```
http://xxfb.mwr.cn/一级随机/二级随机
```

**loadData()** 里面请求数据的 URL 是服务器动态生成的，虽然每次都不一样，但是又可以重复使用，不知道是不是忘了做频率限制，或者会偷偷后台统计？

再从 URL 获取 JSON 数据，数据的格式是：

```
"#UEO3kxleHI_1725353725381otltag䌙䅭#FontTag"
```

对应

```
"#{字体文件名}otltag{内容}#FontTag"
```

这个字体文件只有 744 个字形，除去前后两个空白字形，有用的只有 742 个字形，可以根据字形顺序建立对照表；
每次请求数据时服务器会动态偏移字体的 code point ，生成新的字体文件；
根据观察每次生成的字体文件中字形顺序没有改变，而且每个字形的 code point 相差都是 2 ，所以只需要根据字体名称请求字体文件；

```
http://xxfb.mwr.cn/ttf/{字体文件名}.ttf
```

获取到第 1 个有用的字形的 code point ，也就是索引 1 处的 code point ，就可以根据字形顺序推导出其他字形的 code point ；

最后把内容转换成 unicode 码位，把字形的 code point 转换成 16 进制，两边匹配一下就可以得到实际看到的内容了。

y77FXoxF970725SJ

Sep 3, 2024

不过用动态字体文件反爬，应当只用在金额、数量这种比较重要的数字信息上，把汉字放进去太影响性能和用户体验了

hongye

Sep 4, 2024

@500 #8 感谢大佬👍