最近接了一个单子,下载某度文库的文档,基本功能实现了,但是下载出来的只有文字,排版不太好,图片定位哪些不知道怎么搞,但是看到有一个网站提供的下载功能,下载下来的几乎是原格式,这个有谁研究过吗,提供一点思路。
参考地址: https://sora.it9g.com/
1
drymonfidelia 300 天前
用买的账号 cookies 直接调下载接口 我初中的时候就做过这种外包了,收了 2.2w
|
2
drymonfidelia 300 天前
从预览里还原不可行,那个预览不是无损的
|
3
shermie OP @drymonfidelia 要自己去维护账号吗 还要消费 想白嫖
|
4
drymonfidelia 300 天前
@shermie 要自己维护
|
5
shermie OP @drymonfidelia 好吧 我以为挺简单 结果有点搞不定了 哈哈
|
6
TimG 300 天前 via Android
网页里可以正确排版吗?如果可以的话调 cef 截屏后打印成 pdf 客户可以接受吗?虽然绕了一大圈,但应该能保证与网页渲染达到相同的水平。
|
7
sir283 300 天前
现在大部分都是用一楼说的那种方案解决,只有极少部分会去钻漏洞了,而且,你逆向百度的 JS ,还不如去黑厂打两个月螺丝呢,人家百度定期就会更新一遍混淆,你这还没玩明白,人家就又换了一个规则,到时候你又要重新开始,纯数吃力不讨好。
|