这是一个创建于 1927 天前的主题,其中的信息可能已经有所发展或是发生改变。
GOOGLE 查了一下,大概都是推荐 PYPDF2+SCAPY 的方法,有前辈试过吗?我看 PYPDF2 那个项目原作者早就不维护了。或者还有什么别的方法可以爬 PDF 吗?求指教不胜感激!
2 条回复 • 2019-12-19 08:10:59 +08:00
 |
|
1
binux 2019-12-19 07:12:16 +08:00
PDF 最近十年有什么变化吗? 你需要担心的不是库而是文字定位和扫描件
|
 |
|
2
zeromake 2019-12-19 08:10:59 +08:00 via Android
|