推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
wencan
V2EX  ›  Python

有没有开源程序,输出一个纯文本文件,文本的位置可指定

  •  
  •   wencan · May 21, 2024 · 2772 views
    This topic created in 715 days ago, the information mentioned may be changed or developed.
    其实就是把文字 pdf 转为纯文本
    期望文本的位置不变
    7 replies    2024-05-21 14:33:58 +08:00
    lilu0826
        1
    lilu0826  
       May 21, 2024 via Android
    PDF 转 word?
    littlewing
        2
    littlewing  
       May 21, 2024
    文本的位置不变 是什么意思
    aeof
        3
    aeof  
       May 21, 2024
    都说是纯文本了,保存布局是不可能的吧。。除非这个 PDF 是纯上下线性布局,不然理论上是不是不可能实现?
    d5G7o0xXW0yWM2gP
        4
    d5G7o0xXW0yWM2gP  
       May 21, 2024
    应该是想靠换行和空格尽量保留排版?
    hefish
        5
    hefish  
       May 21, 2024
    别说 pdf2txt ,pdf2jpg 都给你安排的服服帖帖。。。
    d5G7o0xXW0yWM2gP
        6
    d5G7o0xXW0yWM2gP  
       May 21, 2024   ❤️ 1
    pdftotext -layout

    https://manpages.debian.org/experimental/poppler-utils/pdftotext.1.en.html#:~:text=Pdftotext%20converts%20Portable%20Document%20Format,pdf%20to%20file.

    ```
    Maintain (as best as possible) the original physical layout of the text. The default is to ´undo' physical layout (columns, hyphenation, etc.) and output the text in reading order.
    ```
    wencan
        7
    wencan  
    OP
       May 21, 2024
    @disorientatefree 要的就是这个效果。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1060 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 62ms · UTC 18:17 · PVG 02:17 · LAX 11:17 · JFK 14:17
    ♥ Do have faith in what you're doing.