主要目的是提取纯文本方便 chatgpt
https://gist.github.com/taowen/4ce9de62255ded695db106ded4aa18c1
除了 pdf 还有几个纯浏览器的小工具方便用来提取纯文本