pypdf

3熱

2答えて

私はインターネットサイト（maya.tase.co.il）を解析してリンクを探し、pdfファイルをダウンロードしてそれらをマージするスクリプトを書いています。それは主に動作しますが、マージすると、ファイルによってエラーの種類が異なります。私は理由を理解しているようだ。私は関連するコードを切り取り、問題の原因となっている2つの特定のファイルに対してのみテストを作成しました。このスクリプトはpypdf

4熱

1答えて

pythonを閉じたときの問題pypdf - 書き込み。 getError：クローズファイルの入出力操作

この関数は、Webページから生成されたpdfファイルをpypdfを使用してマージすることになっています（インターネットサイトをpdfにスクラップするクラスの一部です）。これはメソッドのコードです： File "c:\tmp\easy_install-iik9vj\pyPdf-1.13-py2.7-win32.egg.tmp\pyPdf\pdf.py", line 264, in write

2熱

1答えて

特定の単語で複数のpdfファイルに分割する方法

私は1つのpdfファイルを持っています。私はそのファイルからいくつかの特定の単語によって、複数のpdfファイルにそのファイルを分割したいと思います。どのように私はPythonでそれを行うことができますか？

3熱

1答えて

Pythonスクリプト（pypdf/16進数エラー）の実行に関する問題

PyPDFモジュールを使用してPythonスクリプトを作成しようとしています。スクリプトは 'Root'フォルダを取ってその中のすべてのPDFをマージし、 'Output'フォルダにマージしたPDFを出力し、 'Root.pdf'（分割されたPDFを含むフォルダ）に名前を変更します。それはサブディレクトリと同じことを行い、最終出力にサブディレクトリと同じ名前を与えます。サブディレクトリを処理しよ

5熱

1答えて

pythonとpyPdf - 行間に空白があるようにページからテキストを抽出する方法

現在、pyPdfでpdfページのページオブジェクトを作成し、extractText（）を実行すると、行が連結されます。たとえば、ページの1行目が「hello」、2行目が「world」と表示された場合、extractText（）から返されるテキストは「hello world」ではなく「helloworld」です。誰もがこれを修正する方法を知っている、または回避策の提案がありますか？私は実際に行の間に

0熱

2答えて

PythonのPDFページのサイズを変更する

私はpdfページを切り抜くためにpythonを使用しています。すべて正常に動作しますが、ページサイズ（幅）を変更するにはどうすればよいですか？これは私の作物コードです：私はこれを行うことができますどのように input = PdfFileReader(file('my.pdf', 'rb')) p = input.getPage(1) (w, h) = p.mediaBox.upperRi