pypdf

    3

    2答えて

    私はインターネットサイト(maya.tase.co.il)を解析してリンクを探し、pdfファイルをダウンロードしてそれらをマージするスクリプトを書いています。それは主に動作しますが、マージすると、ファイルによってエラーの種類が異なります。私は理由を理解しているようだ。私は関連するコードを切り取り、問題の原因となっている2つの特定のファイルに対してのみテストを作成しました。このスクリプトはpypdf

    4

    1答えて

    この関数は、Webページから生成されたpdfファイルをpypdfを使用してマージすることになっています(インターネットサイトをpdfにスクラップするクラスの一部です)。 これはメソッドのコードです: File "c:\tmp\easy_install-iik9vj\pyPdf-1.13-py2.7-win32.egg.tmp\pyPdf\pdf.py", line 264, in write

    2

    1答えて

    私は1つのpdfファイルを持っています。私はそのファイルからいくつかの特定の単語によって、複数のpdfファイル にそのファイルを分割したいと思います。どのように私はPythonでそれを行うことができますか?

    3

    1答えて

    PyPDFモジュールを使用してPythonスクリプトを作成しようとしています。スクリプトは 'Root'フォルダを取ってその中のすべてのPDFをマージし、 'Output'フォルダにマージしたPDFを出力し、 'Root.pdf'(分割されたPDFを含むフォルダ)に名前を変更します。それはサブディレクトリと同じことを行い、最終出力にサブディレクトリと同じ名前を与えます。 サブディレクトリを処理しよ

    5

    1答えて

    現在、pyPdfでpdfページのページオブジェクトを作成し、extractText()を実行すると、行が連結されます。たとえば、ページの1行目が「hello」、2行目が「world」と表示された場合、extractText()から返されるテキストは「hello world」ではなく「helloworld」です。誰もがこれを修正する方法を知っている、または回避策の提案がありますか?私は実際に行の間に

    0

    2答えて

    私はpdfページを切り抜くためにpythonを使用しています。 すべて正常に動作しますが、ページサイズ(幅)を変更するにはどうすればよいですか? これは私の作物コードです:私はこれを行うことができますどのように input = PdfFileReader(file('my.pdf', 'rb')) p = input.getPage(1) (w, h) = p.mediaBox.upperRi