pdfrw

    0

    1答えて

    +----+-----------------------------+ | id | name | +====+=============================+ | 47 | Some textjogjwojgopwgpowmok | +----+-----------------------------+ | 47 | Some textjogjwojgopwg

    1

    1答えて

    pdfrwで未使用(白)のPDFページの周囲を空白にするにはどうしたらいいですか?たぶん私はすべてのオブジェクトを通過し、ページの境界に最も近い座標を見つけることができる場合...

    0

    1答えて

    最後の段落の最後の段落の後にテキストを挿入する必要があります。最後の段落の座標を見つけることができるかどうかはわかりません。 私が知っているように、reportlabはpdfを扱うのに最も堅牢なライブラリですが、別のライブラリを介して可能であれば問題ありません。 また、複製することも可能です(最後の段落の名前やサイズなどのフォント属性を見つけることができますか)。 私が持っているもの from r

    1

    1答えて

    私はpdfから画像抽出を自動化するために約1週間試してきました。残念ながら、私がここで見つけた答えは役に立たなかった。 pypdf2を使用して同じコードで複数のバリエーションを見たことがありますが、いずれも['/XObject']であり、結果はKeyErrorとなります。 pypdf2の辞書では見つからないストリームに隠れているようです(再帰的に構造全体を調べても、私が見つけることができるすべての

    0

    1答えて

    ReportLabと一緒にPdfReaderを使用して、PDFページを取得して保存する(両方とも成功した)後、複数ページのPDFを取り込み、同様に処理しようとしています。 PDFを一度に1つずつ取り込む方法を知っていますが、複数のページを取り込もうとしています。 from reportlab.pdfgen import canvas from pdfrw import PdfReader fr

    1

    1答えて

    以下のコードを使用して、pdfページを既存のキャンバスオブジェクトにインポートしてPDFに保存しようとしています。これは通常正常に動作しますが、スキャンしたドキュメントからPDFを作成してみると、空白のページが表示されることに気付きました。何かお手数ですか? from reportlab.pdfgen import canvas from pdfrw import PdfReader from

    3

    2答えて

    問題のスタックオーバーフローを検索しました。最寄りのリンクは次のとおりです。 How to set custom page size with Ghostscript How to convert multiple, different-sized PostScript files to a single PDF? しかし、これは私の問題を解決することができませんでした。 質問は簡単です。 どのよ

    0

    2答えて

    pdfrwは文書からテキストを抽出できますか? 私は from pdfrw import PdfReader doc = PdfReader(pdf_path) page_texts = [] for page_nr in doc.numPages: page_texts.append(doc.getPage(page_nr).parse_page()) # ..or someth