pypdf

    2

    1答えて

    python(.pdf .doc .docx)でさまざまな種類のファイルから情報を抽出しようとしていますが、別のファイルを処理していますが、必要ないときにスペースと改行を取得していますその他多くの問題があります。私はPyPDF2とPDFマネージャを試してみました。ファイルから情報を抽出できるものを私に提案してください。現在、私は.pdfファイルから正確なテキストを抽出することができます何かを探して

    0

    1答えて

    私は最初のページと2ページ目のPDFを1ページ目に追加しようとしています。最初のページは2ページ目の上にあり、最初のページに表示されます。 問題は、ページがトリミングまたはマージされていないことです。最後のページは2番目から最後まで、それはそれです。 from PyPDF2 import PdfFileReader, PdfFileWriter output = PdfFileWriter(

    0

    1答えて

    私はpython 2.7とpyPDFを使用して、PDFファイルからタイトルメタ情報を取得しています。残念ながら、すべてのPDFにメタ情報があるわけではありません。私が今したいことは、PDFからテキストの最初の2行を取得することです。私が今使っているものを使って、pyPDFで最初の2行をキャプチャするコードをどのように変更できますか? from pyPdf import PdfFileWriter,

    0

    2答えて

    私はPyPDF2を使用してPDFのページの順序を逆転させるPythonスクリプトを持っています。それはこのエラーを返す場合は、出力ストリームを作成しようとまで意図したとおりに機能し from PyPDF2 import PdfFileWriter, PdfFileReader output = PdfFileWriter() rpage = [] name = input("What's

    0

    1答えて

    PDFページ用の関数を作成しました。私はPDFファイルを選択し、pdfOneのパスを保存してから、分割したいページを選択することができます。問題は、分割ページが元のPDFと同じパスになることです。私はそれを望んでいない、私は別のフォルダパスに分割ページを送信したい。 def onFindPage(self, event): pdfOne = self.pdfOne.GetValue()

    0

    1答えて

    Word.docxファイルにLorem Ipsumをコピーして貼り付け、PDFからテキストを抽出するテスト用のスクリプトを実行しようとしました。 from pyPdf import PdfFileReader if (fileExtension == ".PDF"): pdfDoc = PdfFileReader(file(FOLDER+j, "rb")) fileText

    1

    1答えて

    Windows 7でPython 2.7でpypdfocrを使用しようとしています。 これは私がcmdでpypdfocrをしようとしたとき、私は取得エラーメッセージです:私がPopplerまたはXPDFをしないのですが、hereが示唆したように、私はPyGoObject経由にPopplerをインストールしなかったようだ C:\Users\chamar.stu>pypdfocr F:\test2.p

    0

    1答えて

    PdfFileMerger()をPyPDF2で使用して、pdfファイルをマージしようとしています(コードを参照)。 from PyPDF2 import PdfFileMerger, PdfFileReader [...] merger = PdfFileMerger() if (some condition): merger.append(PdfFileReader(fil

    8

    1答えて

    PyPdf2は同じ名前のブックマークをいくつかネストしようとすると考慮しません。私は(あなたがそれをテストするために作業フォルダに、a、b及びcという名前の3つのPDFファイルを持っている時に必要)何を意味するかをテストするための自己完結型のpythonコードの下 from PyPDF2 import PdfFileReader, PdfFileMerger def main(): mer

    1

    1答えて

    私のPDFデータコーパスのカスタム検索エンジンで作業しています。 私はPDFの内容をテキストにダンプすることができる(Apache TikaとGROBIDを使用して)変換レイヤーを持っています。検索結果のリストを返す検索レイヤーとビューが完成しました。 ここでは、検索用語が表示された行のオリジナルPDFにハイライト機能を追加したいと考えています。はい、私はそれが必要な場合はPDFファイルを変更した