pypdf

2熱

1答えて

python（.pdf .doc .docx）でさまざまな種類のファイルから情報を抽出しようとしていますが、別のファイルを処理していますが、必要ないときにスペースと改行を取得していますその他多くの問題があります。私はPyPDF2とPDFマネージャを試してみました。ファイルから情報を抽出できるものを私に提案してください。現在、私は.pdfファイルから正確なテキストを抽出することができます何かを探して

0熱

1答えて

Pythonを使ったPdfの実装

私は最初のページと2ページ目のPDFを1ページ目に追加しようとしています。最初のページは2ページ目の上にあり、最初のページに表示されます。問題は、ページがトリミングまたはマージされていないことです。最後のページは2番目から最後まで、それはそれです。 from PyPDF2 import PdfFileReader, PdfFileWriter output = PdfFileWriter(

0熱

1答えて

PythonとpyPDFで最初の2行のPDFを抽出します。

私はpython 2.7とpyPDFを使用して、PDFファイルからタイトルメタ情報を取得しています。残念ながら、すべてのPDFにメタ情報があるわけではありません。私が今したいことは、PDFからテキストの最初の2行を取得することです。私が今使っているものを使って、pyPDFで最初の2行をキャプチャするコードをどのように変更できますか？ from pyPdf import PdfFileWriter,

0熱

2答えて

PyPDF2：ストリームが予期せず終了しました

私はPyPDF2を使用してPDFのページの順序を逆転させるPythonスクリプトを持っています。それはこのエラーを返す場合は、出力ストリームを作成しようとまで意図したとおりに機能し from PyPDF2 import PdfFileWriter, PdfFileReader output = PdfFileWriter() rpage = [] name = input("What's

0熱

1答えて

Python PDFページを特定のパスに分割します

PDFページ用の関数を作成しました。私はPDFファイルを選択し、pdfOneのパスを保存してから、分割したいページを選択することができます。問題は、分割ページが元のPDFと同じパスになることです。私はそれを望んでいない、私は別のフォルダパスに分割ページを送信したい。 def onFindPage(self, event): pdfOne = self.pdfOne.GetValue()

0熱

1答えて

は、リスト（「ユニコード」ではなく）をリストに連結することしかできません

Word.docxファイルにLorem Ipsumをコピーして貼り付け、PDFからテキストを抽出するテスト用のスクリプトを実行しようとしました。 from pyPdf import PdfFileReader if (fileExtension == ".PDF"): pdfDoc = PdfFileReader(file(FOLDER+j, "rb")) fileText

1熱

1答えて

Python 2.7：Windows 7用pypdfocrの使用が難しい

Windows 7でPython 2.7でpypdfocrを使用しようとしています。これは私がcmdでpypdfocrをしようとしたとき、私は取得エラーメッセージです：私がPopplerまたはXPDFをしないのですが、hereが示唆したように、私はPyGoObject経由にPopplerをインストールしなかったようだ C:\Users\chamar.stu>pypdfocr F:\test2.p

0熱

1答えて

pypdf2でPdfFileMerger（）を使用した後のページ数

PdfFileMerger（）をPyPDF2で使用して、pdfファイルをマージしようとしています（コードを参照）。 from PyPDF2 import PdfFileMerger, PdfFileReader [...] merger = PdfFileMerger() if (some condition): merger.append(PdfFileReader(fil

8熱

1答えて

同じ名前のPyPdf2ネストされたブックマークが動作しない

PyPdf2は同じ名前のブックマークをいくつかネストしようとすると考慮しません。私は（あなたがそれをテストするために作業フォルダに、a、b及びcという名前の3つのPDFファイルを持っている時に必要）何を意味するかをテストするための自己完結型のpythonコードの下 from PyPDF2 import PdfFileReader, PdfFileMerger def main(): mer

1熱

1答えて

PythonでPDFのテキストを強調表示

私のPDFデータコーパスのカスタム検索エンジンで作業しています。私はPDFの内容をテキストにダンプすることができる（Apache TikaとGROBIDを使用して）変換レイヤーを持っています。検索結果のリストを返す検索レイヤーとビューが完成しました。ここでは、検索用語が表示された行のオリジナルPDFにハイライト機能を追加したいと考えています。はい、私はそれが必要な場合はPDFファイルを変更した