python - pdfquery loadに関する問題

私はテキストを抽出するためにpythonでpdfqueryライブラリを使用しています。これを行うには、私はpdfをロードし、今までは常に動作します。python - pdfquery loadに関する問題

import pdfquery 
pdfQuery = pdfquery.PDFQuery('10241.pdf') 
pdfQuery.load()

プログラムがスタックに思えるし、終了しない：私は、コードを実行すると

：私はpdfで作業しようとしたときは、しかし、私は次のような問題に直面しました。

誰でもこの問題に直面しているのですか、それを克服する方法はありますか？

ありがとうございました。

2016-04-10 rfire

あなたのPDFにはいくつのページがありますか？

負荷にページ数を指定すると便利かもしれない：

pdfQuery.load(0)

上記のコードは、単に最初のページをロードし、時間の節約になります。

2017-02-07 10:40:29 Mat0kan

答えて