2016-04-10 5 views
1

私はテキストを抽出するためにpythonでpdfqueryライブラリを使用しています。これを行うには、私はpdfをロードし、今までは常に動作します。python - pdfquery loadに関する問題

import pdfquery 
pdfQuery = pdfquery.PDFQuery('10241.pdf') 
pdfQuery.load() 

プログラムがスタックに思えるし、終了しない:私は、コードを実行すると

:私はpdfで作業しようとしたとき は、しかし、私は次のような問題に直面しました。

誰でもこの問題に直面しているのですか、それを克服する方法はありますか?

ありがとうございました。

答えて

1

あなたのPDFにはいくつのページがありますか?

負荷にページ数を指定すると便利かもしれない:

pdfQuery.load(0) 

上記のコードは、単に最初のページをロードし、時間の節約になります。

関連する問題