pythonでpdfminerを使用してpdfの総ページ数を取得する方法

-4

PyPDF2でpdfreader.getNumPages()は私にpdfファイルの総ページ数を教えてくれます。pythonでpdfminerを使用してpdfの総ページ数を取得する方法

どうすればpdfminerを利用できますか？

2017-08-23 Malik Anas Ahmad

コードスニペットを残してください。ここでのコンテキストはlink to the current pdfminer.six repoです。resolve1メソッドについてもう少し学ぶことができます。

あなたがpdfminerを使用しているときに、PDFObjRefのオブジェクトを印刷して表示することがあります。基本的にはresolve1を使ってそれらのオブジェクトを展開することができます（通常は辞書です）。

from pdfminer.pdfparser import PDFParser 
from pdfminer.pdfdocument import PDFDocument 
from pdfminer.pdfpage import PDFPage 
from pdfminer.pdfinterp import resolve1 

file = open('some_file.pdf', 'rb') 
parser = PDFParser(file) 
document = PDFDocument(parser) 

# This will give you the count of pages 
print(resolve1(document.catalog['Pages'])['Count'])

出典

2017-12-07 03:03:29 Pete

おかげで多くの仲間その良い方法での作業 –

pdfminer、importを使用してください。

from pdfminer.pdfparser import PDFParser 
from pdfminer.pdfdocument import PDFDocument 
from pdfminer.pdfpage import PDFPage

ファイルオブジェクトに関連付けられたPDFパーサーオブジェクトを作成します。

fp = open('your_file.pdf', 'rb') 
parser = PDFParser(fp)

ドキュメント構造を格納するPDFドキュメントオブジェクトを作成します。ページがあるたびにインクリメントcreate_pages()機能により

document = PDFDocument(parser)

反復。

num_pages = 0 
for page in PDFPage.create_pages(document): 
    num_pages += 1 
print(num_pages)

出典

2017-08-23 14:12:07 Mangohero1

私はそれをよく知っています。それはポイントではない。ループの直前のページ数を教えてもらうために、問題が発生していることがわかったら質問が表示されます。 –

はい、私はこの問題を見てきました。 'pdfminer'の組み込み関数はありません。あなたが回避策を行わなければならないことを知っていたら、それを行う直接的な方法はないと理解できないでしょうか？ – Mangohero1

ありがとうございました... –

pythonでpdfminerを使用してpdfの総ページ数を取得する方法

答えて

関連する問題