0
私はpython 2.7とpyPDFを使用して、PDFファイルからタイトルメタ情報を取得しています。残念ながら、すべてのPDFにメタ情報があるわけではありません。私が今したいことは、PDFからテキストの最初の2行を取得することです。私が今使っているものを使って、pyPDFで最初の2行をキャプチャするコードをどのように変更できますか?PythonとpyPDFで最初の2行のPDFを抽出します。
from pyPdf import PdfFileWriter, PdfFileReader
import os
for fileName in os.listdir('.'):
try:
if fileName.lower()[-3:] != "pdf": continue
input1 = PdfFileReader(file(fileName, "rb"))
# print the title of document1.pdf
print fileName, input1.getDocumentInfo().title
except:
print ",",
あなたは私の現在のコードに基づいて完全な例を表示することができます...あなたが上記で与えたコードを追加すると何も出力されません。 – acctman
がコードを編集しました。 –
私は何かまだ出力が欠けています。フォルダに5つのpdfファイルがあります。スクリプトを実行しても何もしません。 – acctman