pdfminerツールを使用して、pdfを.csv(テキスト)に変換し、ツールのサブコマンドの1つであるCStringIOおよびStringIOを引き続き使用します。文字列から文字列への変換 - import re
try:
from CStringIO import StringIO
except ImportError:
from StringIO import Str
私はpdfファイルからテキストを抽出し、後でその参照を識別しようとしています。私はそのうまく動作して暗号化されていないファイルではpdfminer 20140328.を使用していますが、私は今、私が手ファイルだ: File "C:\Tools\Python27\lib\site-packages\pdfminer\pdfdocument.py", line 348, in _initialize_
これは私がここで見つけたコードです。どのように使用するかわかりません。誰かがこれを通って私を歩いて、私はサンプルPDFを変換するのに役立つことができますか? from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import TextConverter
from