textract私はパワーポイント(.PPTX)からテキスト、Word文書(に.docx)、およびテキストファイル(* .TXT)を解析するPythonライブラリtextract
を使用し始めています。私はそれをテストするための簡単なスクリプトを書いた。PythonははImportError
# Python textract test script
import textract
textract.process("H:\My Documents\Test.docx")
:
File: "C:...\textract\parsers\docx_parser.py", line 1 in import docx2txt ImportError: No module named docx2txt
私はhttps://pypi.python.org/pypi/textractからダウンロードし、バージョン1.5.0を使用しています。私はそれがどんな依存関係も含んでいない理由を知らない。 docx2txt
とそれに続く依存関係をインストールする必要がありますか? textract
パッケージに必要なものがすべて含まれていないのはなぜですか?
docx2txtをダウンロードしようとしましたか? – Quartal