2017-07-05 9 views
1

textractを使用して、.docファイルを純粋なテキストに変換しようとしています。Pythonを使用して.docを純粋なテキストに変換する

import textract 
text = textract.process('path/to/file.extension') 

しかし、私はこのエラー

AttributeError: 'module' object has no attribute 'process' 
+1

を? – Tanu

+0

@Tanu私は1.6.1を使用しています –

+0

他の依存関係はすべて正常にインストールしましたか? - 'apt-get install python-dev libxml2-dev libxslt1-devアンチワードunrtf poppler-utils pstotext tesseract-ocr flac ffmpeg lame libmad0 libsox-fmt-mp3 sox libjpeg-dev swig libpulse-dev'(Ubuntu用)私のシステムでうまく動作します。 – Tanu

答えて

1

は、実行しようとしているPythonのファイルはtextract.py名前が付いていないことを確認してください取得しています。

それが名前だ場合は、エラーを取得します:あなたが使用しているtextractのバージョン

AttributeError: 'module' object has no attribute 'process' 
関連する問題