1
textractを使用して、.docファイルを純粋なテキストに変換しようとしています。Pythonを使用して.docを純粋なテキストに変換する
import textract
text = textract.process('path/to/file.extension')
しかし、私はこのエラー
AttributeError: 'module' object has no attribute 'process'
を? – Tanu
@Tanu私は1.6.1を使用しています –
他の依存関係はすべて正常にインストールしましたか? - 'apt-get install python-dev libxml2-dev libxslt1-devアンチワードunrtf poppler-utils pstotext tesseract-ocr flac ffmpeg lame libmad0 libsox-fmt-mp3 sox libjpeg-dev swig libpulse-dev'(Ubuntu用)私のシステムでうまく動作します。 – Tanu