import docx2txt
my_text=docx2txt.process("file1.docx")
print(my_text)
私はそれが次のエラーを示し、このコードからのdocxファイルを読みたい:コメント欄で述べた@cowbertよう読み取りのdocxファイルエラー
File "/usr/lib/python3.5/zipfile.py", line 1093, in _RealGetContents
raise BadZipFile("File is not a zip file")
zipfile.BadZipFile: File is not a zip file
docxファイルは実際にはXMLであり、zipファイル内のいくつかのメタデータです。解析するには、最初に解凍する必要があります。 zipは、ファイルを解凍することができないと主張しています(実際のdocxファイルではないか、魔法番号がzip圧縮ファイルを示さないという点で破損しています)。 'file1.docx'は実際にunzip/winzip/7zipとOfficeで開きますか(オフィス97互換モードではないと言います)? – cowbert
@cowbert今、私はそれが機能していない理由が壊れていたことを確認します。 –
Jayさん、あなたはdocxのimportを使ってword文書を読むpython-docxモジュールを試すことができます。 – Anup